智能BI平台 AI

Smartbi AIChat

一站式ABI平台

Smartbi Insight

智慧数据运营平台

Smartbi Eagle

电子表格软件

Smartbi Spreadsheet

联系我们: 400-878-3819

了解AIChat智能BI平台解决方案 >

数据准备

检索增强生成RAGNEW

自然语言分析

系统管理

了解一站式ABI平台解决方案 >

数据管理

数据分析

了解智慧数据运营平台解决方案 >

了解电子表格软件解决方案 >

行业解决方案

覆盖金融、制造、医疗、政府、零售等主流行业

联系我们: 400-878-3819

教育行业 >

高校数据中心与应用方案

一网通办推广方案

高校质量实时监测大数据平台

研究生教学大数据服务平台

其他行业

智慧园区大数据解决方案

交通运输业大数据解决方案

水泥行业大数据解决方案

智慧水务大数据解决方案

能源行业

电力大数据解决方案

燃气大数据解决方案

医疗行业 >NEW

运营管理决策平台

公立医院绩效考核指标监控平台

等级评审指标监控平台

医院智慧审计平台

资源中心

你身边的数智化智库，汇集了各行各业的数智化解决方案、最佳实践经验、趋势洞察和行业洞见等。

进入资源中心 >

联系我们: 400-878-3819

精选资料 >

《医疗行业解决方案集锦》

《制造业数字化人力资源管理方案》

《2024中国制造业智能BI解决方案与案例》NEW

《医院分析指标体系建设白皮书》

《制造行业智能BI最佳实践合集》

《金融行业智能BI最佳实践合集》

《制造企业数字化经营管理平台建设方案》

《以指标为中心的ABI平台重塑企业数字化经营白皮书》HOT

智能指南

融合最前沿AI技术与BI能力，结合行业Know-How打造全新一代智能BIHOT

如何让AIGC跟企业的战略能够匹配，能够对齐？HOT

企业有了BI，为什么还需要以指标为核心的ABI平台？

指标体系是重塑企业数字化经营能力的关键！

有了AI大模型加持，企业如何更有效地借助BI释放数据价值？

AI + BI数智融合，如何驱动企业数智化转型发展？

管理驾驶舱成摆设？以指标为核心的ABI平台如何激活核心数据？

如何有效运营数据以驱动业务发展与决策？

服务与支持

思迈特软件提供多种自动和人工服务方式，为您的产品使用和项目保驾护航

投诉热线：199-2645-9486

投诉邮箱：complain@smartbi.com.cn

售前热线

400-878-3819转1

邮箱咨询

sales@smartbi.com.cn

IM即时通讯

即时通讯实时沟通

技术工单

5 × 8 小时在线提供服务

售后热线

400-878-3819转2

邮箱支持

support@smartbi.com.cn

新手入门

产品安全

了解思迈特软件

思迈特软件致力于为企业客户提供一站式商业智能平台 (PaaS) 和BI解决方案 (BI+应用市场)，让数据为客户创造价值，助力企业数智化运营。

联系我们: 400-878-3819

企业概况

思迈特介绍

合作客户

荣誉资质

可信生态

企业文化

联系我们

品牌资讯

企业新闻

行业资讯

近期活动

媒体报道

招纳贤士

校园招聘

社会招聘

生态合作 >HOT

合作伙伴招募计划

申请试用

400-878-3819

在线体验

AIChat对话分析

一站式ABI平台

电子表格软件

申请试用

如何利用机器学习提高新冠病毒感染临床诊断的准确率？

商业智能（BI）与大数据分析软件

效益，因管理而变，管理因我们（Smartbi）而变

立即体验

商业智能（BI）与大数据分析软件

效益，因管理而变，管理因我们（Smartbi）而变

品牌资讯

企业新闻 >
近期活动 >
媒体报道 >
行业资讯 >

> 关于 > 品牌资讯 > 企业新闻

如何利用机器学习提高新冠病毒感染临床诊断的准确率？

发布时间：2020-02-23 游览量：3019

bi报表平台开发财务统计表数据可视化意义

新型冠状病毒感染肺炎是一种新型的传染病，已经在中国特别是湖北武汉市引起了非常严重的流行传染和致死率。由于是一种新的病毒，目前主要是以新型冠状病毒核酸阳性为诊断标准。但是，发现有患者核酸检测几次都成阴性，CT以及其他症状却显示患者已经感染了新冠病毒。这样的结果，一个是给疾病的防治挖了一个很大的坑，很多患者确诊不了，只能放回家去隔离，可能造成进一步的病毒传播；另外一个是使患者耽误了治疗，病情加重。

据中国国内的医学学术期刊《中华流行病学杂志》一篇来自中国疾病预防控制中心“新型冠状病毒肺炎应急响应机制流行病学组”的论文分析7万多病例，论文得出的“粗病死率”为2.3%，其中湖北省内的“粗病死率”为2.9%，但湖北省外则为0.4%，前者为后者的7.3倍。其中一个非常重要的原因就是没有及时的进行确诊，导致感染者不能及时治疗而导致病情迅速发展恶化直至死亡。重症病例从发病到住院平均9.84天，而这近10天的等待错失了最佳时机。

随着我们对新冠病毒认识的不断深入，除了核酸检测，通过医生临床诊断也能识别出新冠病毒感染者。2月13日，湖北省卫健委官网发布的疫情情况，将临床诊断病例数纳入确诊病例数进行公布。通报显示，湖北省新增新冠肺炎病例14840例，其中含临床诊断病例13332例，也就是通过核酸检测阳性确诊的病例数只有1508例。临床诊断新冠病毒感染占比达到了89%，可以看出临床诊断在新冠病毒诊断中的重要作用。不过，当前临床诊断新冠病毒感染还是需要依靠资深的有经验的医生，对于一般的医生来说，还不能通过临床经验来进行诊断。那么，如何在短期内让一般的医生也具有新冠病毒感染临床诊断经验，将对疫情的快速防控起到重要作用。

新冠病毒诊断面临以下紧迫问题：

① 诊断准确性不高：新冠病毒诊断的核酸检测准确度不高，导致病患久久不能确诊治疗，病情迅速恶化甚至死亡；

② 诊断速度慢：新冠病毒积累的疑似病例比较多，如不能快速确诊将导致病毒的进一步传播。

③ 资深临床诊断医生少：临床诊断需要经验丰富的资深医生，而大面积的医护人员感染和高强度的工作，导致一般的医生已经不堪重负，更不用说资深的医生了。

如何解决上面提到的新冠病毒感染诊断准确性低、诊断速度慢以及资深临床诊断医生少的问题，是疫情能否发生逆转的重要决定因素。

我们可以利用人工智能机器学习算法，学习训练资深医生的临床诊断经验，训练完成具有高准确率的新冠病毒感染识别模型，辅助医生快速进行临床诊断。

由于已经具有了医生的诊断数据，并且有了诊断结果，因此可以利用机器学习中的监督学习模型进行训练。由于诊断结果是感染或者没有感染这两种情况，所以就是一个二分类模型。

利用人工智能机器学习算法训练新冠病毒感染临床诊断识别模型的流程：

总的模型序列构建流程如下：

一，数据准备

新冠病毒感染临床诊断依靠的数据包括流行病学史调查数据、病人临床表现数据以及一些实验室检查数据。

流行病学史调查数据

① 发病前14天内有武汉市及周边地区，或其他有病例报告社区的旅行史或居住史；

② 发病前14天内曾接触过来自武汉市及周边地区，或来自有病例报告社区的发热或有呼吸道症状的患者；

③ 聚集性发病；

④ 与新型冠状病毒感染者有接触史。

临床表现数据

主要表现为发热、乏力、干咳。如果个人出现发热，并同时伴有流涕、鼻塞、咽痛；部分患者可出现LDH增高；部分危重者可见肌钙蛋白增高。新冠肺炎在影像学方面的表现特征：早期呈现多发小斑片影及间质改变，以肺外带明显。进而发展为双肺多发磨玻璃影、浸润影，严重者可出现肺实变，胸腔积液少见。

根据流行病学史和临床表现，准备新冠病毒特征数据（由于无法获得病人诊断数据，所以只能根据诊断方案进行数据库构建。如掌握病人新冠诊断数据的单位，可联系作者合作进行诊断模型的研究）。

为了获得训练模型的准确性和泛化能力，不但能识别出感染的病例，而且还要能识别非感染病例，需要诊断数据保持真假例数据平衡，即诊断结果是准确感染的和诊断结果不是确诊感染的比例差不多。

二，数据处理

诊断数据中很多都是字符型的，需要将其转换为数字型。

对连续的数据，体温、发病天数进行离散化处理，如“体温”数据，处理成正常和非正常两段数据。

三，特征工程

需要选择使用哪些特征数据作为训练临床诊断模型的特征，由于诊断中已经使用了流行病学史和临床特征数据作为临床诊断的数据，因此不需要再进行特征数据的分析，直接使用这些特征作为训练模型的特征数据。

四，模型训练

将加载的特征数据按照7:3的比例拆分，70%作为训练模型数据，30%作为测试验证模型数据，选择分类模型中的逻辑回归算法、梯度提升决策树，进行诊断模型训练。

模型训练需要不停的进行超参数的调节，以便不断的优化模型。模型超参数的调节需要对算法深入掌握的算法工程师参与，对于一般的业务人员可能无所适从。可以采用自动调参设置，模型参数自动优化/推荐能够协助对算法不熟悉的业务人员也可以进行模型的训练。

五，模型测试（验证）

使用拆分的30%的数据进行模型验证，验证训练后的诊断模型对新数据的预测能力。模型测试的结果尽量实现低方差和低偏差，低方差使模型具有稳定性，而低偏差使模型具有高的准确性。

六，模型性能评估

对训练好的模型进行性能评估，查看模型性能的准确率等评估指标。

从下面的评估指标中，例如混淆矩阵中可以看出，真实为0预测为0的有10个；真实为1预测为1的有12个，真实为0预测为1的有1个，准确率accuracy为0.9565；加权F1值为0.9563。由于模型性能指标已经超过0.8（80%），因此可以作为模型进行部署。另外也选择了梯度提升决策树模型，其模型性能和逻辑回归模型差不多。

七，模型部署

将训练好的模型部署在临床诊断中，辅助医生对患者进行新冠病毒感染的临床诊断。将模型以RESTFUL服务部署，方便调用。

以json的格式输入一条诊断数据：

病患号,疫区或病患社区旅行史,病患接触史,疫区人员接触史,是否有聚集性活动,体温,乏力,干咳,发病天数,鼻塞,流涕,咽痛,腹泻,呼吸困难,血氧浓度,外周血白细胞总数,淋巴细胞计数,肝酶,LDH,肌酶,肌红蛋白,肌钙蛋白,C反应蛋白（CRP）,血沉,D-二聚体,外周血淋巴细胞,肺炎影像学特征

病患125,无,有,无,无,38.5,否,是,4,否,是,是,否,否,正常,正常,正常,正常,正常,正常,正常,正常,高,正常,正常,减少,有

可以看出，在输入诊断数据后，利用已经训练好的模型进行预测，预测结果prediction的值为1，即确诊为新冠病毒感染者。

为了能够快速的训练完成新冠病毒感染诊断识别模型，需要一款具备数据接入、数据处理、模型训练、模型评估、模型部署整个过程的成熟的全能软件支撑。以上模型基于可视化数据挖掘平台Smartbi Mining进行构建，具有全流程化、可视化、模型参数自动化及模型部署一键化等特点，能够快速构建高性能的新冠病毒感染诊断识别模型，并快速的部署应用于辅助临床诊断中。

具体来说，使用Smartbi Mining构建模型具有以下优势：

① 建模全流程化：支持从数据接入、数据处理、模型构建、模型评估、模型部署整个流程过程。

② 操作全可视化：支持拖拽操作完成建模、挖掘过程可视化、挖掘结果可视化。

③ 模型参数智能自动推荐：模型超参数自动调整，能够大大减低人员的使用难度，挖掘最复杂的部分被简化。

④ 与BI无缝对接：挖掘和BI展示被集成到同一款产品中，挖掘可以使用BI丰富的可视化展示；BI也可以使用挖掘的数据处理及分析结果。

本篇文章没有去过多的讨论机器学习算法的性能及优劣，而是把重点放在了利用成熟的人工智能机器学习产品构建新冠病毒感染临床诊断识别模型，辅助医生快速进行临床诊断。在发生类似的紧急公共卫生事件时，能够为快速诊断、快速隔离、快速治疗病患赢得时间，降低病毒传播速度及病患的死亡率。

由于缺乏真实数据，只能从网上搜集数据进行测试。本篇文章中训练的模型只能当做研究，不可在实际生产中使用。如果能够得到真实的数据，则训练出来的模型可以在实际的新冠病毒肺炎临床诊断中使用。

申请试用

新一代商业智能BI工具

AIChat对话式分析

了解详情
一站式ABI平台

了解详情
智慧数据运营平台

了解详情
电子表格软件

了解详情

你已经点过赞了

智能BI平台 AI

Smartbi AIChat

一站式ABI平台

Smartbi Insight

智慧数据运营平台

Smartbi Eagle

电子表格软件

Smartbi Spreadsheet

了解AIChat智能BI平台解决方案 >

数据准备

数据接入

数据导入

数据模型HOT

检索增强生成RAGNEW

AI图谱构建

同义词

问答解析示例

知识库HOT

自然语言分析

图表支持

时间智能计算HOT

高级分析NEW

单/多轮对话管理HOT

错误纠偏

系统管理

大模型支持

API服务

应用集成

权限管理

系统日志

了解一站式ABI平台解决方案 >

数据管理

数据接入

指标管理HOT

数据采集

数据模型

自助ETL

数据分析

数据可视化HOT

即席查询

电子表格

透视分析

对话式分析

分析报告

数据挖掘

Excel融合分析

了解智慧数据运营平台解决方案 >

统一数据门户

数据资产目录

自助分析体系

数据运营管理

数据互动社区

数据共享中心

了解电子表格软件解决方案 >

数据接入

数据集

中国式报表

系统运维

数据采集

业务主题

数据可视化

权限管理

数据脱敏

导入文件

Excel融合分析HOT

移动报表

第三方集成

资源集成

发布分享

报表门户

行业解决方案

覆盖金融、制造、医疗、政府、零售等主流行业

智能制造 >NEW

智慧政府 >

教育行业 >

其他行业

金融 >HOT

能源行业

医疗行业 >NEW

资源中心