猪猪小说网

手机浏览器扫描二维码访问

第三节 医疗大数据(第2页)

“谷歌流感趋势”的原理是:在流感暴发季节,人们会通过Google等搜索工具了解流感的一些措施,在这段时间内某些与流感相关的关键词,如流感、咳嗽、发热、喉咙痛、流感疫苗等会高频率出现。“谷歌流感趋势”工具通过汇总这些搜索数据,可以近乎实时地对全球当前的流感疫情进行估测。

2009年,在H1N1型流感暴发几周前,谷歌公司的工程师们在Nature上发表论文介绍了“谷歌流感趋势”。他们成功预测了H1N1型流感在全美范围具体到地区和州的传播,这令公共卫生官员们和计算机科学家们倍感震惊。而美国疾病预防控制中心一般要在流感暴发一两周之后才能给出官方统计数据,“谷歌流感趋势”却提前9个星期预测到了流感趋势。这个工具最初运行得很好,许多国家的研究人员已经证实其对流感样疾病的估计是准确的。

“谷歌流感趋势”项目背后的原理似乎很简单,但现实远比原理复杂。为了建立相关搜索词条与流感趋势的关系模型,谷歌测试了5000万条美国人最频繁检索的词条,并为之尝试了4.5亿个不同的数学模型。在这个过程中,通过与美国疾病预防控制中心在2003年至2008年流感发作时的数据进行比较,谷歌公司发现:利用其中45条检索词条的组合,并将它们用于一个特定的数学模型后,他们的预测与官方数据的相关性高达97%。于是,谷歌便以此模型为基础实现了“谷歌流感趋势”工具。

但是,在2011年至2013年间,“谷歌流感趋势”的表现并不尽如人意。该项目多次在很长一段时间内过高地估计了流感的流行情况。从2011年8月到2013年9月的108周中,谷歌超高估计流感流行高达100周。在2013年冬天的流感季节高峰,谷歌流感预测数据是美国疾控中心实际搜集数据的两倍。分析这其中的原因,一方面在于谷歌用于预测的数据存在很多“噪声”,例如:“春天感冒怎么办”这样的查询数据就会影响预测的结果;另一方面,哈佛大学相关研究者就指出了谷歌项目在分析上的不足,认为“谷歌流感趋势”没有利用传统的统计分析手段来剔除系统误差,而且没有定期利用美国疾病预防控制中心的数据作为系统校正的参照数据。

需要指出的是,对谷歌的差错或许没有必要过分担心,不能因为不精确而放弃大数据的应用和发展。或许通过大数据与传统统计方法互补,可以让大数据发挥更好的作用。

2.BaselineStudy

2014年7月,谷歌在医疗方面又启动了一个研究项目——BaselineStudy,这个项目日后有可能是谷歌在医疗方面最重视也发力最大的项目之一。

BaselineStudy希望通过生物标志全面描绘健康人的身体。它将收集巨大的生物样本,主要是那些健康人群的基因与分子信息,当标本基数足够大时,专家就可以用数据完整地描绘出一个健康人类。具体来说,谷歌会利用自己的大数据计算技术,找到每种疾病对应的标志,而缺少这种生物标志的人,就有患某一种病的可能。那么对于无法在早期诊断出的疾病,比如心脏病或者癌症,在未来就可以进行有效的预防。而且这样的诊断方式将再不会仅局限于某几种疾病,而是一次性帮助病患找到所有可能存在的问题。相较于过去医学从点出发关注疾病患者为什么患病,谷歌更想做的是如何从面出发搞清健康人群保持健康的原因。

目前,该项目已经组建了一个由70~100人组成的团队,涵盖的领域包括生理学、生物化学、光学、成像学和分子生物学,他们已经开始探索研究。至今为止专家们总共搜集了175个标本,后续还会不断地搜集样本素材。另外,这项研究其实存在着巨大的未知数,因为人类的身体实在太复杂了,很多因素都会影响人体的健康,比如说DNA、酶、蛋白质之间的相互影响,还有环境因素。所以有可能最后得到的所谓生物标志,不一定和某种疾病密切相关。

鉴于个人隐私保护的考虑,谷歌方面特别强调,该项目所有的基因样本都来自匿名人群,而且数据只能用于医药研究,绝不会外泄。尽管如此,此事还是引发了很大的担忧。因为这类数据能为保险公司带来巨大的价值,他们一直以来都希望通过各类信息降低风险。除此之外,还有人可能会在招聘和结婚时参考相关数据。所以为了保障个人隐私信息安全,BaselineStudy将聘请杜克大学和斯坦福大学的医学院进行监督,由他们控制相关信息的使用规则。

(二)百度

1.百度与中国疾病预防控制中心的传染病预测合作

2014年4月24日举行的百度第四届技术开放大会上,百度宣布正式发布大数据引擎,它开放了包括开放云、数据工厂、百度大脑三大组件在内的核心大数据能力。外界可以通过大数据引擎利用百度在大数据存储、分析及挖掘方面的技术能力。在本次大会上,中国疾病预防控制中心(CenterforDiseaseControlandPrevention,CDC)副主任高福院士也介绍了他们在大数据方面与百度开展合作进行传染病防控研究的情况。目前,双方正在研究的项目有“基于百度搜索数据的传染病预测模型和应用研究”和“基于LBS数据的传染病传播动力学研究”等。

“基于百度搜索数据的传染病预测模型和应用研究”项目的目标是建成中国首个流感预测系统。该项目第一阶段主要通过分析百度搜索数据、用户人口统计学数据、全国流感法定报告数以及流感样病例和病原学哨点监测数据之间的关系,以建立我国不同地区的流感预测模型;第二阶段结合天气、人口迁徙、地域、采集时空等信息建立更复杂的模型,以便实现更准确的评估和预测;第三阶段结合了LBS(基于位置服务)、社交APP相关信息,从更微观尺度上进行流感监测和预测,并为用户提供及时的周边流感活动情况,以便合理安排自己的活动或及时采取疫苗接种等预防措施。

“基于LBS数据的传染病传播动力学研究”项目主要是通过对人群移动模式的研究建立传染病传播模型,以支持相关疾病的预测。该项目第一阶段主要根据百度LBS(基于位置服务)数据、人群接触和出行模式调查数据,定义不同时空尺度的人口流动性和参数,以此建立人群移动模式;第二阶段主要通过进一步结合病原学、人口统计学、地理、气候等因素建立传染病传播模型,确定流感等传染病在各流行区域间传播的时空路线和规律。

基于这两项研究以及相关研究的成果,百度的疾病预测已于2014年6月上线,而且截至2014年9月底已经可以对全国331个地级市、2870个区县、19个城市的2558个商圈的11种疾病的活跃度指数进行查询。目前支持的11种疾病包括乳腺癌、流感、宫颈癌、心脏病、肺癌、高血压、糖尿病、性病、肺结核、肝炎和艾滋病,百度疾病预测主要给出了它们的活跃度、流行指数以及各种疾病相关的城市和医院排行榜,用户可以查看过去30天以内的数据和未来7天的预测趋势(图5-2)。

图5-2百度疾病预测

因上线时间较短,百度疾病预测的效果还很难评估,但因为它比谷歌预测上线较晚,所以吸取了谷歌预测的经验,加入了一些最新的技术成果和数据采集结果。

2.百度医疗大脑

2014年9月3日于北京召开的百度世界大会上,百度正式对外公布了一项辅助医疗行业的新计划——百度医疗大脑。

据了解,这是百度大脑在医疗领域的细分项目,它结合了大数据分析、人工智能、图像识别、机器学习等先进技术以及来自于传统医疗机构的海量数据。

百度医疗大脑的技术保障来自百度大脑。百度大脑是百度于2014年上半年上线的大数据引擎平台中最为核心的技术产品,它可以模拟人脑的思考方式进行学习和逻辑思考。根据此前的介绍,百度大脑目前可以达到相当于2~3岁孩子的智力水平。

除此之外,医疗相关大数据的引入也让百度医疗大脑能够发挥更大的作用。百度基于国内领先的搜索引擎地位,积累了大数据方面的天然优势。而且,很多专业权威的第三方医疗机构与之都建立了合作关系,这成为百度医疗大脑在数据方面的坚实基础。据百度介绍,百度医疗大脑的数据来源于五个维度:

(1)PC和移动端产品上的实时医疗健康类的百度搜索数据。此部分数据的量级达到了PB级。

(2)来自于传统线下的医疗机构、医院等信息和数据。随着越来越多的医疗数据的引入,这一数据类别和量级正急剧增长,它们是医疗大脑的“智慧”中枢。

(3)医疗科研院所、机构的信息和数据,这类数据更具前瞻性和预测性。

(4)卫生部门信息和数据的共享和协同。

(5)相关合作的体检机构所提供的民众体检数据和信息。

目前,百度医疗大脑已经开始在相关领域展现其实用价值。在百度世界大会上,百度就在现场展示了其皮肤病诊断APP——康知皮肤医生。康知皮肤医生由百度的合作商祥云医疗集团开发,它通过对用户上传的皮肤症状图片进行图像识别、机器学习等分析处理过程,然后给出有关皮肤病的鉴别结果。康知皮肤医生正是基于百度医疗大脑的支撑,实现了快速识别和判断患者所患皮肤病种。

当然,康知皮肤医生只是百度医疗大脑价值的初步展现。随着更多医疗行业的伙伴加入,百度医疗大脑通过技术与数据的结合,必将在个人健康管理、医疗大数据研究和公共卫生领域发挥出巨大的作用。

不说也罢  灵枢解难  近世欧洲史  人民日报70年消息选  都市最强狂婿  中药传说  最强练气师  唐宋词鉴赏课  都市逍遥医神  元降  重生火影的修道者  管遵惠针余笔谈  高清日本战国史(套装全4册)  山野汉子旺夫妻  主动脉及周围血管介入治疗学  人民日报70年文艺评论选  双宝驾到:冷傲爹地太能撩  贵女楹门  西游太小了  天上掉下朵白莲花  

热门小说推荐
我的老婆是女帝

我的老婆是女帝

叶火被校花拉进小树林表白了,原本是可喜可贺的事情,但叶火却高兴不起来,因为校花说她是从仙界重生回来的龙华女帝,还拉叶火去摸她肚子上的龙纹身...

无敌推销员

无敌推销员

狙击枪算个吊?哥一枪爆掉!神马火箭筒?火箭筒算个球!哥单刀PK无敌杀手改行做推销员,苦逼的日子,哥穷的都快去卖屁股了!打架也能打的美女投怀送抱?有木有搞错!咳咳真的不是哥推倒美女,而是美女推倒哥?热血! 制服 御姐 萝莉 黑丝 白丝 萝卜丝应有竟有!草根人物统一华夏黑帮,对抗日本黑帮美国黑手党的传奇故事!2012年度都市激战力作!华夏黑道教父从草根到巅峰的成长历程!更新时间每天两更 凌晨0点第一更18点第二更。上架作品 品质保证...

火影之忍界闪光

火影之忍界闪光

忍界被隐藏在深处的黑暗与阴谋笼罩,某个男人操纵着这一切。波风水门—木叶的金色闪光,将以光芒照耀忍界。如果我能够再一次遇见你,便没有能够将你从我身边夺走!十六年前的九尾事件,第四代火影波风水门阵亡,而当他再一次开始自己的人生之后,一切,又会发生怎样的改变?静若处子,动若飞雷神!!这便是,木叶的闪光。忍界的闪光...

毒医狂后:魔帝心上宠

毒医狂后:魔帝心上宠

走路踩到香蕉皮摔死的陌离重生了。重生之后的她不再是曾经的欧皇,直接变成了非洲人。陌离遇到了一个类似于所有小说男二的人,邪肆魅惑,绝世独立,甚得她心。她确信!第一个出来的一定是男二!直到被男二堵在墙角,陌离终于清醒那个其实我还没做好准备不碍事,本帝准备好了。陌离可以多给我几天让我学习一下嘛?不可以。好嘛,男二面具下拥有主角光环的小哥哥竟然如此简单粗暴,男主实锤,她...

异域求生日记

异域求生日记

异域求生日记由作者愤怒的香蕉创作全本作品该小说情节跌宕起伏扣人心弦是一本难得的情节与文笔俱佳的好书919言情小说免费提供异域求生日记全文无弹窗的纯文字在线阅读。...

督军

督军

民犹是也,国犹是也,无分南北总而言之,统而言之,不是东西这是个最好的时代,一些人用热血和生命实现梦想,为国家寻找出路。这是个最坏的时代,许多人看不到希望在哪,在他们面前,除了黑暗,还是黑暗。在这样的大时代中,一个出身市井的小人物,乘风破浪,一路高歌。城头变幻大王旗,河边枯骨谁人惜。错命乱曲狂笑去,轩辕墓前温酒棋。读...

每日热搜小说推荐