登录管理平台  |   注册
您的位置: 首页 > 新闻中心 > 新闻资讯 > 网络搜索能预测癌症吗?大数据和健康的承诺和担忧
网络搜索能预测癌症吗?大数据和健康的承诺和担忧
发表日期:2018-04-25    文章编辑:百客宝    浏览次数:

“大数据”是21世纪的一种流行词,它含糊地引用了使用大量数据来绘制关于趋势,模式和相关性的计算机辅助结论的想法,这些结论往往是关于人们及其行为的。

 

但如果你想追溯使用大数据进行健康研究的起源,那么你必须回到17世纪的英格兰。

 

在那里,你会发现一位名叫John Graunthaberdasher ,他承担了一个特别的项目。他开始研究所谓的死亡率法案,在瘟疫时期保存的死亡纪录,并将死亡详情汇编成表格,注明年龄,性别,原因,地点和时间。

 

这个重要的统计研究后来变成了1662年的大学。它标志着人口统计学的一个重要时刻,人口统计研究,还包括流行病学,什么导致疾病的研究,以及它们在不同人群中的传播。

 

“这是完全突破性它的时间,这是看待疾病比任何人都趋向规模更大曾看着前面,说:” 斯蒂芬·穆尼,在公共卫生哥伦比亚大学梅尔曼学院的流行病学家。

 

他说:“在某些时候,你必须思考如何整理一张桌子并在同年查看模式的意义。” 那时候,这是大数据。

 

当然,今天的突破性大数据与手工制作的表格相去甚远。它允许研究人员使用超高速计算机查询我们在社交媒体,我们的可穿戴设备,我们的搜索记录 - 我们的“数字排气”中留下的数十亿条数字记录,因为波士顿儿童医院首席创新官John Brownstein提出它。

 

而不是一个很好的事情吗?

 

大数据对于现代健康的承诺大受赞誉。本周来了最新的壮举。微软的科学家发表了一项研究,显示网络搜索查询(微软Bing搜索引擎)可能会为未来的胰腺癌诊断提供线索,这是最快和最致命的癌症之一。

 

实际上,微软的研究人员是这样做的:他们在微软的Bing上研究了数百万次的匿名搜索,以发现暗示用户最近诊断的问题,例如“为什么我在胰腺癌症”或“刚刚诊断出患有胰腺癌”。然后,他们回溯由同一计算机留下的数字足迹定位搜索该疾病的早期症状,并创建他们说可以预测5%至15基于先前的搜索活动的最终诊断%,而统计模型相当低误报。

 

但是,天真地认为我们比我们知道更多关于这点的信息很容易。检测早期诊断的数字线索是一回事,但另一个事实是预防或延迟死亡。

 

微软科学家自己在研究中承认了这一点。他们写道:“临床试验对于了解我们的学习模型是否具有实际效用是必要的,包括与其他筛选方法结合使用。”

 

这就是这个大数据未来的关键所在:这是现代超连接世界的一个合乎逻辑的发展过程,但它将继续需要传统医疗专业人员的坚实基础,将数据转向有用性,避免不必要的焦虑,甚至不必要的测试,并将实际原因归结为零,而不仅仅是特定健康趋势之间的相关性。

 

 

2008年,谷歌研究人员决定根据用户的网络搜索实时测量流感活动。这是一个头条新闻,并且运作良好 - 一段时间。学术研究人员后来在该项目上做了一个事后分析,David LazerRyan Kennedy Wired杂志上写道:

 

GFT2013年流感季节的高峰时期失败了140%,并且失败了,并且出人意料地失败了......

“虽然谷歌在预测流感方面的努力具有很好的意义,但在方法和数据方面它们显得不透明 - 使得依靠Google流感趋势进行任何决策成为危险因素。

例如,谷歌的算法很容易过度适应与流感无关的季节性条件......肯定会有纯粹机会密切相关的搜索,而这些术语不太可能由实际流感病例或未来趋势预测驱动。

然而,该项目的失败并不否定大数据对健康的承诺。除了大规模趋势分析之外,捕捉被动创造的关于人们情绪,心理起伏的数据,你可能从未想过要带给你的医生的东西可能“非常强大”。

 

这不是可以在一个筒仓中使用的数据,它是系统中的一个设备,所以它不像这个圣杯,它只是可以使用的数据,可以与其他类型结合使用信息毒株”

 

谷歌流感趋势是一个炒作循环的例子,这个概念使得技术被过度使用,然后令人失望,但在失望之后的某个时候,往往会回到某种有用的高原。

 

这是一个关于健康的大数据的教训:它值得热情和谨慎。

 

 


标签:
如没特殊注明,文章均为网络原创,转载请注明来自http://baikebao.cn/show-96.html