其中以IBM最负盛名的产品沃森为代表,近期也出现了许多的负面报道,包括沃森集团与休斯敦的癌症治疗机构M.D.安德森中心的合作在今年分崩离析;随着 IBM 公司的营业额暴跌,股价一直摇摆不定,商业分析专家们一直质疑沃森到底何时能够为公司创造出真正的商业价值。
多重怨念积累之下,资深技术投资者和风投公司 Social Capital 的创始人 Chamath Palihapitiya 于 5 月份在 CNBC 上甚至直接炮轰:“沃森就是个笑话。” Palihapitiya认为,IBM的专长其实只是通过他们强大的营销和市场能力,以及信息不对称,去让消费者为他们并不了解的服务买单。
不过,IBM对于这一指责也并非无动于衷,他们曾在一份声明反击道:“沃森并不是一个消费类产品,而是一个真正能为产业服务的人工智能平台。沃森目前已经被美国及其他五个国家用于医学诊疗领域。我们已经在6种癌症的诊疗方面对沃森进行训练,今年还会增加8种。除了在肿瘤学领域的应用,最顶尖的25家来自生命科学、IoT设备制造、零售与金融服务等领域公司起码有一半在使用沃森提供的服务,这里面就包括GM、H&R Block、SalesForce等公司。什么样的人才会认为拯救生命、优化客户服务、驱动商业创新都是笑话?”
图丨M.D.安德森中心
然而,大部分针对沃森的批评,包括与 M.D.安德森中心的分道扬镳,并非是出于沃森有什么特别的技术缺陷。相反,批评针对的恰恰是 IBM 之前对沃森前景过于乐观的声明,关于沃森迄今应该取得的成就云云。
事实上,在医疗人工智能领域,沃森健康应该仍处于领先地位。如果说目前沃森还没有取得显著成就,那么最明显的阻碍之一就是它需要特定类型的数据进行“训练”,这些数据通常要么非常紧缺,要么难以访问。这不是沃森独有的问题,这是整个医疗机器学习领域面临的通病。
尽管数据匮乏影响了沃森的开发速度,但这对 IBM 的竞争对手们的影响更大。这是因为,获取数据的最佳途径是与大型医疗机构密切合作,但这些机构往往在技术上非常保守。而众多创业公司,甚至是像苹果和谷歌这样的巨型竞争对手,都很难像 IBM 一样取得大型企业高管和IT经理的信任。
可以这么说,尽管 M.D. 安德森项目遇到了问题,IBM 仍然占据着决定性的优势:它能为沃森搭建广阔的平台——合作中的医疗中心、卫生管理机构和生命科学公司都将提供未来医学人工智能所需的关键数据。
图丨M.D.安德森中心的白血病医生 Courtney DiNardo 在2013年与病人会诊时使用了IBM的沃森系统
毫无疑问,与M.D.安德森中心分道扬镳,给了努力推广沃森的 IBM 当头一棒。该中心与 IBM 的合作开始于 2012 年,旨在允许沃森读取一切有关病人症状、基因序列和病理报告的数据,结合医生的病案笔记以及相关期刊文章,帮助医生提供诊断和治疗方法。但很明显,IBM 和M.D.安德森中心对技术的期望显然过高了。
2013 年,IBM 声称“一个新的计算时代已经降临”,同时向福布斯杂志暗示,沃森“已进入临床试验阶段”,并将在短短几个月内投入使用。2015 年,华盛顿邮报引用了一位 IBM 沃森经理的话,描述沃森如何忙着建立一个“沟通机器与人的集体智能模型”。华盛顿邮报还说,沃森系统会“和医生一起训练,去做他们做不到的事”。
今年 2 月, 运营M.D.安德森中心的德克萨斯大学宣布关闭与 IBM 的合作项目,为合同上最初价值 240 万美元的项目向 IBM 支付高达 3900 万美元的赔款。四年过去了,沃森并没有为那些苦苦期盼的患者带来任何帮助,M.D.安德森中心也没有对沃森作出具体评价,但问题似乎主要来自于项目管理和资金分配的内部斗争。
但这并不意味着 IBM 在沃森的技术开发上没有遇到困难。事实上,技术上的进展比表面上看起来要更加艰难。
要了解是什么阻碍了研发进程,你必须先理解沃森一类的机器学习系统是如何接受训练的。沃森能够通过不断调整其内部程序来“学习”,并对特定类型的问题给出最有可能是正确的答案(例如,哪张放射影像上显示了肿瘤)。正确的答案必须是已知的,这样给出答案后系统就能够得到正确的反馈。系统被“喂养”的训练问题越多,它的命中率就越高,机器学习能够轻松地通过X光影像判定恶性肿瘤。
但是,对于远远超出已知范围的、潜在的突破性谜题,比如检测基因排列和疾病之间的关系,沃森面临着一个“先有鸡还是先有蛋”的问题:它如何利用未经专家筛选的数据进行训练?
图丨IBM 于2015年宣布,沃森的诊断能力将因为从 Merge Healthcare 获得的数据而得以大幅提升。
纽约一家癌症中心 Memorial Sloan-Kettering的计算病理学家 Thomas Fuchs 说:“训练一辆自动驾驶的车,任何人都可以告诉它前面有一棵树或一面路牌,驾驶系统就学会了辨识路障。但是,在医学的专业领域,这种情况少之又少,只有培训了数十年的专家才能告诉系统什么是正确答案。”
在机器学习系统的每一个领域,都会出现这类绊脚石的翻版。为了训练沃森通过巨大的数据池,把少数重要的信息提取给某一个病人,需要先有人手动做一遍,而且要做成千上万份。为了识别与疾病相关的基因,沃森需要数千份特定疾病的患者记录,而且这些患者得有DNA分析报告。但两者很难同时获得。数据不存在、格式不统一是常见的绊脚石,也可能数据分散在几十个不同的医疗中心,很难收集利用。
所以,不妨我们先来考虑一下沃森的目标。例如,把准确的数据提供给临床医生来改善初级卫生保健。万一医生在常规检查中漏过了小问题,小问题就会演变成大问题,病人将被送到急诊室,或不得不挂个专家号,不但健康受到损害,医疗费用也将暴涨。“大约有三分之一的医疗费用很可能是不必要的,”IBM沃森健康的首席医疗官兼家庭医生 Anil Jain说。很多人认为,机器学习系统是解决这个问题的一个机会。
图丨IBM沃森健康的首席医疗官兼家庭医生 Anil Jain
然而,为了真正帮助医生取得更好的治疗效果,沃森需要找出病历记录和 “决定健康的社会因素”之间的关系。这些因素包括:患者是否吸毒,饮食是否安全,是否能呼吸到清新的空气等等。目前,几乎没有任何医疗机构能可靠地获取大部分患者的此类数据,部分原因是医院迟迟没有采用现代化的电子信息管理系统。
对此,Cleveland诊所的医疗信息学专家、内科医生Manish Kohli 说:“在使用电子信息技术方面,医疗行业一直是非常落后的。”
数据只要存在,IBM 就能购买。IBM已经收购了许多活跃在医护大数据处理前线的公司(例如Truven健康分析公司、Explorys以及 Phytel)。即使与 M.D. 安德森中心的合作终止了,IBM仍拥有一些关键的合作伙伴,得以进一步访问患者数据。Atrius健康就是IBM的合作伙伴之一,其网络覆盖了整个波士顿地区的近900个保健医生(大多数是家庭医生)。双方合作的目的是开发并测试一款基于沃森的系统,能从各类笔记、记录和文章中大海捞针般调取出对单个病人至关重要的信息。
“如今的家庭医生面临着一项繁重的工作,就是要寻求所有相关信息,” Atrius首席医疗官 Joe Kimura 说。而电子病案记录可能使问题变得更糟,因为这类电子系统极大增加了每次访问生成的数据量,却并未提供便于检索的标准格式。
图丨Atrius 健康
关键的一点是病案记录中有许多非常重要的注释,往往是常规IT系统无法理解的语句,但沃森可以用它的自然语言处理技术提取这些语句的意义。理想状况下,它能帮助医生避免过度医疗带来的副作用。Kimura 问道:“为什么我们只盯着髋骨骨折的患者,而不去预测哪些患者有跌倒的风险、帮他们预防骨折呢?我们需要做得更超前。”
沃森医疗公司还与纽约中央护理协会合作。该协会由政府资助,业务范围覆盖了六个县的大约 2000 家医疗机构。有时,已出院的病人由于一些遗留问题不得不返回该医院解决,沃森希望,此次合作能使这类情况导致的接诊率和再住院率下降25%。同时,合作还能提供大量潜在的医疗数据。
获取此类数据还有其他方法——谷歌的一家姊妹公司正试图直接从病人身上直接挖掘数据。事实上,Verily Life Sciences(Alphabet 的医护部门)正与杜克大学和斯坦福大学合作,基于10000名志愿者研发一个高度结构化的健康数据库。该数据库将不仅包括临床检查信息,而且还包括可穿戴健康监测设备的信息。尽管可能需要十年或更长时间才会产生可用结果,但这项新技术仍然很有希望为数据访问带来一个飞跃。
而前文提到的纽约癌症中心病理学家 Fuchs 在 Memorial Sloan Kettering 的开发小组希望培养一个能够读取染色组织玻片的人工智能系统。这需要一个包含了玻片图像、数字标注、确诊信息和其他关键数据的大型数据库。因此,该小组准备每月生产4万张这样的玻片。“这是一个无人能及的工作量,” Fuchs说。“生物学上的各种变化使这项任务变得十分艰巨。”
另一端,尽管与沃森的合作已流产,M.D. 安德森中心也正在进行一个大型计划。这项计划与IBM的动作在差不多同一时间开始,致力于从每一位走进门的病人身上收集1700种类型的临床数据。运行计划的研究人员 Andy Futreal 认为,对于沃森一类的人工智能来说,将病人信息和研究数据结合到一起是至关重要的。他说:“一旦我们集齐数据,就可以让人工智能来学习,然后发现影响病人治疗结果的因素。”
IBM 将会继续从合作医院中收集数据。在癌症诊断和治疗方面,该公司的合作对象包括 Memorial Sloan-Kettering、Mayo Clinic、哈佛和麻省理工学院附属的 Broad 研究所,以及医学测试巨头 Quest Diagnostics。与 Memorial Sloan-Kettering 的合作已经诞生了一个能通过筛选期刊文献提出治疗决策的系统,并已在佛罗里达 Jupiter 医疗中心和印度的连锁医院推广。
在药物发现方面,沃森健康与Barrow 神经研究所合作,已找到5个之前从未被发现,却与肌萎缩硬化症有关的基因。在与安大略脑系研究所的合作中,沃森确定了21个潜在的候选药物。
沃森最终能够改善保健活动、降低医疗成本吗?非常可能。风投公司 Bessemer Venture Partners 的合伙人Stephen Kraus 也是许多医疗人工智能创始公司的投资人,他表示:“这都是真刀真枪,而不是为了提振股价而发放的烟雾弹。”但 Kraus 和大多数专家一样, 认为人们不应该对实现的时间以及美好的承诺过于期待。
“这很难,这不是今天发生的事,也可能不会在五年内发生,而且它也不能取代医生的地位。”