Google 最新成果：利用神经网络让糖尿病人们摆脱失明 “诅咒”-品玩

根据维基百科，截至 2014 年，全球共有超过 4.2 亿人患有糖尿病，这个数字在近年来有所减少，但形势仍不容乐观。而作为糖尿病的并发症之一，糖尿病性视网膜病变 (Diabetic Retinopathy) 正在侵蚀着长期糖尿病患者。医学人士发现，对于一般患者，患病 10 以上会开始出现病变，导致失明。听起来 10 年后很远，但情况其实比想象的更紧急，因为对于那些血糖控制差，或者是胰岛素依赖型糖尿病的患者来说，他们完全有可能更早出现眼底病变，失明的风险比其他人甚至是糖尿病患者都更高。

问题在南亚国家尤为严重。截至 2015 年，印度有超过 7000 万名糖尿病患者，而由于生活习惯、遗传因素、缺少医生和足够的医疗资源等社会原因，接下来 20 年的情况很令人担忧，到 2040 年南亚国家糖尿病患数字将会增长到 1.4 亿。但摆在印度公共卫生部门面前的直接问题更加棘手：根据官方统计，由于全国存在一个大约 12 万名眼科医师的缺口，糖尿病和糖尿病性视网膜病变患者无医可投，大约 45% 的患者在被确诊之前已经失去了部分或全部的视力……

莉莉·彭 (Lily Peng) 是 Google 旗下科研机构 Google Research 的一名研究员。在 Google 年度开发者大会 I/O17 即将召开前夜，她向我们介绍了一个激动人心的科研项目：用机器学习技术来提早发现糖尿病性视网膜病变，进行及时甚至是预防性治疗，从而让那些可能将在 3 年、5 年甚至 10 年后失去视力的人们，获得一个宝贵的提前治疗机会。

“我们的任务：使用深度学习技术训练一个算法，能够从病人的视网膜眼底照片中自动诊断出潜在的病变情况。”她介绍道。任务逻辑听起来很简单，但实际上并非如此，因为训练这个算法的过程才是关键。为了提供高质量的训练素材，科研人员找来了 54 名美国食药监局 (FDA) 资质认证的眼科医师和专业人士，从 2015 年 5 月到 12 月期间对总共 128,175 张视网膜眼底照片素材进行标记和评级，最终标记出超过 88 万个确诊症状。

接下来，神经网络技术就该派上用场了。莉莉·彭的团队搭建了一个 26 层的深度卷积神经网络 (Convolutional Neural Network)，然后用标记好的素材进行训练。

这种神经网络结构较为特殊，它的特性是对于二维结构的数据——也就是图片——有着较好的性能，因此经常被用于对大量图片进行学习。

2016 年 1 月和 2 月，Google Research 分别找来两个不同的眼科专业的视网膜眼底照片库，让算法和眼科医师一较高下。这次尝试的结果是显著的：算法在发现症状的敏感度 (98.8) 和判断症状的准确性 (99.3) 上，都比人的得分要高（在统计学上这个得分叫做 F-score，眼科医生的分数是 0.91，而算法拿到了 0.95）。

同年，这份研究报告发布在了美国医学会的专业期刊 JAMA 上，获得了医学界的大量好评。哈佛医学院的安德鲁·比姆和艾萨克·柯汉表示，“这一研究展示了医学新世界的样子。”

将计算机科学和医学进行结合，竟然达成了意想不到的效果。

当然，这已经不是计算机科学第一次跟医学产生有价值的交集，甚至医学界已经对“机器学习”这一术语感到并不陌生。事实上在过去的几十年间，医学科研人员一直在采用机器学习这种更为先进的技术来尝试攻克只有大计算量才可以解决的医学难题。但随着近几年来计算性能的飞跃式突破，机器学习的子集“深度学习”技术开始流行——毫无疑问，后者将成为医学科研工作者手中的最新利器。

身兼生物医学、医学双料博士的莉莉·彭，还对深度学习颇有了解，这种跨学科的才能让她格外瞩目，但她又怎样看待医学和计算机之间的关系？“其实不是所有的医学难题都要机器学习来解决，比如洗手这件事……我更重要的任务是帮助我的团队找到那些机器学习可解的难题，帮助他们理解我们的训练数据。”

她认为，机器学习是医学的一个很好的辅助工具——用来辅助医生做出诊断，而不是决定诊断。也正因此，Google Research 团队对该技术的推进仍然比较谨慎，莉莉·彭一再明确，这项研究只是为了证明通过机器学习的路径来解决问题，成效是显著且可预期的。然而这个计算机诊断的过程，还没有达到绝对科学可靠的程度。说到底，她们只是知道计算机能做出准确的诊断，并不完全明白它为什么能做出准确的诊断。

其实问题又回到了深度学习技术的一个核心辩题：无论识别图像、听懂语音，神经网络技术总能输出一些很不错的结果，但还是没人解释的清，它到底是怎样做到的。一些深度学习专家曾对我说，神经网络的节点和层级，模拟的是人脑神经元 (neuron) 之间互相连接以及层级式 (hierarchy) 的思考模式，但另一些脑科学家却向我指出，就连他们都没完全搞清楚人脑到底怎样思考。因此你可以说，现在的计算机神经网络结构与其说在模拟人脑，其实更像是依葫芦画瓢。

似乎这个问题可以争论下去无休无止，但争论可能更多发生在学界内部。好在，Google 已经可以确认用这种技术来诊断糖尿病性视网膜病变是有效的。接下来，Google Research 要和尼康等的眼科仪器/医疗服务机构进行合作推广这项技术。更进一步，她们希望能为这项技术取得 FDA 以及印度方面权威机构的认证，让全世界视力被糖尿病所威胁的人们能够尽早诊断、尽早治疗。

她们发现，其实诊断晚的这个情况，不仅在印度，在美国甚至全世界都是个问题，尽管原因不尽相同。

“在美国，很多情况是人们提交了自己的资料（注：眼底扫描）给医疗机构等待检查。但时间长了，人们搬家了、换电话了，当医疗机构诊断出病症时，病人却失联了，”莉莉·彭说，而机器学习检查的最大优势在于可以当场出结果。研究团队也在进行尝试，设立了网站让用户提交自己的眼底扫描照片进行分析——尽管这不是专业诊断，但仍足以提前 5 年甚至 10 年，拯救现在的普通人，未来的失明者。

前面提到，莉莉·彭的分享会发生在 I/O17 的前一天。在一整天的圆桌讨论议程中，我不止一次听到 Google 科研人员做出“我们的重心不是那些未来 50 甚至 100 年的新技术，但 10 年是一个很值得抓住的节点”或类似的表述。

的确，我们暂时无法解释神经网络到底是为什么这么厉害，但我们还是可以、应该用它来做一些很好的、在 10 年内可以帮到我们的事情。前沿科技其实都是如此，核心原理搞没搞清楚，并不妨碍我们去利用它改善生活。就好比我们的祖先不知道哪天突然发现了钻木或撞击石头可以取火，当时他们没能研究明白火到底是什么，但人类还是从茹毛饮血的时代向农耕文明迈出了那重要一步。