在 Google I/O 2019 上,除了面向消费者的功能改进和开发者的工具革新,Google 将大会的一个重点也放在了如何用 AI 解决人类面临的棘手难题上。
美国工程界的最高学术团体美国国家工程院 (National Academy of Engineering) 于2008年发布了21世纪人类面临的十四大工程挑战。而 Google 的科研领袖 Jeff Dean 告诉硅星人,他所领导的 Google AI 正在着手解决这些挑战。
如果这些挑战背后的难题不得到一定程度的缓解,很可能意味着人类将无法健康地延续到22世纪。这些难题在世界各地有所体现,也面向各行各业,但是 Google AI 都在用自己擅长的手段去尝试攻克它们(或者贡献一份力量)。
毫无疑问,Google AI 擅长的,正是深度学习。
为什么深度学习可以用于解决能源、交通、诊断、医药、安全等等诸多方面的问题,成为泛用的科学探索工具?
Jeff Dean 认为,这是因为深度学习可以从原始、异构、携带噪音的数据开始学习,即便开发者不具备特别领域知识,也可以开发出达到甚至超过领域内最高水平的神经网络。
而且,机器学习技术日新月异,现在每天发到 ArXiv 上的论文就有90篇;深度学习的技巧也层出不穷,使得神经网络能够掌握越来越多过去公认只有人类才能掌握的复杂能力。
现在,人类不得不应对重大的工程挑战,并寻求在本世纪内解决他们。Jeff Dean 认为,深度学习可以成为很好的工具。
维护和改进城市基础设施 Restore & Improve Urban Infrastructure
交通是城市基础设施的重要部分,也是随着人口增长和城市化加剧面临压力最大的领域之一。社会在变化,而道路通常是一成不变的。因此,交通在21世纪工程难题里尤为显著。
Google 采取的切入角度是提高道路交通安全和效率,而除了开车放下手机之外,最有效的方法可能就是自动驾驶。
Waymo 自动驾驶汽车从研发到今天已经将近10年,截至去年已经累计行驶800万英里,并且在全球所有自动驾驶试验者当中取得了最低的事故率。
Jeff Dean 指出,深度学习是 Google/Waymo 取得这一成就的功臣,让自动驾驶系统可以整合并学习来自不同传感器的原始数据,绘制高精度地图,“看懂”周围的车辆、行人和障碍物都在哪里,甚至可以预测其他道路参与者的行进方向,辅助自动驾驶汽车做出决策。
他介绍,现在 Waymo 在亚利桑那州已经有超过100辆测试自动驾驶汽车,可以在没有安全驾驶员的条件下载客前往目的地。许多业内人士都认为,理论上如动驾驶汽车占一个地区总车辆的比例越高,地区的事故率越小、交通效率将越高。
除了自动驾驶之外,机器学习也可以通过其它方式提高交通效率。比如在摩托车流行的东南亚国家和地区,Google 在地图导航加入了“两轮模式”,让系统能够汇总多元的数据来源,为摩托车驾驶者推荐捷径、小道,从而避免高峰拥堵。
用深度学习带来医疗信息革命 Advance Health Informatics
作为糖尿病的并发症之一,糖尿病视网膜病变 (Diabetic Retinopathy, DR) 侵蚀着患者,一般患病10年才开始出现病变,导致失明。这一病症实际上可预防,有经验的眼科医师往往能通过视网膜眼底扫描观察到先兆。然而,以印度为例,全国存在大约 12 万名眼科医师的缺口,DR 患者往往无医可投,导致大量人口失去视力。
Google AI(原 Google Research)的研究员莉莉·彭博士带领团队,基于卷积神经网络搭建,利用眼科专家标记好的扫描图作为训练数据,最终得到了一个 DR 预估模型。
此前,硅星人/PingWest品玩曾采访报道过这项技术。当时,该模型在发现症状的敏感度 (98.8) 和判断症状的准确性 (99.3) 上,都比人的得分要高(在统计学上这个得分叫做 F-score,普通眼科医生的分数是 0.91,模型 0.95)。
好消息是,Jeff Dean 告诉我们,经过两年的发展,现在新模型更进一步,得分和专门的视网膜眼底医师持平。
这还没完,该项技术的潜力远不止诊断 DR。Jeff Dean 透露,莉莉·彭的团队在这个模型上取得了更卓越的科学成就。正是因为深度学习的泛用型强,现在他们可以用同样的眼底扫描图像,来预测性别、年龄、血压、骨龄以及其他病症的发病几率,并且准确度极高。
这在医疗信息学上是重大的突破,因为它能够补充因为医疗条件限制未能获取的关键信息。最短期和直接的效果就是为眼科医生的诊断和治疗推荐提供更多可参考的数据,长期来看还能提前预测和诊断更多病症(比如心血管疾病)。尽管这并非专业的诊断,但仍足以提前 5 年甚至 10 年,拯救现在的普通人,未来的患者。
通用 AI:打造科学突破的工具 Engineer the tools for Scientific Discovery
以青霉素和X光为例,许多知名的科学突破都存在一定的偶然性。即便如此,人们也一直没有停止试图发现让科学突破持续发生的“永动机”。
Jeff Dean 指出,在更强大计算力的加持下,深度学习可以更方便地投入到更多领域当中。因此,深度学习有成为这样工具的潜力。因为正如前述,深度学习的技巧层出不穷,让神经网络掌握越来越多过去公认只有人类才能掌握的复杂能力。
以 TensorFlow 为代表,这一由 Google 主导并开源的深度学习项目,现在正在被农业种植养殖、工业生产、互联网、医疗金融等多个行业使用,在三大产业中持续促成效率进步。一个例子在欧洲的一座农场,农场主运用了 TensorFlow 搭建养殖监控技术,通过摄像头、动作捕捉等传感器时刻追踪和分析牲畜的健康状况和运动轨迹,显著提高了出栏率。
至于科学突破,前述的视网膜眼底扫描也可以作为一个例子。
前年,Google 宣布了神经架构搜索 (NAS)/AutoML 技术,可以比喻为“用神经网络设计和训练神经网络”,在包括图像识别在内的一些领域超过了手调神经网络的效果。
但是现在,Google AI 已经不满足于已经取得的成就。Jeff Dean 说,他们正在思考一种全新的神经网络形式:一个巨大的、稀疏激活的模型 (a large model, but sparsely activated)。
这种新的神经网络,具备的参数之多,和现有神经网络相比可能是几何级的。但是,当它处理不同任务时,只需要激活少数路径上的节点,并不需要全部激活。这样设计的目的,是让一个神经网络能够执行多种不同的任务——少则数百,多则上百万种,以此显著降低神经网络设计、搭建和训练的计算量和耗时,实现更强的通用性。
Jeff Dean 向硅星人表示,他所描绘的这个新神经网络,确实和人们曾经热议但认为短期内不会实现的“通用人工智能”(general AI) 些许相似。但是他强调,Google AI 的主张是即便在这个新的巨大且稀疏激活的网络内,训练仍然是自我监督的。
2017年,他和几位同事(包括 Geoff Hinton、Quoc Le等 Google AI 顶级学者)以及外部研究伙伴共同提交了这一方向的首篇论文,名为《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer》,呈现了一个超过1370亿参数,拥有数千个子网络的巨大神经网络架构,在语言建模、机器翻译等场景下,用更少的计算量实现了对当前最高水平神经网络的超越。
Jeff Dean 展示了 Google AI 对于这一技术的未来构想:除了优化网络结构之外,Google 可能还将开发新的、面向该网络结构优化的机器学习超级计算机(就像他们为 TensorFlow 设计了 TPU 那样。)届时,新的计算范式将为 Google AI 解决21世纪伟大工程挑战带来更多帮助。
“深度学习正在帮助我们挑战很多重大的难题,它会在科学突破和人类发展的许多领域做出巨大贡献。”Jeff Dean 表示。
0 条评论
请「登录」后评论