似乎一夜之间,在科技业界最流行的词语从“互联网+”、“大数据”变成了人工智能。不仅百度、阿里巴巴和腾讯三大中国互联网巨头直接开始在这方面较劲,每家创业公司也都把自己和人工智能公司扯上了关系。
和中国不同的是,硅谷表面上虽然也吹起了人工智能的泡沫,硅谷的一线投资人和公司创始人却认为,这里的人工智能创业“干货”浓度还是很高的。
上周在硅谷,PingWest品玩和中国领先的大数据公司 TalkingData 联合举办的中美人工智能分享会上,我们请到了多位人工智能技术专家、公司创始人和投资人来分享他们的观点。
私募股权基金华山资本 (WestSummit Capital) 的创始合伙人余军 (John Yu) 很早就发现了硅谷人工智能创业的兴起,他在 2015 年成立了一家风投基金 Oriza Ventures 主要投资以和机器智能相关的早期科技企业。在对人工智能公司制定投资决策时,他认为最重要的是看到这家公司是否具有独特的核心优势。
而依托于硅谷以及美国、加拿大优秀院校的研究实力,很多从学校项目脱胎成立的人工智能科技公司都是具备这样的先发优势的。比如 Oriza Ventures 的投资组合之一,最近在硅谷特别热门的自动驾驶创业公司 Drive.ai,它的创始团队就来自于斯坦福大学人工智能实验室。“这些人是最早做自动驾驶算法研究的人,是将深度学习和神经网络应用到自动驾驶方面的先驱。他们的核心优势是用非常高效的方式标记和训练有价值的驾驶数据。”
Drive.ai 的使命是用深度学习技术来开发出下一代自动驾驶汽车的“大脑”,这和其他“基于规则”(rule-based) 流派的自动驾驶技术都不太一样,在处理未遭遇过、未编程过的场景时能力更为突出。更有趣的是,当其他自动驾驶公司致力于让汽车安全地跑在路上的时候,Drive.ai 关注到了另外一件可能更重要的事情:让自动驾驶汽车和共享道路的汽车、行人和自行车骑手交流,用显示屏告诉他们“我停车了,你可以放心穿过马路”等类似的信息。这其实需要自动驾驶系统的表现稳定性极高,达到可预估的水平。
该公司自己开发了了一个定制化的数据标记工具,可以不断优化整个数据工作流程,进行高质量的数据分类。他们使用深度学习来让同一个任务可以同时进行多个分类,把输出结果整合到一起后,就可以产生高质量的标记。他们现在数据标记的速度已经是大公司的 20 倍,这也就意味着可以有更多数据可以“喂”给算法引擎学习,从而让汽车可以快速处理新的道路、学习新的使用场景,随着训练数据的增加而持续提高性能。如果你对 Drive.ai 的技术感兴趣,前几天我的同事刚乘坐他们的汽车在硅谷跑了一圈,你可以看看她的体验报告。
余军认为,正是因为 Drive.ai 有这样的核心优势,才在茫茫的人工智能、自动驾驶创业热潮中脱颖而出,成为值得投资的对象。“我们看到了许多的公司,它们的技术、算法,甚至是(自动驾驶)汽车跑在路上,但关键的不是一家公司有什么算法和多少数据,而是它的算法和数据的质量有多高,处理起来效率怎么样。”
本次活动上,另一家公司也在通过机器学习的方式提高编程的效率。2014 年,亚当·史密斯 (Adam Smith) 发现软件工程师的工作效率仍有提高的空间,他们在编程时仍需要偶尔切换到其他网站和搜索引擎上查找文档、代码片段等,而现有开发工具的代码自动完成 (Code Completion) 功能还很“蠢”(按照 a-z 字母顺序排列,通常不是程序员想要的)。于是这位 Dropbox、Cruise 等公司的天使投资人在 2014 年再度创业,成立了 Kite,致力于开发一套更智能的编程工具。
Kite 本质上是一个代码编辑器扩展 (copilot),支持 Atom、Sublime Text 、PyCharm、Intellij 等编辑器,它的核心优势是该公司基于机器学习技术内部开发的类型推断 (type inference) 引擎,能够更准确地判断程序员的意图,从 Google、GitHub 和 Stack Overflow 等网站上自动抓取正确的片段,实现更好的代码自动完成;点击一个代码片段还可以在 Kite 界面里打开代码对应的文档,省去了切换窗口→搜索文档的工作量,对于一个熟练的软件工程师来说大概可以省去 15 秒到半分钟的时间。“我们参考了市面上已有系统的原则,加入了数据驱动的方式来开发类型推断引擎。这种方式让我们的代码自动完成功能推荐正确函数类型的几率比其他竞争对手高 34%。”史密斯说。
史密斯不太经常公开说“Kite 是一家人工智能公司”,尽管 Kite 的核心技术是机器学习。对于硅谷人工智能公司来说,“人工智能”这个词的意义不在于在宣传,而在于用机器学习、神经网络的方式去解决问题、实现功能,带来效率上的提升,创造新的业务模型。
Omniscience 就是这样一家公司。在本次活动上,创始人苏尼尔·拉瓦特 (Sunil S. Rawat) 介绍,Omniscience 的主要业务是开发复杂的机器学习算法,提供给金融、保险等传统行业的客户,通过数据洞察帮助它们建立更好的风险评估模型、营收模型、用户建档和在现有的业务上节省成本,通过数据洞察开发出新的业务。该公司目前拥有超过 4EB (40 亿 GB)的数据。
该公司的算法技术最早来自于美国政府情报和军方研究单位,现在也被多家财富500 企业所采用。拉瓦特透露,有保险公司正在使用 Omniscience 的算法,对重大灾难给保险业造成的冲击进行建模,以便制定预备方案,更平稳地渡过真正灾难发生时的挤兑潮。
“在一天中的不同时段发生同样的灾难,造成的人身和财物损失规模不同,最后就像蝴蝶效应一样,对保险业的冲击程度也很不一样。另一个案例是全球变暖,导致了越来越多的极端气候事件。从过去几年一次的飓风到现在一年好几次、几十次,保险和金融公司到底面临什么样的风险,我们用机器学习算法帮他们看清。”拉瓦特说。对于这些公司而言,提高 0.1% 的效率,就意味着数亿美金的成本节约。
自从上世纪的五代机、专家机器时代落幕,人工智能研究在中间的 20 多年里处于低潮期,直到近几年神经网络技术实现性能大幅度增长,才迎来了新的爆发。在这次 PingWest品玩和 TalkingData 联合举办的中美人工智能分享会上,“人工智能技术如何与具体产品结合”成为了最热门的讨论话题 —— 人脸识别技术能在金融活动中提高安全度、降低风险,自然语言技术能让计算机取代人工提供更好的客服,自动驾驶技术有潜力取代人类司机,降低交通事故的发生和致死率 …… 当人工智能与传统行业发生碰撞时,将会带来更实际的意义。
0 条评论
请「登录」后评论