联想研究院徐飞玉:人工智能之争归根到底是人才和数据的战争 | AI 科学家谈 A

近年来人工智能领军人物频频接过科技公司的橄榄枝 , 徐飞玉就是其中一员 。
从1998年开始,徐飞玉一直在德国人工智能研究中心(DFKI)工作,该中心是德国顶级的人工智能研究机构,股东包括了、Intel、微软、宝马、SAP、等全球顶级企业 。徐飞玉曾就任该中心首席研究员及语言技术实验室文本分析研究组负责人,直到今年3月,联想CTO、高级副总裁芮勇博士邀请她加入联想,作为副总裁负责联想研究院人工智能实验室的研发工作 。
这几年全球市场对人工智能领军人才的需求急速扩张 。徐飞玉博士对第一财经坦言 , 自己从去年开始就陆续接到很多企业的邀请,但最终还是希望回到中国做一些研究,“把研究结果变为产品是一个非常具有挑战的过程 。”这是徐飞玉的兴趣点,也是她所擅长的 。
徐飞玉博士曾是DFKI分拆公司YocoyGmbH的创始人之一和总经理 。Yocoy研发出30多种面向英语、中文、法语、德语和西班牙语国家旅游市场的多语言交流助手移动应用 。“100多个研发功能 , 到产品里可能只有十个或两个真正有用 , 将研发结果和产品战略连接在一起,并且做成功是非常不容易的 。”徐飞玉博士告诉第一财经 。
人才和数据之争
伴随大数据、分析平台、先进算法的开源以及以及机器学习方法的优化,人工智能已经从实验室走向日常生活,并催生出机器翻译、智能搜索、语音助手等商业应用工具,这些工具成为新一轮产业变革的新动力 , 自然也被科技公司视为布局和角逐的焦点 。
但在徐飞玉博士看来,人工智能之争归根到底是人才和数据的战争 。判断一家公司的人工智能水平,首先要看人才;其次要看是不是拥有自己的数据 , 可以自成平台;然后就是看有没有好的商业模式,能够借助生态系统帮助平台积累数据,形成数据价值链条 。
而这个过程仍有诸多的工作需要“死磕”和积累 。以联想研究院人工智能实验室当下正在研发的人工智能客服系统“联想小乐”为例 , 该应用主要用于解答专业性的PC、移动等硬件设备疑问 , 例如当电脑蓝屏时,系统可以告知用户是在哪一环节出现问题,并指导其解决这些问题 。
这其中就涉及对话系统、语音识别、图像识别等人工智能技术,并且需要与懂业务流程的架构师和数据专家一起工作 。相较于搜索引擎而言人工智能领军人物,用户使用该应用的场景多处于硬件设备出现问题后,所以这套系统必须在短时间内给出更为精准的答案,其中一个很大的挑战就是数据,特别是高质量的标注好的数据 。
在徐飞玉博士看来,理想状态下,如果数据标注的很好,把算法放上去迁移的难度并不大 , 国际上有开源的带标注的数据库,做一定的调理 , 用开源的算法,很快可能就比别人做的更好 。
但是在产品开发过程中,需要用实际的数据,也需要在外面找一些数据 , 这些数据可能是不准确的,甚至是脏的数据 。一方面需要进行数据清洗,然而很多数据都没有标准,更挑战的是开发面对没有大量标注数据的方案和方法 。
另一方面 , 要让机器越来越像人,就必须借助海量数据的持续学习 , 让企业、产品的知识图谱,常识的知识图谱,专业的知识图谱不断成长 。最后如果要做出真正好的方案,经常要把不同类型的数据结合起来 , 例如如何把文字数据和图像数据连在一起人工智能领军人物 , 通过细节关联做出判断 。
“在智慧城市应用中,每天一个地方堵车的原因可能是因为前方的红灯设置的不合理,位置或时间的长短有问题 。要能自动发现和判断这个问题,前提是能把观察车流的视觉传感器数据和城市交通数据相结合 。”徐飞玉举例说 。类似的在智慧医疗中,把CT的图像数据和医生的文字诊断数据进行深度结合,才能有效分析图像并进行自动判断 。
PC互联网、移动互联网时代都出现了流量集聚效应,那么基于人才和数据的人工智能之战,又是否会出现赢者通吃、巨头垄断的局面?徐飞玉坦承这种趋势是会有的 。
“人才是需要资金去支撑的 , 没有一定的资本是着急不来的,同时数据量多的话则可以做更好的应用开发,而现在全部公司都面临一个共同的问题 , 数据化挑战 。”
机器还需学习反问
面对深度学习过热现状,徐飞玉提出深度学习只是机器学习的一个方面,其在端对端的应用上起到了很大的作用 , 但当下的深度学习只能提供最终的决定 。
例如最简单的Yes或No,这是一个黑箱子,实际上如何把机器学习和数据、知识结合在一起,不仅帮助人类做决定,还能告诉人类为什么做出某个决定,目前的深度学习方法还是不够的 。
如果应用到一些关键领域,例如飞行、医疗诊断、国防、安全等,还要增强解析能力 。大数据带给深度学习强而有力的判断能力, 但其实机器若要做到“学习”这件事, 深度学习并不是唯一方法 。
【联想研究院徐飞玉:人工智能之争归根到底是人才和数据的战争 | AI 科学家谈 A】在她看来,语音是信息交流效率最高的一个渠道 , 能够让人机交互更自然 , 让机器更像人,这也是巨头纷纷入局智能音箱的原因所在 。不过从当下发展情况来看,真正具备对话能力 , 尤其是具备反问能力的机器还比较少见 。
例如有四个名为柏林的城市,智能音箱并不会反问是德国首都还是离汉堡很近的小镇 。“语言是多意的,语音更是多义 , 机器人会出现不懂装懂,当机器模拟人的时候,需要理解对方,这就要求对话双方的知识背景不能查太远,需要借助更多数据让机器拥有更多常识、解除误解、学习规则、推理和交互能力 。”徐飞玉博士告诉第一财经 。
人工智能的哲学思考
面对创业公司言必称人工智能和投资机构的争相追逐,徐飞玉博士认为不能一直用投资者的眼光来看待人工智能 , 创始人和团队也不应该被资本的大脑驱动着,而是应该抱有足够的耐心和好奇心,将自己的工作当作人类科技进化过程的一部分来看待 。“科学和创新,需要有信念和坚持 。”徐飞玉强调 。
这或许和她在德国人工智能研究中心多年工作经历相关 。在徐飞玉的印象里,德国人做事极为严谨 , 且习惯以批判的思维去看待所有的解决方案 , 在编写程序前会将问题理解得非常清楚 。
例如会考虑全世界解决这个问题有哪些方法,有哪些算法和工具,各自的优缺点是怎样的,进展如何 。“德国人做事很有方法论 , 受哲学的影响很大 。他们会花费很长的时间来想清楚这些问题,一旦弄清楚执行速度非常快“
相较而言,很多时候国内做事情的速度很快,在将别人想好的事情拿过来做方面比较快 , 急功近利了一些,结果想问题的时间短了一些 。“创新是一个复杂的系统,前人没有做,甚至做了部分的事情,多给这些东西一些时间会做出更多的创新 。“徐飞玉说 。
本文到此结束,希望对大家有所帮助 。