百度王海峰:语言智能的发展将推动人工智能技术加快落地

?

“理解和应用自然语言是人工智能的核心问题之一。大数据,机器学习,深度学习和知识绘图等技术的发展正在语言和智能的发展上取得突破。“4月20日,第十届中国电子信息技术第四届年会,王海峰,高级副总裁百度,人工智能技术平台系统(AIG)和基础技术系统(TG)发表了题为《语言与智能》的演讲,以人工智能和翻译为例。技术的演变,解释了最近语言和知识技术与大数据,深度学习和其他技术相结合所带来的突破,以及技术趋势和挑战。

img_pic_1555989391_0.jpg

王海峰是人工智能研究和应用领域的领导者,尤其是在自然语言处理领域。他在国内外学术界和工业界享有盛名。他开创并开发了自然语言处理,机器翻译,语音,图像,深度学习,数据挖掘,知识地图等技术方向,领导百度AI获得大量领先的行业技术成果,推动百度大脑向外界开放。是的,该行业被誉为学术和工程领域的稀有科学家。他领导“百度脑核技术与开放平台”的研发,专注于人工智能和大规模工业应用前沿技术的研发,打造世界一流的人工智能开放平台,帮助他们发展国家人工智能产业,促进各行各业。智能升级为国家创新驱动发展战略提供了强有力的支持,并获得2018年中国电子学会科技奖科技进步奖一等奖。

王海峰说,从总体上讲,人工智能是指让机器像人类一样具有听觉,视觉,语言和行为能力,进行逻辑计算和推理规划,并在知识学习的基础上继续发展。

语言是人类思维的媒介,是人类独有的高级智力活动。早期的简单符号,Oracle,纸质书籍和现代互联网上的文本,语言和文字的载体使知识得以浓缩和传递。可以说,语言和文字促进了人类文明的发展。因此,如何理解和使用自然语言是人工智能需要解决的核心问题之一。目前,大数据,知识地图,机器学习,深度学习等技术发展迅速,与自然语言处理紧密结合,促进语言智能的不断发展和突破,并越来越多地应用于各个行业。

自然语言处理是人工智能之冠的宝石,填补语言空白的机器翻译是自然语言处理最典型的应用技术之一。王海峰已经深入参与这个领域近30年。他从机器翻译发展史上介绍了人工智能技术的发展和演变。

从现代计算机诞生之初,一些人提出了使用计算机进行语言翻译的想法。在早期的发展过程中,研究人员使用理性主义,规则系统和知识工程方法进行研究。王海峰自1993年以来一直从事机器翻译研究。最初,他采用了基于规则的方法,并在国家“863”评估中获得第一名。早在1999年,王海峰就在他的博士论文中开始探索神经网络机器翻译的可能性。但是,由于当时计算能力和数据的限制,他转向统计机器翻译和大规模规则翻译系统的结合,并开创了先河。提出了一种关键的语言翻译方法来解决小语言翻译语料库的稀缺问题。 2008年,王海峰对统计机器翻译系统的研究与开发参加了国际演讲机器翻译评估大赛IWSLT。在5个任务的15个评估指标中,共获得12个第一和第三个优秀结果。明确的技术领先。

在2010年加入百度之后,他带领团队整合统计和规则,实例和神经网络,实现多方面的技术创新,为数亿用户创建百度翻译服务,并启动互联网神经网络翻译系统。 2015年目前,百度翻译可以支持全球28种语言的翻译,涵盖756个翻译方向。超过150,000个第三方应用程序访问百度翻译API,翻译字符数超过1000亿。百度翻译荣获2015年度国家科技进步二等奖。在2018年的百度世界大会上,百度发布了世界上第一个集预测和可控延迟在内的语音实时翻译系统。这是自然语言处理的重大技术突破。

王海峰说,从最初使用规则系统到统计机器学习方法,再到算法和计算能力的解决方案,机器翻译的发展一直在攀升到一个新的水平。人工智能的发展与此类似。通过各种方法的探索和实践,出现了低谷和高潮,总的趋势是持续改进。

近年来,深度学习的兴起及其与大数据的整合导致了人工智能的快速发展。

在自然语言处理领域,深度学习模型比传统的机器学习模型具有更强的数据学习能力,使得基于深度学习的依赖学习等自然语言处理系统的准确性大大提高。

目前,深度学习领域主要包括三种学习范式:强化学习,监督学习和非自我监督学习。非监督学习可以类似于人类学习,是一种重要的学习方法。

自我监督学习导致了大规模无标记语料库语言模型的发展。最近,谷歌和百度分别提出了无监督的文本预训练语言模型BERT和ERNIE,这将把NLP任务的性能提升到新的高度。百度提出的知识增强型ERNIE模型通过对大量数据中的实体概念等先验语义知识进行建模,来学习现实世界的语义关系。与基于单词的语义建模的Google BERT相比,ERNIE直接对先前的语义知识单元进行建模,并通过海量文本数据来学习实体之间的语义关系。这种融合知识的语义建模极大地增强了模型的语义表示,可以用于多种公共中文数据集上的自然语言处理任务,如语言推理,语义相似度,命名实体识别,情感分析和问答匹配。 ERNIE取得了比BERT更好的结果。

依托深度学习技术的发展,语音,图像等传感技术取得了长足的进步,但认知技术的突破将越来越依赖于知识,需要提高知识的使用和大规模的知识地图。在物理世界,人类社会和网络空间中,收集了大量不同的,异构的,多模态的数据。百度使用大量数据,如无标签的大数据开放领域知识挖掘,自动知识系统扩展和知识集成。已经构建了超大规模的知识地图。目前,百度拥有世界上最大的多异构知识地图。除了数以亿计的实体和数千亿的事实外,百度还可以满足90%的用户需求。对于不同的应用场景和知识形式,百度也建立了关注点。地图,行业知识地图,POI地图,事件地图和许多其他知识地图。例如,在医学领域,可以从诸如医疗记录的原始文本中提取物理和多关系,并构建文本,并最终构建医学地图,结合医学大数据和医学认知计算,并应用于医学临床助理决策服务。 in。

多模态知识与语言,视觉和其他技术相结合,发展到“多模式深层语义理解”阶段。例如,基于知识地图的知识理解技术可以从视频中提取结构化语义知识并真正“理解”视频。

语言理解技术不断发展,并通过知识地图,深度学习等技术的整合,不断提高各种应用的智能。

王海峰在演讲中介绍了百度创新的知识地图,自然语言处理和深度学习技术的整合,开发了一个智能搜索引擎,可以深刻理解用户意图,准确满足搜索需求,提供更丰富的知识内容,结合语音,图像,AR等传感技术功能可以更轻松地与用户交互,为用户提供更准确,更有效的信息服务。

例如,用户用自然语言搜索“谁是林徽因的丈夫的父亲”。智能搜索引擎可以理解用户的意图,并结合知识地图以图示的形式向用户呈现答案“梁启超”。再例如,用户搜索“草头下方的句子的句子是什么”,智能搜索引擎可以向用户提供诸如发音,笔画和“苟”的解释之类的丰富信息。

除智能搜索应用外,百度还提供基于语言理解和生成技术的智能写作功能。智能写作适用于金融,体育,天气,热点,娱乐等多个领域的辅助和自动写作,极大地提高了创作效率。例如,基于结构化股票数据,可以生成关于股票市场的新闻新闻。具有视觉技术的智能春联可以通过刷脸,生成特征词,然后基于神经网络生成技术创建弹簧对联,将人工智能技术融入流行文化中来检测人物性别,年龄,笑容度,个性特征等。和娱乐。生活。

智能客户服务是一种结合了自然语言处理,知识映射和语音技术的行业解决方案。在智能客户服务场景中,基于语音语义集成技术,百度大脑可以准确识别用户的话语,了解用户的意图,然后通过授权行业知识地图了解业务流程,为用户提供相应的服务。整个服务流程流畅自然,实现与用户的沟通,提高业务效率,满足用户需求。

百度领先的语言和知识技术不仅广泛应用于智能搜索,深度问答,对话系统,智能写作,机器翻译等领域,为用户提供更智能的体验,满足用户对信息和服务的需求,并且还通过百度。大脑平台完全开放,以促进行业应用和创新。

当然,自然语言理解技术也面临着诸如稀疏数据,知识的低效使用以及与场景相结合的实用研究等挑战。但是,王海峰说:“随着技术的发展,我们将更深刻地理解自然语言,掌握知识,促进人工智能发挥更大的价值,为人类社会的发展提供更大的帮助。” (一鸣)