2019自然语言处理前沿论坛:聚焦机器“读、写、说、译”,探寻NLP未来之路

社会新闻 阅读(895)

人工智能的本质是使机器将世界和世界视为人类。以语言和知识为研究对象的自然语言处理(NLP)技术是人工智能的核心问题之一。 5月26日,百度,中国计算机学会中国信息技术委员会和中国信息社会青年工作委员会联合举办了“2019年自然语言处理前沿论坛”。

百度高级副总裁兼ACL博士王海峰博士为论坛致开幕词。他说:“语言是人类思维和交流的载体,也是人类知识凝聚和传承的载体。自然语言处理技术不仅需要算法,计算能力和数据,还需要不断巩固知识,需要语言处理和我们。理解世界和改造世界的过程是结合在一起的,因此创新突破还有很多空间。“他希望通过这个论坛,年轻学者能够加强交流,碰到新的火花,促进自然语言处理的发展和产业化。这个过程,帮助我们在人工智能时代让我们的生活更美好。

本次论坛的主题是“阅读,写作,口语,翻译机器 - 寻找NLP的未来”,包括五篇关于语义计算,自动问答,语言生成,人机对话和机器翻译的专题报告,以及特邀嘉宾对话会。该论坛汇集了来自学术界和工业界的年轻专家和学者,共同探讨NLP领域的最新技术进步,工业应用和发展趋势。它旨在促进产业,学术和研究的深度融合,促进自然语言处理技术的进步。

“语义计算”研究如何使用计算机来表示,分析和计算自然语言的语义,从而使机器具有理解语义的能力。哈尔滨工业车辆万翔教授介绍了动态字矢量的技术进步。该技术可以根据上下文更好地处理单词的多义性,大大提高多任务自然语言处理的准确性。复旦大学邱锡鹏副教授介绍了学习情况。最新进展分析和比较了当前主流模型的基本原理,优缺点,探索如何更好地整合局部和非局部语义关系,如何更好地整合先验知识,以及简化当前复杂的网络模型。加速。北京大学研究员孙伟开展了稀疏深度学习研究,提出了简化有效的算法来简化神经网络。仅使用全梯度的子集来更新模型参数,这极大地降低了训练和解码复杂度。百度首席架构师白玉介绍了百度最近提出的基于实体和短语知识的知识增强语义表示模型ERNIE,并在语言推理和语义相似性方面取得了显着的进步。

“自动问答”主题探讨了机器的“阅读”能力,允许机器阅读文本,然后回答和阅读与内容相关的问题。机器阅读理解可以使机器具有从文本数据获取知识和应用知识的能力。它是问答领域的关键技术之一。中国科学院自动化研究所副研究员刘康介绍了文本阅读理解的基本框架和方法。他说,建立合理的数据集对于阅读理解任务非常重要,如何更好地整合知识是未来的重要研究方向。百度高级研发工程师刘钊介绍了具有深度融合文本表示和知识表示的KT-NET模型,以及百度为实际应用发布的中文阅读理解数据集DuReader 2.0。基于此数据集,百度,中国计算机学会和中国信息学会连续两年对机器阅读理解进行了综述,共同推动了中文阅读理解技术的进步。

“语言生成”主题侧重于如何以人类等自然语言表达和创建计算机。北京大学万晓军教授介绍了自然语言生成(NLG)技术和应用的最新进展,指出自然语言生成目前面临两大挑战,首先是生成文本的质量评估,其次是缺乏并行数据。如果这些问题得到解决,将极大地促进自然语言生成的发展。他还说,目前的文本生成与人类存在很大差距,特别是在综合利用知识方面。百度首席架构师白欣介绍了百度在语言生成技术方面的创新和应用,并提出了基于规划,信息选择和端到端的各种模型,这些模型是在文章生成,抽象生成等任务中获得的。和诗歌生成。效果很好。此外,百度还推出了智能写作平台,通过提供自动书写和协助写作技巧,提高内容创作的效率和质量,为智能创作领域提供更多可能性。

“人机对话”主题探讨了如何在计算机和人类之间进行对话。清华大学副教授黄敏烈回顾了人机对话的发展。经典对话系统大多采用强语义方法,而现代神经网络方法则基于数据驱动和概率统计开发弱语义方法。语义理解始终是人机对话中难以克服的问题。如何更好地结合数据和知识是该领域需要协同工作的方向。百度研发架构总监孙伟介绍了百度最新发布的智能对话系统培训和服务平台UNIT 3.0。从建立技能,建立知识,整合技能和知识等方面,他发布了几项核心技术和工具,大大减少了核心技术和工具的数量。对话系统的定制成本。

“机器翻译”是指使用计算机在不同语言之间进行转换和生成。填补自然语言处理领域的语言空白是一项重要的技术。清华大学副教授刘洋首先介绍了神经网络机器翻译的基本原理,并指出虽然该方法取得了很大进展,但仍面临诸多挑战。刘洋介绍了他们在知识驱动,可解释和健壮的神经网络机器翻译方面的最新发展。百度人工智能技术委员会主席何中军介绍了机器同声传译的主要挑战和最新发展,指出当前机器同步通信在技术,数据和评估三个方面面临挑战。结合百度的研究成果,现场采用了百度翻译AI同声传译的最新研发成果。现场聆听者使用手机扫描会议二维码,并可实时收听翻译。

在讨论了五大主题后,车万祥,邱锡鹏,黄敏烈,刘洋,百度高级科学家陆亚娟和百度PaddlePaddle首席架构师于海海发起了关于“NLP的未来”的高端对话。 “NLP在过去五年中的突破”,“NLP发展趋势和未来5 - 10年的突破方向”的内容得到了极好的分享。他们认为NLP在过去五年中在数据,模型,算法和其他方面取得了突破。中国在学术界的NLP研究和工业化应用处于国际社会的最前沿。近年来,国际顶级会议的论文数量急剧增加,论文质量也在不断提高。与此同时,我们还需要进一步加强前瞻性和原创性的工作。中国NLP的发展潜力不容小觑。在谈到未来的发展趋势时,嘉宾们表示,进一步整合知识,多模态,探索更加人性化的学习机制,将进一步提升NLP领域。

自然语言处理被誉为人工智能之冠的宝石。随着自然语言处理能力的不断发展,人工智能也在不断完善。自然语言处理技术广泛应用于智能搜索,深度问答,对话系统,智能写作,机器翻译等领域,为用户提供更智能的体验,满足用户对信息和服务的需求它越来越多地应用于金融,服务,零售和制造等行业,以促进行业的智能化发展。 NLP的未来是什么?可能没有标准答案。但我们始终相信技术的力量。探索未来的无限可能性,正如王海峰所说,随着科技的发展,人们将越来越深刻地理解自然语言,掌握知识,促进人工智能发挥更大价值,为人类社会的发展提供更大的帮助。

http://promimg.xtlbxg.com.cn