第60期
讲座时间:11月21日 19:10 -20:10
讲座地点:海韵教学楼304
题目:机器写作技术与应用
讲者:万小军
摘要:机器写作(也即文本自动生成)是自然语言处理领域的一个重要研究方向,实现机器写作也是人工智能走向成熟的一个重要标志。简单来说,我们期待未来有一天计算机能够像人类一样写作,能够撰写出高质量的文章,包括各类新闻、诗词歌赋等。本次报告将总结机器写作技术与应用现状,并介绍本团队在机器写作方面的研究进展,最后指出机器写作所面临的挑战以及可能的应对方法。
简介:万小军,北京大学计算机科学技术研究所研究员/教授,博士生导师,语言计算与互联网挖掘研究室负责人,在北京大学获得学士、硕士与博士学位。研究方向为自然语言处理与文本挖掘,研究兴趣包括自动文摘与文本生成、情感分析与语义计算等。担任计算语言学顶级国际期刊computational linguistics编委,tacl常务评审,emnlp-ijcnlp19程序委员会主席,曾多次担任自然语言处理与人工智能领域一流与重要国际会议领域主席(area chair)或高级程序委员(spc),包括acl、naacl、emnlp、ijcai、aaai、ijcnlp等。荣获acl 2017 outstanding paper award (杰出论文)与ijcai 2018 distinguished paper award (最佳论文)等多项荣誉或奖励。与今日头条合作推出ai写稿机器人小明(xiaomingbot),与南方都市报合作推出写稿机器人小南等机器写作应用系统。
第61期
时间:11月21日 20:30- 21:30
讲座地点:海韵教学楼304
标题:社交文本的理解
讲者:李菁
摘要:人的社会属性决定了人与人的交互已经成为日常生活中不可或缺的部分。现如今,社交平台的迅猛发展已经深刻变革了人的交互方式,并且成为了个人抒发情感与交换信息的重要通道。这一变革导致了用户原创文本在社交平台上的爆炸性增长,这种海量产生的文本远远超出了人类阅读和理解的极限,从而引起了社会对于自动理解社交文本技术的迫切需求。然而,传统的自然语言处理技术虽然在常规文本(诸如新闻与科学论文)收获了巨大的成功,在处理社交文本时候会受到严重的数据稀疏性问题的困扰。社交文本的数据稀疏性主要产生自社交文本简短、口语化、非正式的特点,这使得数据不能够为模型提供丰富而有效的特征。这个讲座将讨论如何有效建模用户响应与交互信息,以期丰富短文本上下文,这种缓解数据稀疏性的思路被证明在文本摘要、主题抽取、与关键词抽取等任务上十分有用。从另一方面来说,分析消息的内容也能够更好地理解用户在交互过程中的行为,从而使得下游的任务受益。这个讲座以微博对话推荐为例,展示了对话内容和用户行为如何联合作用于针对用户感兴趣的对话的识别。
个人简介:李菁博士目前是腾讯ai lab自然语言处理中心的高级研究员。于2017年7月获得香港中文大学系统工程与工程管理系的博士学位。在博士生涯开始前,于2013年7月从北京大学智能科学系获得本科学位。研究大方向主要为自然语言处理、社会计算和机器学习,细化的研究方向包括社交媒体文本上的对话建模、主题抽取和自动摘要。曾经在自然语言处理顶级会议及期刊acl、emnlp、naacl及cl上发表学术论文,同时,也曾经获邀成为自然语言处理前沿会议acl、emnlp、eacl、naacl和aaai的评审委员会成员。
外事秘书 在
提交