首页 -> 2015年度求是奖

孙栩

 

        我研究的领域是人工智能,研究方向是自然语言处理、机器学习。人工智能的理想是让机器拥有人类一样的智能和情感,就像Big Hero中“萌萌哒”的大白。自然语言处理是人工智能的重要研究方向,其目标是让机器理解和处理人类的语言,让机器和人类无障碍地通过自然语言来进行交流。自然语言处理在国际学术界和产业界正发挥着日益重要的影响,其研究成果正日渐应用于人们生活的方方面面。一个典型的应用例子是机器翻译。比如我想去法国旅游,但是看不懂法语的导游网页,此时机器翻译(例如Google提供的网页翻译服务)可以帮助把法语网页自动而智能地翻译成中文。机器翻译并非想象那么简单,需要词性标注、实体识别、句法分析、语义理解等诸多基础智能技术的支持。这些基础智能技术也是我的重要研究内容。

        自然语言处理的难点之一是计算机缺乏人类的知识体系和人类智能,难以真正理解未知、模糊、多噪音的自然语言表达。目前我的关注点是结构化自然语言处理,以及更本质的结构化预测问题的基础理论和方法。我研究新的结构化预测理论和算法,把自然语言处理转化为数据驱动的知识、特征、参数的结构化学习问题,从而让机器智能地对未知、模糊、多噪音的自然语言数据进行解析。通过理论研究,希望能够揭示自然语言处理和结构化预测的本质规律。通过算法设计,希望能够高效处理多元化的自然语言任务。所提出的理论和方法在自然语言处理多个任务上取得了显著效果,并进而提高了相关应用系统的性能。

        自然语言处理、结构化预测还有很多富有挑战性的问题需要研究和解决。在未来的工作中,我将继续深化基础理论、方法的研究和创新,建立规模化的科研团队,希望推动自然语言处理、机器学习相关领域的科研进步。

 

 

        孙栩,1983年出生,分别于华中科技大学(2004)、北京大学(2007)、日本东京大学(2010)获得计算机科学的学士、硕士、博士学位。曾在微软公司亚洲研究院(2005)、美国研究院(2009)担任实习生。从2010年到2012年,先后在日本东京大学、美国康奈尔大学、香港理工大学担任研究职位。2012年开始在北京大学信息学院任研究员、博士生导师;2012年入选北大“百人计划”;2013年入选中组部“青年千人”计划。 

       

        孙栩研究方向是自然语言处理、机器学习等人工智能技术,特别是结构化自然语言处理和更本质的结构化预测问题的基础理论、方法、应用。比如,最近的工作是提出了新的理论框架—“结构正则化”。该理论框架在学界第一次定量解析了结构化预测的结构复杂度和过拟合风险之间的数学关系。基于该理论和方法实现,很多自然语言处理任务可通过结构分解变得更简单、更准确、更快速。近期的另一创新是提出“隐变量结构化感知器”学习模型,证明了其边界可分属性和收敛属性,并展示了自然语言处理的实验效果。提出的理论和方法在词性标注、实体识别、切词、搜索引擎检索纠错等多个实际应用任务上达到或超越了领域最好效果。科研成果发表在顶级国际会议和期刊(如,CL, TKDE, ACL, NIPS, IJCAI等) 。

Copyright © 2013 Qiu Shi Science and Technologies Foundation. All rights reserved.

香港中環皇后大道中31號陸海通大廈12樓