新闻动态

行业动态当前位置:首页 > 新闻动态 > 行业动态 >

李宇明:语言智能与社会进步

来源:北京语言文字工作协会  |  发布时间:2023-01-19 10:54:14  |  浏览次数:

       人工智能发展常如坐“过山车”(Roller coaster)。20世纪50年代开始的人工智能研究,经历过热潮,跌入过谷底,如今又攀上高峰,世界各国以其为新的科技制高点展开激烈竞争,特别是阿尔法GO与围棋冠军对弈,把人工智能带入社会的高光区域。

 

人工智能是对人类智能的模仿。人类智能主要表现在思维能力上,语言是人类思维活动的凭借,是思维成果贮存、传播的载体,故而语言能力决定着思维水平。人类自幼成长,通过获取语言促进思维发展,因各种原因而未能较好获得自然语言者,其思维水平便严重局限。人类的书面语学习和第二语言学习,大大提升了思维品质,比文盲和单语者更具思维优势。思维与语言的关系尽管学界还有不少争论,但语言在思维中的重要地位不能否认。语言智能是人类最为重要的智能,让计算机获取人类的语言智能是人工智能的重要任务。

 

人工语言智能是人工智能皇冠上的明珠,从人工智能中分离出人工语言智能的概念具有重要的理论意义和技术价值。这种分离工作是从周建设教授开始的。我与建设教授已有38年的学术交情,1983年,严学宭先生在华中工学院语言研究所举办语言学理论学习班,我与建设是同窗好友。所以对他的学术之路比较了解,对他的学术见解与成就很是钦佩。他对语义学、逻辑学、语言哲学素有兴趣,进而发展到探讨人脑的概念体系和知识运作,再向前走,步入探究人脑语言智能的境域。在人工智能快速发展的时节,他及时把研究迁移到人工语言智能(以下简称“语言智能”)领域,并在国家语委支持下建立了首家中国语言智能研究中心。中心聘请中国人工智能学会前任理事长李德毅院士担任学术委员会主席,招贤纳士,已成规模。中心聚焦于智能教育,在智能阅读、智能写作、智能评测等领域取得重要进展,并实现了技术落地和产品推广,建造了个性化学习和终身学习的服务平台。

 

教育需要理念,更需要技术支撑。中国是世界上教育规模最大的国家,教育状况决定着人民的福祉和国家的未来。中国教育发展的任务有二:一是提升教育品位,培育高水平人才;二是解决教育不均衡问题,实现教育公平。2020年的新冠疫情逼迫教学迁至网上,随着疫情的常态化,网络教学也会成为新常态,如何打造适用于教学的软硬件环境,如何大规模集聚优质的网络教育资源,如何发展教师团队的网络教育技能,如何利用学生的学习数据实现因材施教,如何科学开展网络教育的评价系统等,成为时代命题。开拓网上教育新地,创建网上教育范式,是提升教育品位、均衡教育资源的重大问题。充分利用语言智能发展网上教学,推进教育信息化由技术化阶段向智能化阶段发展,意义重大。就此而言,周建设团队所建设的智能教育服务平台及其将来的发展利用,是会在中国教育史上竖起一座里程碑的。

 

教育是社会生活之一隅,语言智能在其他社会领域也在发挥着“革命性”作用。当前计算科学的一个重要任务就是进行“人文计算”,试图通过数据与计算来解决许多人文问题,甚至包括人类的情感情绪问题,于是有所谓的“情感计算”。“人文计算、情感计算”,其当前价值不在于解决多少问题,更在于提醒人们重新审视既往的社会观念,发现新课题、新思路、新目标。在这些领域,语言智能也是大有施发能量的空间。

 

语言智能正带社会进入人机对话时代。据估计,某些网络领域机器写作的文本已经占到15%,金融商贸业的网络客服多数是机器值班,自动翻译所取得的成绩更是亮眼。很多领域、很多时候都是在与机器对话,过去,语言是人类的;现在语言也是机器的。“人-机-人”成为常用的交际模式,我们必须有与机器对话的心理准备,并要尽量利用语言智能技术来提升自己的语言能力。人类的进化多是来自工具的异化。我们创造着人工智能,也正在被人工智能异化。异化首先从心理开始,继之是思维的异化,继之是生活习惯的异化,继之是身体生理的异化。

 

在语言智能的发展及其社会应用中,也许需要建立“机器语言行为学”。这门新学问的任务之一,是研究机器说话、写文章、做翻译的特点,以便识别人类的语言行为与机器的语言行为;任务之二是测试机器的语言水平,为不同的语言软件测定其语言能力等级,以此来评价优劣,以此来促进语言智能业的进步;任务之三是建立机器语言的伦理规范,综合利用信息技术、职业道德、法律法规等,将机器的语言行为约束在文明、无害等社会认可的伦理范围之内,为语言智能这辆飞车装上刹车等安全装置。

 

至此,又想起文章开头的话,人工智能的发展还会像坐“过山车”那样,从高峰跌向低谷吗?目前,人工智能的发展主要是数据驱动,计算机利用大数据进行自主学习而获取知识与智能。数据驱动的人工智能纵然马力强大,但也可能会遇到 “天花板”。这“天花板”至少来自两个方面:第一,计算机获取智能的不透明性。谁(人和计算机)都不知它是怎么学习的,究竟能够学到什么?这种不透明性自然令人类忧心,因为不知它会不会危害人类。第二,数据的贫瘠与污染。大数据虽然“大”,但比起人类的知识与智慧还是贫瘠的,特别是缺乏常识。大数据来自于不同时代、不同文化、不同阶层、不同情景,思想意识和语言文明等都存在一些问题,比如“男尊女卑、种族歧视、地域歧视、西方中心主义”等,比如许多脏字眼等。在这种被“污染”的数据中进行学习,不可能如莲藕般“出污泥而不染”。

 

打破“天花板”需要采取“数据与规则”双轮驱动的良性发展模式。数据上,一方面要用较多功夫去“淘洗”,同时要按照“数据是数字经济的关键要素”的思路、用市场规律去集聚数据和共享数据;就“不透明”问题来说,要努力把人类的知识“规则化、数字化”,通过算法升级,使之成为计算机可以利用的数据,达到“规则驱动”的目标。通过“数据+规则”的双轮驱动,有望捅破人工智能发展的“天花板”,不至于再坐“过山车”。

 

与之相关的还有人才培养问题。文理分家的教育模式已经不适合大交叉、大融合的科学发展要求。中学阶段文理分科的做法,极端地不合时宜。大学本科和研究生教育都要进行深度的文理融合。不仅文科生需进行必要的理工科教育,理工科学生也需要文科教育。特别是人工智能的课程,应当成为基础教育的基础课程,成为大学各专业的重要课程。让学生了解人工智能发展趋势,具备人工智能意识,掌握必要的计算科学的方法,借助人工智能处理本专业问题,也有意识利用专业优势推进人工智能发展。2020年7月29日,全国研究生教育视频会议召开,部署新技术时代高端人才培养问题。会后决定把交叉学科新增为第14个学科门类,说明了对人才进行大交叉、大融合培养的重要性和急迫性。语言智能是诸多学科的的交叉,需要交叉学科培养出来的人才做支撑。

 

语言智能正在快速发展。周建设教授主编的《语言智能研究》(第1辑),不仅用大量材料报告了这一领域快速发展的现况,还尽量呈现相关方面的发展趋势。细读此书,可明现状,可测未来。“消极性”读者,只是被动地获取书中知识,而“积极性”读者,通过阅读能够创造新知,比如对语言智有更深入理解,比如在本专业、本岗位积极利用语言智能成果,甚至是帮助人工智能的发展。盼望有更多的积极性读者,也期待今后还能读到《语言智能研究》的续集。

网站首页  |  关于协会  |  新闻动态  |  会员风采  |  语文建设  |  语言应用  |  语言博览  |  友情链接  |  联系我们

Copyright © 2016  北京语言文字工作协会  版权所有
地址:北京市东城区和平里七区16号楼院610室  电话:010-84504550
京ICP备16040353号-1 京公网安备11010102004415