陆俭明:顺应科技发展的大趋势语言研究必须逐步走上数字化之路


陆俭明教授

 陆俭明,现任北京大学中文系教授,博士生导师,兼任国家语委咨询委员会委员、国际中国语言学学会会长,以及香港中文大学、北京师范大学、北京外国语大学、北京语言大学、武汉大学、上海财经大学、山东大学等17所高等院校兼职教授。曾任世界汉语教学学会会长、中国语言学会副会长、北京大学汉语语言学研究中心主任、北京大学文科学术委员会委员、北京大学人文学院学术委员会委员、新加坡教育部课程发展署华文顾问。独立完成、出版的著作和教材共6部,发表学术论文、译文、序文等近250篇,内容涉及现代汉语的本体研究和应用研究。自1992年以来,先后获得省部级以上的奖项有12个。自1981年以来,曾先后40余次应邀赴美国、日本、法国、挪威、泰国、韩国、新加坡、德国、法国、荷兰、马来西亚、加拿大、葡萄牙、越南以及我国港澳台等17个国家和地区任教、进行学术访问或出席国际学术会议。

摘 要:如今人类社会已逐步进入数字化时代。数字技术的发展和应用已经成为驱动当今社会经济和科技文化发展的新动能,数字化将进一步引发一场范围更为广泛的产品革命、生活革命。各个学科的学术研究都将逐步走上数字化之路,语言研究也不例外。当今人工智能飞速发展,而其发展需要有众多学科的支撑;语言学却在人工智能的发展中有被边缘化的倾向。但这也引发语言学人的反思,也让语言学人从中看到了语言研究和语言学发展的曙光——要按“语言学+”的模式走与其他学科交叉融合之路,要逐步让语言研究走上数字化之路。

关键词:语言研究; “语言学+”模式; 数字化时代; 语言学数字化; 学科的交叉融合; 

1.数字化是科技发展的大趋势

大家都已经知道,当今人类社会已逐步进入云计算、大数据、移动互联网和万物互联的信息化时代。但我们同时要知道,如今人类社会也正全面进入数字化的时代。

所谓数字化,简单地说就是“将信息内容用数字形式表示”。说得具体一些,数字化就是将任何复杂多变的信息,包括物体形象、影像、语言、文字、声音、色彩、热量、速度或气味等我们所能感觉到的、意识到的信息/信号,转化为一串分离的单元,运用模数转换器转换成以01表示的一系列可量度的二进制数值(包括数字、数据),然后将其引入计算机内部,即存储在计算机和网络中,并通过网络进行数据传输,再基于数据建立起适当的信息处理模型,进行统一计算处理。这可以说是信息数字化及其应用的基本过程。在这过程中将运用到多种高科技技术,譬如计算机软件技术、微电子技术、光纤技术、光电技术、超大规模数据库技术、网络技术、分布式处理技术,等等。如今,数字化不仅是计算机的基础,不仅是软件技术的基础,不仅是多媒体技术、智能技术的基础,也不仅是信息社会各种自动化技术的基础,而且各行各业都在实施数字化。

现在整个世界,特别是发达国家和一些发展中国家,都在向数字化方向转型。据媒体报道,美国在20世纪90年代初就提出了这个问题,只是当时没用“数字XX”这样的说法。2005年美国总统信息技术咨询委员会(PITAC)发布的报告中进一步指出,21世纪在经济上最有前途的研究前沿都有可能通过熟练掌握先进计算机技术并且运用该技术得到解决,计算思维、计算技术的发展可以整体上推动美国所有学科的发展,保证它全方位的竞争力。到2018年,美国进一步发布了《数据科学战略计划》《美国国家网络战略》和《美国先进制造业领导力战略》。2018年,欧盟在数字经济领域发布了《欧盟人工智能战略》《通用数据保护条例》《非个人数据在欧盟境内自由流动框架条例》《促进人工智能在欧洲发展和应用的协调行动计划》《可信赖的人工智能道德准则草案》等一系列政策。在英国,英国政府于20173月发布了《英国数字化战略》,提出:(1)为英国建立世界一流的数字化基础设施;(2)为每个人提供掌握其所需数字化技能的途径;(3)帮助每一家英国企业顺利转化为数字化企业;(4)释放数据在英国经济中的重要力量,并提高公众对使用数据的信心。到2018年,英国在数字经济领域又发布了《数字宪章》《产业战略:人工智能领域行动》《国家计量战略实施计划》等一系列行动计划。2018年,法国在数字经济领域主要发布了《法国人工智能发展战略》《5G发展路线图》《利用数字技术促进工业转型的方案》等一系列数字经济相关的前沿技术政策。2018年,德国在数字经济领域发布了《联邦政府人工智能战略要点》和《人工智能德国制造》;同时发布了《高技术战略2025》,其中明确提出将推动人工智能技术的应用。这里特别值得注意的是,2020518日,法国总统马克龙与德国总理默克尔在举行视频会议后共同宣布,将推出一项规模庞大得惊人的“欧洲复苏计划”(1)。这项复苏计划的第三条明确提出要“加快数字转型”(2)2018年,日本发布了《日本制造业白皮书》《综合创新战略》《集成创新战略》《第2期战略性创新推进计划(SIP)》等战略和计划,其中详细阐述了推动数字科技和数字经济发展的行动方案。俄罗斯也抓紧发展数字经济。20177月,俄罗斯政府推出《俄罗斯联邦数字经济规划》。再说发展中国家印度。20157月,莫迪政府就提出“数字印度”倡议,计划以“印度制造”和“数字印度”两驾马车引领国家未来。而韩国早就提出了“数字政府建设”,要求管理网络化、办公自动化、政务公开化、运行程序优化,从而使政府决策科学化、社会治理精准化、公共服务高效化以及政府治理民主化。2017年韩国行政自治部和信息化振兴院更共同发布了《2017年电子政府10大技术趋势》报告,宣布将电子政府逐渐发展成为结合数据分析、机器人技术,提供更周到服务的“以数据为中心的政府”(3)

我们国家也比较早地注意到了数字化问题。特别是在2017128日下午,中共中央政治局专门就实施国家大数据战略进行集体学习。习近平在会议最后的讲话中强调,大数据是信息化发展的新阶段。我们要推动大数据技术产业创新发展,要构建以数据为关键要素的数字经济,要运用大数据提升国家治理现代化水平,要运用大数据促进保障和改善民生。总之,“要实施国家大数据战略加快建设数字中国”。最近大家会听到一个新词语“新基建”,这是“新型基础设施建设”的简称。这是201812月召开的中央经济工作会议上提出的。2019730日中央再次强调,要加快推进信息网络等新型基础设施建设。而在今年2020年,国务院常务会议、中央深改委会议、中央政治局会议等顶层会议上先后提及了“新基建”建设。上述会议中所指的“新基建”主要指5G网络、人工智能、工业互联网、物联网、数据中心等信息基础设施。第十三届全国人民代表大第三次会议审议的2020年的政府工作报告,也写入了“新基建”。“新基建”就建立在数字化的基础之上!

如今,几乎各个国家都注重发展数字经济。“数字经济”已成为继农业经济、工业经济之后的新型经济形态;这是因为正如李宇明教授所指出的,在当今的“大数据时代,数据已经具有生产要素性质”(4)。数字经济由两大部分构成:一是产业数字化(5),二是数字产业化(6),现在各国数字经济占GDP比重均呈现上涨态势,拉动GDP增长作用显著。(7)现在世界各国“在数字技术产业、数字商务产业、数字创意产业、数字民生产业、电子政务等领域推进务实合作,为经济发展注入新活力”(8)

由此可见,数字化,这是科技发展的大趋势。数字技术的发展和应用已经成为驱动当今社会经济和科技文化发展的新动能。可以预见,数字化将进一步引发一场范围更为广泛的产品革命、生活革命。显然,各个学科领域都必须顺应这一发展大趋势,使本学科的学术研究逐步走上数字化之路。这种时代变化就要求各个学科领域的学者、研究者都要有“跟上数字化时代”的思想准备,作为一个学者、研究者,今后如果不同时具备处理传统媒介文献和数字文献(9)的能力,就很难在学术研究上产出重大研究成果。

2.语言研究数字化的现状

在谈论语言研究数字化现状之前,有必要扼要说说语言研究的目的与任务。主要有以下四方面:

一是全面细致地考察、分析、描写语言的实际情况,解决好“语言是什么”的问题。

二是认真思考、解释种种语言现象,解决好“语言为什么是这样”的问题。

三是为语言应用服务。科学研究最终目的都是为了应用,语言研究也不例外。

四是无论是解决“语言是什么”的问题,还是解决“语言为什么是这样”的问题,还是实施语言应用服务,都需要不断在研究中注意思考、提炼、概括各种理念、思想,并升华为理论,形成科学的理论方法,构建语言本体研究、语言理论研究、语言应用研究的理论方法系统,从而构建完整的语言学学科体系。

目前,广大语言研究者和语言教学工作者虽然不一定都已经明确树立起了“数字化”这一意识,但实际上已经起步。这表现在以下六个方面:

其一,电脑、手机这些数字化工具人人不离手了,都已成为语言研究必不可少的工具。

其二,无论哪一方面的语言研究,都不同程度地建立了相关的语料库(包括少数民族语言或方言的语音音档)、资源库、为适应某种需要而建的不同类型的数据库及其相应的检索系统(10)

其三,已有海量的图书、报纸、期刊、照片、绘本、乐曲、视频等人文语言资料加以数字化,并已经在Web上提供给大众获取和使用。

其四,成立了规模不等、用途不一的语言数字研究机构,如中国教育部语言文字信息管理司牵头并指导成立的“国家语言资源监测与研究中心”,下又分设平面媒体语言中心(北京语言大学)、有声媒体语言中心(中国传媒大学)、网络媒体语言中心(华中师范大学)、教育教材语言中心(厦门大学)、少数民族语言中心(中央民族大学)和海外华语研究中心(暨南大学)。其他各高校或机构,也先后分别成立了一些研究中心,如数字人文研究中心、中国语情与社会发展研究中心(武汉大学)、人工智能与人类语言重点实验室(北京外国语大学)、中国外语战略研究中心(上海外国语大学)、中国语言资源开发应用中心(商务印书馆)、山东省级“数字人文与外语研究创新团队”(山东曲阜师范大学)、人工智能研究院自然语言处理与社会人文计算研究中心(清华大学)、语言智能研究中心(首都师范大学)、语言智能联合研究中心和语言、智能与神经科学研究基地(上海交通大学)、新疆多语种信息技术研究中心(新疆大学),等等。

其五,语言教学,特别是汉语二语教学与外语教学大多运用数字化教学手段。互联网、大数据、人工智能、虚拟仿真等数字技术改变了人类生活,也改变了学生的学习方式,他们已习惯于“碎片化”学习,习惯于从网上找学习资源(11)。总之,学生运用数字化技术开展个性化和多样化学习的需求日益突显,教与学的理念和方式也在快速变化。现在越来越多的线上教学平台出现———有中国大学MOOC、超星学习通、云班课、雨课堂、钉钉、腾讯课堂、企业微信等国内线上学习平台,还有“爱课程”和“学堂在线”两个高校在线教学英文版的国际平台;越来越多的授课模式出现,如直播课、录播课、慕课、远程指导;越来越多的教学模式出现,如PBL(Problem-based learning,基于问题的学习)BOPPPS(包含导言Bridge-in、目标Outcome、前测Pre-assessment、参与式学习Participatory learning、后测Post-assessment、总结Summary六环节教学法)、对分课堂等。有的教师还采用“多模态的语言教学法”,把传统的独立的听力课、口语课及影视欣赏课等课程综合为一体,形成视、听、说、图、影、像、动作、表情、语气等多模态的语言教学。好多学校教室里还安装了“嘉课堂”教学系统软件平台,采用智慧教学系统(12)。这一切教学手段都离不开互联网,离不开电脑、手机。这次突发而又持久的新冠病毒性肺炎疫情,是坏事,但它也推动和促进了线上线下混合式教学。

第六,辞书开始逐步走上数字化辞书之路。譬如商务印书馆推出了《新华字典》APP和《现代汉语词典》APP,除收录原辞书内容,还支持数字版、纸版界面一键切换对照阅读,支持手写、语音、摄像头多种输入方式,以及全文智能查询、智能问答助手等增值服务。《辞源》《辞海》《英汉大词典》《中国大百科全书》等也已经推出或正在开发各种类型的数字版、网络版。目前还进一步考虑研制“融媒辞书”。“融媒辞书”除了在内容上力求字、词的形、音符合规范,词的词类标注尽可能符合“教学语法”的要求,义项分合力求合理,释义力求准确,举例力求精当之外,还得整合文本、音频、视频、动画等资源,还必须考虑字词的形、音、义、用(语法和语用两方面的用法)方方面面的链接与即时显示,而且最好还能跳转,而且力求链接、跳转与显示程度都能令读者十分满意(陆俭明、马真2019)。这里值得一提的是,这次疫情在武汉爆发后,我们语言工作者没有忘记自己的使命,用自己的实际行动与特有的方式,积极迎接挑战,投入防控抗击新冠病毒之战。武汉疫情刚一爆发,由李宇明教授主持的“北京语言大学语言资源高精尖创新中心”挑头,联合其他单位的语言学学人组成了“战疫语言服务团”,并在很短的时间里就先后研制、推出了三种语言应急服务的研究成果———《抗击疫情湖北方言通》《疫情防控外语通》和《疫情防控“简明汉语”》。其中,《方言通》就有微信版、网络版、融媒体版、迷你视频版、抖音版、在线服务系统、即时翻译软件等7种产品;《外语通》则开发了微信平台版和电脑网页版在线查询系统(李宇明2020;田列朋2020;李宇明、赵世举、赫琳2020)

从上可知,在实施数字化手段上,跑在前头的大多是语言应用研究方面,而语言本体研究,大多还只是运用和借助于语料库、语言资源库来开展语言研究。所以今天我说“语言研究必须走数字化之路”,主要是指语言本体研究要加快走上数字化之路。

3.面向人工智能研究的语言研究———茫然与曙光

人工智能已经成为当今社会的“大明星”。现在许多发达国家和发展中国家都已经制定或正在制定人工智能发展计划,都把发展人工智能作为提升国家竞争力、维护国家安全的重大战略。(13)

人工智能事业得依靠众多学科的合作,这是谁都承认的。然而,无论在众多的部门领导的谈话中,也无论在众多的学者专家的谈论中,所提到的众多的学科中,就没提到语言学。实际情况也确实如此。目前的语言研究成果可以说对人工智能研究的贡献甚微。目前唯一能挤进人工智能的是语音处理(包括语音识别与合成)和语义理解,但其有效性靠的也还是计算机自身的“深度学习+计算”,而非我们给出的所谓语言规则。在语音处理和语义理解中计算机具体运用的是什么样的计算模型,我们搞语言研究的人真是一无所知。哈尔滨工业大学计算机学院教授刘挺(2017)在谈到自然语言处理发展的大趋势时也指出,今后,语义表示将“从符号表示到分布表示”(趋势之一),语言知识表示将“从人工构建到自动构建”(趋势之四),文本理解与推理则“从浅层分析向深度理解迈进”(趋势之六)。显然,在人工智能事业发展中,语言研究有被边缘化的趋势。这会让从事语言研究的语言学人感到茫然,同时也促使语言学人反思———我们语言研究在人工智能事业中为什么会感到茫然而陷入困境呢?

我们首先要从自己身上找原因。语言研究的历史,无论国内、国外都有两千多年了(14),虽然对语言我们至今还认识不透(15),但是一代接一代的语言学人对语言的研究还是很有成绩。其中要数语音研究最有成效,学界对音素、音位、元音、辅音、不同元音的差异和不同辅音的差异都取决于发音部位和发音方法的不同、音节、声调、轻重音、停顿、音段(可分为音段成分和超音段成分(16))、不同语言的音节组合规律等诸方面都已有一定的共识。而这对计算机的语音识别与语音合成无疑有所贡献。即使是语法、语义方面的研究,虽比较繁难,也有一定的成绩。就机器翻译而言,大致经历了三个阶段:从基于规则的自然语言理解到基于统计的自然语言处理,再到基于计算机深度学习的自然语言深度处理(詹卫东2013)。在第一、第二阶段,语法、语义的研究成果都起了一定的作用。再譬如说,关于短语结构基本可以分为两大类,一类是所谓“核心结构”,其内部成员(譬如词)按一定规则通过组合而形成的,具有较强的组合规则性,不妨表示为“1+1=2;另一类是所谓“边缘性结构”,其内部成员(譬如词)并非按一定规则通过组合而形成的,如英语的let alone(更不必说/更不用说)、汉语里用来追究原因的“V X V的”(睡觉睡的/游泳游的)等这类结构,现在一般称之为“构式”,不具有组合规则性,不妨表示为“1+1=3(17)。对前一类短语结构的内部规则性都已有较好的描写、说明;对后一类短语结构(即构式),也开始进行系统性的研究与描写(18)。再譬如说,属于核心结构的句子,其意义可概括为“命题+(情态)(19)。乔姆斯基提出的论元结构、论旨角色以及“X-阶”结构模式(Chomsky 1981,1992),菲尔墨(Fillmore 1976)提出的框架语义学,Pollard&Sag(1987)提出的中心词驱动的短语结构语法,莱可夫、约翰逊提出的概念隐喻和概念转喻理论(Lakoff&Johnson 1980),莱可夫所提出的“理想化认知模型”(Lakoff 1982,1987),维特根斯坦提出的“家族相似性”范畴理论(Wittgenstein 1953)和莱可夫提出的“原型范畴”理论(Lakoff 1987),朱德熙(1979,1981)所提出的语义特征分析,以及语义所指和语义指向理论(20),等等,都为语义理解提供了视角和钥匙。但是,应该看到,随着近十年来机器学习(Machine Learning)热潮在自然语言处理领域的推波助澜,自然语言作为计算机的信息处理对象,其自身的特殊性越来越被工程技术人员淡化,研究人员更多的是从工程效果,而不是从内在理据的角度去看待他们开发的自然语言处理系统(詹卫东2013)

那么,难道语言研究成果真的对人工智能研究和人工智能产业不能提供任何有效的支持吗?西安交通大学人工智能专家徐宗本院士曾指出,人工智能最终都要走向各种各样的应用;人工智能的应用模式,必须“强调与领域知识的结合”(徐宗本2019)。徐宗本院士的话实际也告诉我们,人工智能也会走向语言应用,而且必然要求与语言学结合。我们也该看到,现在抛出的种种人工智能翻译软件,好像很能帮助人,但是常常出现这样那样的问题,甚至闹笑话。清华大学张钹院士在一次报告中举了这样一个例子,让计算机将中文“说你行的人行”翻译成英文,结果翻译成了Talk about pedestrian of your profession(谈论你专业的行人道);原因在于计算机“没有自我知识”,“没有自知之明”(杨晓帆2019)。看来我们语言学人也不要妄自菲薄,应该看到,“人工智能翻译错误的地方,恰恰是人类语言最微妙、最值得研究的方面”(束定芳(21))。我们还是需要反思、深思。

广大语言学人对世界科技的发展趋势还缺乏足够的认识。我们一开始说了,科技发展的大趋势是数字化。其实,这只是一种大趋势,还有另一种大趋势,那就是在当今时代不同学科之间的互相渗透、互相吸收和相互交叉融合。具体说,各个学科的发展,不能仅仅是单纯的本学科知识的发展,而是要逐步形成你中有我、我中有你的发展局面。换句话说,各种学科的研究不能再局限于单纯的本领域的研究,而需要跨学科、跨领域的研究,而且是要跨多个学科、跨多个领域,从而逐步形成你中有我、我中有你的发展态势。这样,才能不断地将研究引向深入,更好地适应这个时代和社会发展的需要。这种交叉融合之路始于19世纪末的物理学与化学的结合。在自然科学中,物理学和化学一直被视为最基础的学科,而物理学又一直是龙头老大。随着社会发展和科学发展的需要,化学和物理学开始进行交叉研究,即运用物理学的原理与实验技术,来研究化学现象和化学体系,探究化学的基本规律、化学体系的性质及其内在的特殊规律。于是在19世纪末开始形成“物理化学”这一交叉学科。现在“物理化学”已成为化学学科中的基础学科。

显然,语言学要逐步走上数字化之路,首先要树立起“交叉融合”和“数字化”这两大理念和意识。“学科的交叉融合”和“学科的数字化”是互相影响、相互促进的。

语言学如何能走上与其他学科交叉融合之路呢?具体说需要走“语言学+”这种模式的发展道路。采用“语言学+”模式,这意味着:

第一,还是要搞好语言自身的研究,而对语言自身的研究需要有新的认识,不能按原来的路子走。我们已习惯于理性主义地探究语言各个不同层面的规则,这当然无可非议,而且十分需要。然而,以往虽然也知道语言是不断地随着社会的发展而发展变化的,但这种发展变化是比较缓慢的。如今则不同,随着信息时代到来而出现的网络虚拟世界,极大地加速了语言的变异。而这无疑对我们这些语言学人所习惯的那种理性主义的语言研究是个很大的挑战。当然,网络语言上出现的语言变异,大多只是昙花一现,但也有相当一部分则立即为使用该语言的社群所接受而逐渐广为运用,因为有一定的表现力。譬如说,以往说程度副词不能修饰名词,可是网上出现了大量的“很阳光、很农民、很德国、很中国、很男人、很女人、很木头、很上海”一类说法;以往说虚字“被”得加在及物动词头上,如“被打、被骂、被批评、被欺骗、被扼杀”等;可是网上出现了加在不及物动词头上的说法,甚至出现了加在名词、形容词、数词、字母词头上的许多说法。(22)我们语言学人必须跟上形势,而不能以“不规范”为“理由”对网络语言中出现的语言变异现象都采取不理不睬甚至拒绝的态度;(23)如果以这种态度研究语言,对人工智能研究很难有所作为。另外,单纯靠计算机“能海量面对语言资源、能永久记忆、能高速搜索”而进行的统计,面对计算机的“深度学习”,也只能败下阵来。因此,更重要的是我们必须认识到,以往我们的关注点“过于注重所谓的抽象的‘语言能力’,而忽视了具体的‘语言使用’,忽略了作为交际主体的人的能动性,以及在交际过程中除语言符号本身之外的其他非语言本体知识的作用”,因此“未来的语言学研究应该更注重跟心理学、神经科学、脑科学、认知科学研究的互动”(詹卫东2017)。在这方面,计算语言学的创立与发展实际上就是走的将语言学与数学、计算机科学交叉融合之路,无疑已为整个语言学研究展示了走跨领域研究的路子。语言学与其他学科交叉融合,国外已走在我们前头。据我们初步搜索,国外已有近40个具有交叉融合性质的语言学分支学科。诸如媒体语言学(Media Linguistics)、网络语言学(Internet Linguistics,Cyberlinguistics,Netlinguistics,Weblinguistics)、人类文化语言学(Cultural Linguistics)、心理语言学(Psycholinguistics)、神经语言学(Neurolinguistics)、认知语言学(Cognitive Linguistics)、数学语言学/数理语言学(Mathematical Linguistics)、宇宙语言学(Cosmic Linguistics/Exolinguistics/Astrolinguistics)等。其中,像宇宙语言学,又名“外星语言学”(Xenolinguistics),主要研究外星族群的宇宙语言(24);它涉及许多其他学科,诸如语言学、数学、天文学、符号学、逻辑学、心理学和音乐等。我们中国也已经有一些语言学与其他学科融合的交叉性分支学科,如计算语言学、神经语言学、心理语言学、病理语言学等,但很少,而从事语言学与其他学科融合的这种交叉性学科研究的学者专家更少,研究深度也不够。因此我们必须认真思考语言研究新的发展方向和语言学科发展的新的增长点。

第二,需进一步加强语言各层面的特征研究。前面一开始就讲了,数字化就是将信息转化为数字,以便于计算机存储、计算。语言研究、语言学研究数字化具体该怎么理解?具体该指什么?北京大学计算语言学研究所副所长詹卫东教授认为,“语言研究的数字化,有两个层次:(1)研究方式、研究材料的数字化;(2)研究成果的数字化。”(25)上述两个层次实现数字化,正如詹卫东所说“都是任重道远”。关于研究方式、研究手段的数字化,以后有机会另文讨论,这里仅就研究材料、研究成果数字化略说些看法。

语言原材料也好,语言研究成果也好,无疑得归结为语言和语言研究各个层面、各种单位、各种规则的性质,而既能体现语言和语言研究各层面的性质,又便于成为反映语言和语言研究各层面、各种单位、各种规则性质的各种可实施数字化的信息,那就是“特征”。为此必须加强语言各层面、各种单位、各种规则的特征的分析研究。当然这如詹卫东教授所言并非容易之事,“都是任重道远,需要努力”。

我们语言学学人在进行反思、深思的同时,也需要从学科体制上去找原因。在我们国家语言学至今未能成为一级学科,我国的语言学主要还是依附于中文系、文学院或外语学院;这种学科体制上的问题极大地影响我国语言学科的发展:()导致我国的语言研究包括汉语和少数民族语言研究,基本上还是停留在语音、词汇、语法、语义、语用等语言内部各层面打转转,研究者也不容易打开思路,更不用说进行跨学科创新研究了。()语言学在我国不能成为一个“母本”学科,不能确保语言学与其他学科交叉融合,更不可能走上数字化之路。所以,中国的语言学科要发展,中国的语言研究和语言学研究真要走以“语言学+”为模式的发展之路,必须解决学科体制上的问题。广大语言学人还需继续为使语言学成为一级学科而向有关部门积极呼吁。当然,我们语言学人也不能等,不能等国家学位办批准语言学成为一级学科后才来深入思考语言研究的问题。我们要一边呼吁,一边动起来。那就是我们得立足于汉语和国内少数民族语言研究,借鉴吸收国外语言学之精华,加强汉外对比研究,积极探索语言学与其他学科的交叉融合;深入探究语言学与其他不同学科间的关联性和相互作用,要找到语言学与其他学科交叉融合的切入点、支撑点和着力点。(26)我们语言学人应该有这样的志向,20年乃至50年内力求要在新学科建设、学术观点、分析方法等诸方面有较大的突破,做到学科创新,理论创新,在国际语言学界真正有我们中国的声音。为此,我们必须自觉地树立起“交叉融合”和“数字化”这两种意识与理念,有意识地以“语言学+”为模式,努力探索、逐步加强语言学跟其他学科包括理科、工科和各个人文社会科学学科相结合的路子。只有走“语言学+”模式的发展之路,语言学在我国才有可能成为一个“母本”学科,受到其他各个学科的重视,以建立越来越多的新的语言学交叉学科。按上述观点,语言学系、语言学专业不能只限于在中文系、文学院或外语学院办;其他相关学科内也可以办语言学系或专业,即也可以在法学院、医学院、心理学院、认知科学院、脑科学学院、计算机学院、信息科学院等学院办;而要求学生要有不同的学科专长,真正培养出高层次、应用型、复合型的新型语言学专门人才。我们看到欧美各国都已经在这样做了。(27)而这样也才能将“语言学+”落到实处,产生教育和学术效益,才能真正有所创新———语言研究和语言学研究之创新“就创新在那‘+’上”!(28)

如果我们的语言研究和语言学研究真能往这个方向走,我们才能逐步走上数字化的道路,也才能更好地为国家、为社会、为人类服务。

以上所述也说明,我们语言学人不要光是在人工智能技术的发展面前感到茫然,甚至悲哀,也应该看到我们语言学发展的曙光———人工智能的发展将会推进语言研究跨学科发展,将会进一步推进语言研究和语言学研究的数字化,而这正是我国语言研究和语言学发展的曙光。

4.寄希望于年轻人

正如有人已经预测,今后人类社会将逐步进入全面“人工智能+量子通讯”的高智能化时代。语言研究如何跟上形势加速数字化进程,在人工智能事业中发挥应有的作用?我们需要着力探究。我们对语言研究和语言学发展的光明前景充满希望。

我已进入耄耋之年,思维能力将一天比一天衰退,这是自然规律,也不可抗拒。因此,完成这重大的转型任务得靠年青一代,一句话“寄希望于年青一代”!为此,衷心希望年青一代的语言学工作者,必须要有两种思考:一是开拓性思考,二是深层次思考;必须要树立两种意识:一是“问题意识”,二是面向未来的创新意识。

所谓开拓性思考,就是既要在本学科领域不断思考和开拓新的分支领域,同时要跨学科不断思考和开拓新的交叉性的新型学科。所谓深层次思考,就是不要满足于已有的认识与结论,要不断追究,不断探索,特别是要不断思考“怎么样”“行不行”“是否有例外”“研究已到头了吗”“语言学如何能跟上时代发展的步伐”“语言研究怎么更好地为中国、为世界、为人类服务”等问题。

所谓“要有问题意识”,就是我们要不断地发现问题,探究问题,提出新问题———“发现问题”是我们在科学研究上能获得成果的起点;“探究问题”是科学研究能获得成果的唯一途径;“提出新问题”是确保一个学科的理论方法对该学科知识的增长能做出持久的贡献。所谓“要有面向未来的创新意识”,也就是“前瞻意识+创新意识”,就是要求我们一定要看到学科研究的发展趋势,要有预见性,要超前谋划,同时要培养自己创新性思维能力。有创新才有发展!

我们坚信,年青一代一定会勇于挑起这副重担,为国争光,为人类做贡献!

我只是一个对数字化事业、对人工智能事业的关心者和学习者。以上所言不是论述,只是学习心得。

(文章来源:陆俭明.顺应科技发展的大趋势语言研究必须逐步走上数字化之路[J].外国语,2020(4):2-11.)