□毛銘杰
在數字浪潮席卷全球、人工智能重塑文明的今天,語言文字已不僅是文化傳承的載體,更是國家綜合實力與科技競爭力的戰略資源。
今年,教育部、國家語委、中央網信辦聯合印發《關于加強數字中文建設推進語言文字信息化發展的意見》,明確提出到2027年,基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫;語言文字信息化標準、前沿語言技術、優質語言資源、新型語言服務等基礎支撐能力顯著增強。到2035年,中文在全球數字空間、網絡空間以及生成式人工智能等關鍵應用場景中的使用占比顯著提高。這一戰略部署的背后,是數字時代對語言文字功能的重新解構。中文正從單純的文化符號,升級為支撐人工智能、數字經濟、網絡安全的“數字基礎設施”。
語言文字信息化是文化傳承創新的必由之路。在數字時代,文化傳承面臨載體變革的挑戰。據聯合國數據統計,全球約40%的語言瀕臨滅絕,而數字技術的應用為語言保護提供了新路徑。借助數字化手段,珍貴的語言資源得以通過多種形式進行記錄、存儲和整理。然而,僅僅保存還遠遠不夠。當下,利用虛擬現實(VR)和增強現實(AR)技術打造沉浸式的語言學習體驗場景已經成為新潮流,學習者能夠置身于特定的語言環境中,更直觀地感受語言的魅力。例如,首都圖書館聯合阿里巴巴通義實驗室,利用AIGC技術將明刻本《牡丹亭》的“驚夢”篇章生成短片,實現古籍內容的可視化呈現。由此可見,語言文字信息化不僅不會削弱傳統文化的獨特魅力,反而能為其注入源源不斷的新生命力,讓傳統文化在新時代綻放出更加絢爛的光彩。
語言文字信息化是科技自立自強的戰略支撐。在人工智能時代,語言數據已成為關鍵生產要素。全球主流AI大模型的訓練數據中,中文數據占比不足5%,這一數據鴻溝,在一定程度上制約了我國人工智能技術的發展。加快語言文字信息化建設,構建大規模、高質量的中文語料庫,提升中文數據的處理和分析能力,已成為我國科技自立自強的當務之急。
語言文字信息化是國際話語權爭奪的關鍵戰場。數字空間的語言格局,猶如一面鏡子,直接映射出國際輿論格局的復雜態勢。當前,國際輿論場呈現出明顯的不平衡狀態,西方國家憑借其在語言傳播領域的長期優勢,掌握著國際話語權的主導地位,而中文在國際輿論場中的影響力相對較弱。這種不平衡導致國際輿論場中的“中國敘事”常常被扭曲、被誤解,中國的真實形象和聲音難以得到全面、客觀的傳播。通過大力推進數字中文建設,提高中文在關鍵應用場景中的使用占比,掌握語言文字信息化的主動權,才能在國際傳播中講好中國故事,傳播好中國聲音,讓世界更好地了解中國、認識中國,從而提升我國的國際形象和軟實力。
語言文字信息化建設是一項系統工程,需要多方協同推進。政府要發揮主導作用,完善標準體系和基礎設施;企業要加大技術研發投入,突破自然語言處理等關鍵技術;學術界要深化理論研究,為實踐提供智力支持;每個公民也應增強語言資源意識,共同參與這一文化工程。
站在新起點,語言文字正迎來一場前所未有的轉型變革,從“靜態符號”蛻變為“動態資產”,從“信息載體”升級為“生產要素”,語言文字信息化建設不僅是我們應對當下時代挑戰的迫切需求,更是關乎國家長遠發展的戰略抉擇。