- +1
北大發(fā)布“中華民族語言文字接觸交融大數(shù)據(jù)模型”

活動中,孔江平介紹北大語言學實驗室相關研究成果。澎湃新聞記者 程婷 圖
12月16日—19日,北京大學舉行北京大學語言學實驗室成立一百周年系列活動?;顒又校爸腥A民族語言文字接觸交融大數(shù)據(jù)模型”成果發(fā)布。
據(jù)北大語言學實驗室主任、北大中文系教授孔江平介紹,北大語言學實驗室是集科研、教學、社會服務于一體的多學科交叉平臺,其前身是1925年成立的北大語音樂律實驗室。2021年12月,北大語言學實驗室獲批為教育部哲學社會科學實驗室。在教育部經費的支持下,2022年春北大語言學實驗室啟動了“中華民族語言文字接觸交融大數(shù)據(jù)模型建設”項目。該項目組織國內12所大學和科研機構的約20名專家的研究團隊,近200名博士生和碩士生,對中華民族語言文字接觸交融情況進行了大規(guī)模的田野調查,歷經四年,初步完成了基礎的調查工作和大型數(shù)據(jù)庫建設。
此次發(fā)布的中華民族語言文字接觸交融大數(shù)據(jù)模型,涉及中華民族語言文字接觸交融大數(shù)據(jù)模型數(shù)據(jù)庫的結構;語言活力的基礎模型和算法——主要討論語言活力的基本要素和分類方法;文字活力的基礎模型和算法——主要討論語言活力的基本要素和分類方法;中華民族語言文字接觸交融大數(shù)據(jù)模型的內容和形式——主要討論數(shù)據(jù)庫的形式;中華民族語言文字接觸交融通用語言詞匯模型與算法——主要討論詞匯的語意結構、相關的基本算法和分類的方法;中華民族語言文字接觸交融音位系統(tǒng)相似度模型與算法——主要討論利用音位系統(tǒng)相似性來對語言進行分類。該大模型的建設,有助于讓沉睡在田野中的即將消亡的聲音活起來、傳承下去。
孔江平介紹,在該項目中,除了大數(shù)據(jù)模型以外,主要成果還有關于中華民族語言文字接觸交融的系列書籍。按語言接觸和融合的實際,該系列書籍共分為十七卷,將于明年陸續(xù)出版。
此外,北大語言學實驗室還在“人類語言涌現(xiàn)和演化研究”“語言障礙與教育公平研究”和“基于人工智能的語言應用研究”等方向上開展了多項重大課題的研究。本次活動期間,有聲博物館項目建設同步啟動。
北大黨委副書記姜國華表示,北大語言學實驗室是文理學科交叉創(chuàng)新的典范,希望實驗室繼續(xù)傳承科學方法傳統(tǒng),主動服務國家戰(zhàn)略,做文明火種的守護者、交叉創(chuàng)新的開拓者、立德樹人的踐行者和中國學派的建構者。
教育部語言文字應用管理司司長楊鴻表示,北大語言學實驗室積極服務國家語言文字重大戰(zhàn)略任務與需求。他希望北大繼續(xù)以中文系和語言學實驗室為重要陣地,進一步深耕國家通用語言文字推廣普及、引領語言文字數(shù)智變革、厚植復合型人才沃土,為構建新時代語言文字事業(yè)高質量發(fā)展體系作出更大貢獻。
教育部語言文字信息管理司司長劉培俊表示,在智能時代,語言文字已成為大語言模型以及人工智能技術創(chuàng)新的數(shù)據(jù)要素、智能基座和戰(zhàn)略基礎。期待北大語言學實驗室未來在國家標準研制、關鍵技術攻關、跨學科協(xié)同等方面發(fā)揮更大作用,有效賦能經濟社會發(fā)展。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




