- +1
一史館13萬余件滿文朱批奏折數(shù)據(jù)庫將上線,使用方法搶先看
日前,中國第一歷史檔案館(以下簡稱“一史館”)在“改革開放四十年滿文檔案工作回顧與展望”座談會上正式發(fā)布了“滿文輸入通”“滿文識別通”軟件及“滿文朱批奏折全文檢索數(shù)據(jù)庫”。這是國內(nèi)少數(shù)民族手寫體文字圖像計算機識別的首次成功應用。
“滿文識別通”
專家首先演示了“滿文識別通”軟件,它的功能是將滿文檔案的圖像信息通過識別技術轉換成可編輯檢索的文本信息。軟件界面如下:

在實際操作中,大批量數(shù)據(jù)加工在后臺進行,由機器操作,而具有滿文專業(yè)技能的人均可以參與校對,一定程度上緩解了滿文人才稀缺的壓力。
據(jù)介紹,這一系統(tǒng)的滿文行書識別率86.6%,滿文楷書識別率95.1%,處于國內(nèi)外行業(yè)領先地位。同時軟件可以實現(xiàn)機器學習、迭代更新,隨著樣本庫的增加,識別率逐步提升。它的單機識別速度達到每小時625畫幅,相較于純?nèi)斯っ咳嗣啃r大約4畫幅的速度,效率顯著提高。此外,軟件易操作、兼容性強,基于微軟系統(tǒng)開發(fā),對軟件和硬件環(huán)境要求不高,便于推廣使用。
“滿文輸入通”
“滿文輸入通”軟件包括滿文輸入法、滿文字庫、拉丁字母與滿文相互轉換軟件。
其中滿文字庫包含了團隊最新設計的幾種滿文字體,這些字體取材于一史館檔案中真實存在的滿文字體。




上圖演示中,左邊是滿文的拉丁字母轉寫,右邊是滿文。這一軟件能夠實現(xiàn)雙向轉換、批量轉換,既方便學者使用,也方便相關機構進行數(shù)據(jù)庫的建設。

滿文輸入法解決了滿文鍵位與滿文轉寫統(tǒng)一的難題,省略了切換按鍵。在文檔中,輸入滿文時可像漢語一樣切換字體,軟件設計了包括雕版體、奏疏體、行書體、匾額體、書名體和榜書體等字體供選擇;方便教學、科研和滿文古籍出版等工作。有學者提到,現(xiàn)在有些文物機構的滿語匾額書寫尚不規(guī)范,可以應用“匾額體”字庫來解決。

滿文朱批奏折全文檢索數(shù)據(jù)庫
應用“滿文識別通”及“滿文輸入通”開發(fā)的“滿文朱批奏折全文檢索數(shù)據(jù)庫”有滿文史料13萬余件,可以應用于局域網(wǎng),也具備接入互聯(lián)網(wǎng)的能力。

以往檔案查詢只能依據(jù)著錄題名通過檢索檔號或者責任者來查詢檔案,有了全文數(shù)據(jù)庫以后,可以檢索檔案全文信息,檢索效率更高。


此外該數(shù)據(jù)庫還有后臺管理功能,為數(shù)據(jù)庫中的數(shù)據(jù)和使用者設置使用權限,包括是否能下載、閱讀,以保障數(shù)據(jù)安全。滿文朱批奏折全文檢索數(shù)據(jù)庫將于2018年12月3日起在中國第一歷史檔案館利用平臺向社會開放利用。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




