- +1
一史館13萬余件滿文朱批奏折數(shù)據(jù)庫將上線,使用方法搶先看
日前,中國第一歷史檔案館(以下簡(jiǎn)稱“一史館”)在“改革開放四十年滿文檔案工作回顧與展望”座談會(huì)上正式發(fā)布了“滿文輸入通”“滿文識(shí)別通”軟件及“滿文朱批奏折全文檢索數(shù)據(jù)庫”。這是國內(nèi)少數(shù)民族手寫體文字圖像計(jì)算機(jī)識(shí)別的首次成功應(yīng)用。
“滿文識(shí)別通”
專家首先演示了“滿文識(shí)別通”軟件,它的功能是將滿文檔案的圖像信息通過識(shí)別技術(shù)轉(zhuǎn)換成可編輯檢索的文本信息。軟件界面如下:

在實(shí)際操作中,大批量數(shù)據(jù)加工在后臺(tái)進(jìn)行,由機(jī)器操作,而具有滿文專業(yè)技能的人均可以參與校對(duì),一定程度上緩解了滿文人才稀缺的壓力。
據(jù)介紹,這一系統(tǒng)的滿文行書識(shí)別率86.6%,滿文楷書識(shí)別率95.1%,處于國內(nèi)外行業(yè)領(lǐng)先地位。同時(shí)軟件可以實(shí)現(xiàn)機(jī)器學(xué)習(xí)、迭代更新,隨著樣本庫的增加,識(shí)別率逐步提升。它的單機(jī)識(shí)別速度達(dá)到每小時(shí)625畫幅,相較于純?nèi)斯っ咳嗣啃r(shí)大約4畫幅的速度,效率顯著提高。此外,軟件易操作、兼容性強(qiáng),基于微軟系統(tǒng)開發(fā),對(duì)軟件和硬件環(huán)境要求不高,便于推廣使用。
“滿文輸入通”
“滿文輸入通”軟件包括滿文輸入法、滿文字庫、拉丁字母與滿文相互轉(zhuǎn)換軟件。
其中滿文字庫包含了團(tuán)隊(duì)最新設(shè)計(jì)的幾種滿文字體,這些字體取材于一史館檔案中真實(shí)存在的滿文字體。




上圖演示中,左邊是滿文的拉丁字母轉(zhuǎn)寫,右邊是滿文。這一軟件能夠?qū)崿F(xiàn)雙向轉(zhuǎn)換、批量轉(zhuǎn)換,既方便學(xué)者使用,也方便相關(guān)機(jī)構(gòu)進(jìn)行數(shù)據(jù)庫的建設(shè)。

滿文輸入法解決了滿文鍵位與滿文轉(zhuǎn)寫統(tǒng)一的難題,省略了切換按鍵。在文檔中,輸入滿文時(shí)可像漢語一樣切換字體,軟件設(shè)計(jì)了包括雕版體、奏疏體、行書體、匾額體、書名體和榜書體等字體供選擇;方便教學(xué)、科研和滿文古籍出版等工作。有學(xué)者提到,現(xiàn)在有些文物機(jī)構(gòu)的滿語匾額書寫尚不規(guī)范,可以應(yīng)用“匾額體”字庫來解決。

滿文朱批奏折全文檢索數(shù)據(jù)庫
應(yīng)用“滿文識(shí)別通”及“滿文輸入通”開發(fā)的“滿文朱批奏折全文檢索數(shù)據(jù)庫”有滿文史料13萬余件,可以應(yīng)用于局域網(wǎng),也具備接入互聯(lián)網(wǎng)的能力。

以往檔案查詢只能依據(jù)著錄題名通過檢索檔號(hào)或者責(zé)任者來查詢檔案,有了全文數(shù)據(jù)庫以后,可以檢索檔案全文信息,檢索效率更高。


此外該數(shù)據(jù)庫還有后臺(tái)管理功能,為數(shù)據(jù)庫中的數(shù)據(jù)和使用者設(shè)置使用權(quán)限,包括是否能下載、閱讀,以保障數(shù)據(jù)安全。滿文朱批奏折全文檢索數(shù)據(jù)庫將于2018年12月3日起在中國第一歷史檔案館利用平臺(tái)向社會(huì)開放利用。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




