能識別鉛印版蒙古文的OCR印刷軟件
2015年夏天博士畢業之后,烏日力嘎開始全身心地投入到傳統蒙古文OCR軟件的開發之中,她參考了國內外大量學術文獻,并使用深度學習和語言模型等高新技術,在短時間內成功研發出了蒙古文高精度自動識別軟件。據介紹,這一軟件的優勢是既能識別掃描圖片,又能識別拍照的圖片,并且將打字和校對的功能融為一體。
“讀博士期間研究機器翻譯,機器翻譯需要大量的語言資源,但是蒙古文的資源特別少,我們在建立語言數據庫時需要大量的人力、時間和經費,”烏日力嘎博士說:“從那個時候起,我就萌發一個念頭,自己是否也試著研發一款高精度的蒙古文自動識別系統。”
“上世紀90年代以前的書本都是鉛印版本,但目前還沒有其他可以把鉛印版轉換成文本的軟件,而烏日力嘎博士研究的軟件優勢是能識別鉛印版,并且有承前啟后的作用,”內蒙古大學教授那順烏日圖認為,烏日力嘎研究的軟件理論上有創新,這一軟件結合語言規則和統計方法,再利用深度學習和神經網絡等新技術來完成的。因為以前的OCR軟件是基于規則或者是基于統計的方法來實現的,他們終效果都不理想。
烏日力嘎后表示,希望她所開發的這款印刷軟件能為廣大的蒙古語言文字工作者帶來更多的工作上的便利。
此文關鍵字:能識別鉛印版蒙古文的OCR印刷軟件

關于“”的相關資訊
我要評論: | |
---|---|
內 容: | |
驗證碼: | (內容最多500個漢字,1000個字符) 看不清?! |
請注意: |
|
1.尊重網上道德,遵守中華人民共和國的各項有關法律法規,不發表攻擊性言論。 2.承擔一切因您的行為而直接或間接導致的民事或刑事法律責任。 3.新聞留言板管理人員有權保留或刪除其管轄留言中的任意內容。 |
共有-條評論【我要評論】