我國傳統蒙古文印刷體文字識別軟件研究取得重大進展

          發布時間:2024-02-17 點擊:114
          我國傳統蒙古文印刷體文字識別軟件(ocr)研究取得重大進展。據其研發者烏日力嘎博士向新華網內蒙古頻道獨家披露,目前ocr軟件對蒙古文白體的識別率已達到99%以上,對鉛印版的識別率也達到95%以上。
          隨著互聯網的高速發展,網絡已經成為人們共享信息的一個大平臺。“在信息共享的大平臺之中,蒙古文信息的傳播因為數字化處理的識別限制,變得極為繁瑣和無奈。”畢業于內蒙古大學的烏日力嘎博士直言不諱。
          “傳統蒙古文有大量的圖書、報刊,但其中很多都沒有實現數字化,”烏日力嘎博士介紹說,高效數字化需要ocr(optical character recognition)軟件自動識別掃描或拍照的圖片,將圖片中的文字轉換成文本。
          據了解,本世紀初伊始,就陸續有科研機構、相關公司嘗試開發傳統蒙古文自動識別軟件,但因為識別準確率不高、操作繁瑣等諸多原因,使用者至今未能等到可廣泛使用和可信賴的產品。烏日力嘎博士卻憑借自己的執著追求和一己之力,用不到兩年時間完成了這一傳統蒙古文印刷體ocr。
          “讀博士期間研究機器翻譯,機器翻譯需要大量的語言資源,但是蒙古文的資源特別少,我們在建立語言數據庫時需要大量的人力、時間和經費,”烏日力嘎博士說:“從那個時候起,我就萌發一個念頭,自己是否也試著研發一款高精度的蒙古文自動識別系統。”
          2015年夏天博士畢業之后,烏日力嘎開始全身心地投入到傳統蒙古文ocr軟件的開發之中,她參考了國內外大量學術文獻,并使用深度學習和語言模型等高新技術,在短時間內成功研發出了蒙古文高精度自動識別軟件。據介紹,這一軟件的優勢是既能識別掃描圖片,又能識別拍照的圖片,并且將打字和校對的功能融為一體。
          “上世紀90年代以前的書本都是鉛印版本,但目前還沒有其他可以把鉛印版轉換成文本的軟件,而烏日力嘎博士研究的軟件優勢是能識別鉛印版,并且有承前啟后的作用,”內蒙古大學教授那順烏日圖認為,烏日力嘎研究的軟件理論上有創新,這一軟件結合語言規則和統計方法,再利用深度學習和神經網絡等新技術來完成的。因為以前的ocr軟件是基于規則或者是基于統計的方法來實現的,他們最終效果都不理想。
          烏日力嘎最后表示,希望她所開發的這款軟件能為廣大的蒙古語言文字工作者帶來更多的工作上的便利。


          7個方法避免凹印過程中的縮孔現象
          海報設計怎么顯得突出?
          三折頁宣傳冊的設計規格
          上海珠寶首飾盒設計-首飾盒印刷設計要素
          上海印刷廠又面臨年底的用工荒
          不同的食物包裝設計具有不同的意義
          上海印刷廠怎樣提高混合彩色套印效果?
          上海印刷廠的四種畫冊印刷開紙方法
          主站蜘蛛池模板: 亚洲成AV人片一区二区密柚 | 亚洲一区二区三区久久| 污污内射在线观看一区二区少妇| 亚洲天堂一区二区三区| 国产精品视频免费一区二区三区| 亚洲av无码不卡一区二区三区| 一区二区三区在线视频播放| 亚洲欧美成人一区二区三区| 日韩人妻无码一区二区三区99| 中文字幕一区二区三| 成人精品视频一区二区| 无码av免费一区二区三区试看 | 91福利一区二区| 国产丝袜无码一区二区三区视频| 日亚毛片免费乱码不卡一区| 在线电影一区二区三区| 亚洲一区二区三区成人网站| 亚洲国产一区在线| 99久久国产精品免费一区二区| 无码精品久久一区二区三区 | 亚州日本乱码一区二区三区| 国语精品一区二区三区| 一区二区乱子伦在线播放| 精品久久国产一区二区三区香蕉| 四虎精品亚洲一区二区三区| 无码人妻精品一区二区蜜桃AV| 波多野结衣电影区一区二区三区| 精品一区二区三区AV天堂| 高清一区二区三区视频| 国产精品一区二区无线| 国产精品电影一区二区三区| 一区二区不卡视频在线观看| 午夜肉伦伦影院久久精品免费看国产一区二区三区| 亚洲日韩一区二区三区| 精品亚洲av无码一区二区柚蜜| 国产麻豆媒一区一区二区三区| 四虎精品亚洲一区二区三区| 国产一区二区三区在线影院| 亚洲国产精品一区二区久久| 伊人色综合一区二区三区影院视频| 成人毛片无码一区二区|