2013年08月27日09:45
【相關(guān)新聞】
蘋果從耐克“挖走”腕帶式運動測量儀開發(fā)關(guān)鍵人物
三星向美國市場投放6.3英寸大屏智能手機“Galaxy Mega”
Facebook現(xiàn)漏洞,發(fā)現(xiàn)者用扎克伯格的涂鴉墻做證明
日本富士通研究所和北京富士通研究開發(fā)中心開發(fā)出了一種通過模擬人腦活動進行學習的手寫漢字識別技術(shù)。通過開發(fā)該技術(shù),有望針對各種合同文件等,提高手寫文本數(shù)字化錄入工作的效率。
此次的分層網(wǎng)絡(luò)模型的基本原理圖。
富士通研究所稱,傳統(tǒng)的手寫漢字識別技術(shù)是把筆畫的方向和數(shù)量信息作為文字的特征,由此來識別每個字,但存在的問題是,無法識別變形較大的文字,而且,通過“學習”來提高識別精度是個非常耗時的過程。
關(guān)于文字識別必需的數(shù)據(jù)學習,此次的新技術(shù)使用的是與人腦內(nèi)部細胞架構(gòu)類似的分層神經(jīng)元網(wǎng)絡(luò)模型。對文字的特征從簡單到復(fù)雜地分層提取,像人類記憶文字的過程那樣捕捉文字的特征,不斷積累學習成果。識別時,根據(jù)學習到的文字特征,通過分析哪一特征對輸入的文字做出了反應(yīng)得到識別結(jié)果并輸出。
研究人員使用并行處理能力強的GPU(圖形處理單元)來構(gòu)筑學習數(shù)據(jù),將傳統(tǒng)方法需要4個月的學習時間縮短到了約一周。此次技術(shù)在第12屆文檔分析與識別國際會議(ICDAR2013 : International Conference on Document Analysis and Recognition)主辦的手寫漢字識別比賽中獲得了第一名,以94.8%的文字識別精度刷新紀錄。(日經(jīng)技術(shù)在線! 供稿)