1、選擇適當(dāng)?shù)姆直媛?/span>
分辨率太高,會加長掃描所用時間,并且會因為一些非文字的細(xì)節(jié)被捕獲反而造成識別不正確,分辨率太低,OCR軟件因為信息量不足,也會造成識別率不高。一般大多普通五號印刷體選擇黑白模式下300dpi進(jìn)行掃描比較合適,當(dāng)然,如果所掃描的字體較大或較小,則可相應(yīng)降低或提高掃描分辨率。
2、選擇適當(dāng)?shù)牧炼?/span>
選擇適當(dāng)?shù)牧炼瓤墒箳呙柙屣@得黑白分明,掃描亮度的設(shè)定以掃描所得圖像中漢字的筆劃較細(xì)但不斷開為佳,如果掃描所得的漢字輪廓殘缺較多,應(yīng)該增加亮度,如果有一些黑點或黑斑,則應(yīng)減小亮度。
3、放正欲掃描的原稿
雖然一些OCR軟件允許文稿有一定的傾斜,還可以通過識別軟件進(jìn)行傾斜校正,但這種校正效果并不是很令人滿意的。
4、做好版面分析
在版面分析中選擇與原稿相符的版面類型,對一些復(fù)雜的版面,劃分合理的塊來進(jìn)行識別,這樣也能有效地提高識別正確率。
5、不斷完善用戶自定義庫
對個別掃描效果清晰,但OCR卻識別錯誤的字,可以加到用戶自定義庫中,這樣下次就不會犯同樣的錯誤,慢慢地識別正確率也會得到提高。
對掃描的圖片,我們還可以通過PHOTOSHOP等圖像處理軟件進(jìn)行處理,這樣你就可以得到令自己滿意的掃描圖片了。