一、獲取圖像
有兩種獲取圖像的方法:
1、直接輸入磁盤上已經有的圖像文件。
選擇【文件】菜單下的【輸入圖像文件】命令,或者點擊工具條的【輸入圖像】工具,彈出打開文件對話框,選擇要識別的圖像文件。
方正銳思3.5支持.BMP、.TIF、.JPG(JPEG)三種圖像格式。
2、通過掃描獲取圖像。
選擇【文件】菜單下的【掃描圖像】命令,或者點擊工具條的【掃描圖像】工具,通過掃描儀把印刷品掃描到方正銳思3.5里。
建議:掃描時設置掃描原稿為“文字”,掃描類型為黑白二色,分辨率最好設置為300dpi。
二、版面糾斜
掃描時若圖像傾斜,對識別效果有較大影響,需要在識別前對圖像進行版面糾斜。方正銳思3.5的自動糾斜功能減輕了用戶的這部分工作。在缺省情況下,【文件】菜單下【選項】中的【自動傾斜校正】選項是選中的,無需用戶干預。若未選中此項,用戶也可點擊工具條中的【版面糾斜】工具,主動對版面進行糾斜。
三、版面分析
版面分析就是對圖像進行識別前的處理,目的是為識別作準備,包括區(qū)域劃分、確定每個區(qū)域的屬性(文本、圖像、表格)等。版面分析由方正銳思3.5在識別前自動完成,用戶也可手動操作完成。
版面分析可以識別整個圖像,也可以只識別圖像部分區(qū)域的內容。
選擇【圖像】菜單下的【版面分析】命令,或者直接點擊工具條的【版面分析】工具,方正銳思3.5會給當前圖像劃分出若干個區(qū)域(框)。
也可以用鼠標直接在圖像上畫矩形框。假如不選擇區(qū)域則會對整篇圖像進行識別。
可以畫多個框,每個框都有編號,編號從0開始計數(shù)。識別時是按照框的標號順序進行識別的。
畫框后,可以用鼠標拖動框邊線調整框的尺寸。用鼠標點擊框中的區(qū)域不松開可以拖動框的位置。
未選中的框顯示為藍色,選中的框顯示為紅色,進入【手工調整框順序】狀態(tài)的框顯示為綠色。
4、識別
設置好區(qū)域后,選擇【識別】菜單下的【識別】命令,或者點擊工具條的【識別】工具進行識別。彈出識別進度條:
若有多個框,則方正銳思3.5將自動按框的標號順序進行識別。
等待一段時間后,識別的結果顯示在后編改視圖的右上部分窗口里。右下的窗口顯示原始圖像文件。
5、后編改
在后編改視圖里對識別結果進行修改,可對照下面窗口顯示的原始圖像糾正識別錯誤的文字。有疑問的字符顯示為藍色。
識別完成后,方正銳思3.5自動進入后編改窗口
后編改窗口的最上面顯示出當前光標所在位置的字符以及前相關字符和后相關字符供選擇。
后編改窗口支持輸入和刪除,可直接進行編輯修改。其中,輸入的字符以紫色顯示。
或者通過選擇【編輯】菜單的【上一疑問處】和【下一疑問處】命令對有疑問的字(藍色字符)進行修正。修正后的字符以紫色顯示。
6、通過后編改后的文字內容就可以輸出了。選擇【文件】菜單下的【輸出識別結果】命令,彈出對話框,把當前正在編輯的文本輸出為一個WORD文件或文本文件,或兩種文件格式同時輸出。
若選擇【輸出識別結果到同一文件】,則把當前工程里所有圖像的識別結果都輸出到一個文件里。
或者直接選擇工具條的【輸出結果】工具,則把當前選中圖像的結果輸出,彈出【輸出識別結果】對話框,選擇輸出的目標路徑,以及輸出的格式,點擊【確定】按鈕。
方正銳思3.5支持輸出的文本文件類型有三種:MS WORD文件(.doc文件)、文本文件(即.txt文件)、文本文件(.txt)&&
MS WORD文件。