《尚書七號OCR識別軟件(文字識別)》是一款專門為識別圖片中的文字而研發(fā)的軟件,該軟件采用OCR技術(shù),為滿足書籍、報刊雜志、報盤票據(jù)、公文檔案等錄入需求,實(shí)現(xiàn)系統(tǒng)管理方式而設(shè)計的軟件系統(tǒng),適用于個人、小型圖書館、小型檔案館、小型企業(yè)進(jìn)行大規(guī)模文檔輸入、圖書翻印、大量資料電子化的軟件系統(tǒng)。
1、打開尚書七號,選擇打開圖象。(我用的版本可以識別的格式有bmp、tif、jpg)
2、選擇開始識別或按F8。識別結(jié)果將顯示在窗口上部,下部顯示版面分析結(jié)果。其中紅線為可識別部分,綠線為不可識別。
3、選擇輸出--到指定格式文件,將識別結(jié)果保存為需要的格式。
步驟1:獲取文字圖像文件。
選擇“文件”菜單下的“掃描”或“打開圖像”(將已經(jīng)掃描好的圖像文件打開)命令,打開圖像文件。如果連接了多臺掃描儀,可以選擇“文件”菜單下的“選擇掃描儀”命令,調(diào)用掃描儀。
步驟2:對掃描的圖像頁進(jìn)行調(diào)整
選擇“編輯”菜單下“圖像頁面的處理”子菜單下的“圖像頁的傾斜校正”(提供自動和手動實(shí)現(xiàn)方法)及“旋轉(zhuǎn)”等命令,將掃描的圖像頁進(jìn)行調(diào)整。
步驟3:版面分析與文字識別轉(zhuǎn)化
版面分析,選擇識別范圍,在進(jìn)行文字識別前要選擇識別范圍,識別過程的核心是“版面分析”。尚書七號的自動版面分析功能很強(qiáng),對報紙雜志等復(fù)雜的版面,也能保持很高的分析正確率。
設(shè)置好后,直接點(diǎn)擊“開始識別”的按鈕就可以進(jìn)行文字識別了。
步驟4:校對修改
自動識別完畢,識別結(jié)果的“文本窗口”會彈出,這個窗口能夠提供識別結(jié)果的校對,為了校對方便,尚書七號增加了光標(biāo)跟隨顯示原圖像行的校對方法(黃色提示行的出現(xiàn))。
提供的校對方法,一眼就能夠看到圖像原文和識別出文本的差別,如果發(fā)現(xiàn)識別有誤,可以進(jìn)行修改。
步驟5:輸出
如果檢查修改后確認(rèn)無誤,選擇識別結(jié)果的“輸出”菜單,輸出的文件格式有:RTF、HTML、XLS、2126,可以根據(jù)自己的需要選擇對應(yīng)的格式。如果用戶想得到類似原文的識別結(jié)果,請選擇RTF格式。把RTF格式輸出的文件用WORD打開后,會發(fā)現(xiàn)幾乎保留了原文的所有痕跡,包括原來頁面中的彩色圖像,都已經(jīng)保留在WORD中了。
注:用掃描儀掃描的文字圖像,不能對個別文字進(jìn)行編輯修改,在教學(xué)中,需要利用文字識別軟件,將文字圖像進(jìn)行識別,將圖像格式轉(zhuǎn)化成文本格式,常見的文字識別軟件有很多,主要功能基本相同,尚書七號就是其中很優(yōu)秀的一款。用尚書七號對文字圖像識別轉(zhuǎn)化的過程,利用其主菜單:“文件”、“編輯”、“識別”、“輸出”可以很方便地完成。
1. 掃描儀和軟件準(zhǔn)確安裝
確保掃描儀已正確連接到計算機(jī),并與尚書七號軟件進(jìn)行準(zhǔn)確的軟件安裝。
在安裝軟件之前,可以先檢查一下計算機(jī)的系統(tǒng)要求是否符合尚書七號軟件的最低配置要求。
2. 連接和掃描設(shè)置
根據(jù)尚書七號的操作平臺進(jìn)行設(shè)置,確保掃描儀能夠正常連接和工作。
在掃描設(shè)置中,可以檢查一下掃描分辨率、掃描模式等參數(shù)是否正確設(shè)置。
3. 文件格式
尚書七號要求掃描后的文件格式為TIF格式的圖像文件。
如果掃描的文件格式不符合要求,可以將其轉(zhuǎn)換為TIF格式的圖像文件,然后再進(jìn)行掃描。
4. 尚書七號OCR使用方法
下載并安裝尚書七號OCR軟件,可以在桌面左下角的“開始”菜單中找到軟件圖標(biāo)。
打開軟件后,可以進(jìn)入尚書七號OCR的使用界面。
5. 打開圖像文件
在尚書七號OCR軟件中,可點(diǎn)擊右上角的“文件”按鈕,選擇“打開圖像”命令。
從電腦文件中選擇需要進(jìn)行識別的文件,然后點(diǎn)擊“打開”按鈕。
6. 修改保存
尚書七號OCR軟件提供了文字的修改功能,可以在不輸出的情況下直接修改文字內(nèi)容。
可以使用鍵盤上的Insert鍵來切換修改狀態(tài)(覆蓋或插入),修改完成后使用Ctrl+S保存修改內(nèi)容。
如果需要保存修改后的文件格式為表格,需要將其輸出為RTF格式,否則可能會出現(xiàn)格式錯誤的問題。
圖片擴(kuò)展名只支持TIF,BMP,JPG,三種圖片格式,請檢查“保存到”編輯窗口的圖像名
尚書7號OCR軟件是MICROTEK中晶科技公司,向漢王科技購買授權(quán),贈送給用戶使用的軟件。尚書七號是一款專門為識別文字而研發(fā)的軟件,尚書七號是應(yīng)用OCR技術(shù),為滿足書籍、報刊雜志、報盤票據(jù)、公文檔案等錄入需求,實(shí)現(xiàn)系統(tǒng)管理方式而設(shè)計的軟件系統(tǒng)。尚書七號OCR軟件適用于個人、小型圖書館、小型檔案館、小型企業(yè)進(jìn)行大規(guī)模文檔輸入、圖書翻印、大量資料電子化的軟件系統(tǒng)。
中文名尚書七號
簡繁字集:除了簡體漢字外,還可以混識臺灣繁體字5400多個以及香港繁體字和GBK漢字。
識別字體種類:能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,并支持多種字體混排。
識別字號:初號 小六號字體。
表格識別:可以自動判斷、拆分、識別和還原各種通用型印刷體表格。
可支持繁體WINDOWS系統(tǒng)
這是一個萬能的OCR文字識別工具,尚書七號文字識別軟件它不僅支持圖片轉(zhuǎn)文字、截圖轉(zhuǎn)文字等操作,其中的圖片轉(zhuǎn)表格功能,還可以識別文字與排版,將圖片轉(zhuǎn)為表格文檔。
辦公軟件是幫助我們進(jìn)行工作輔助的有力道具,而且智能手機(jī)的強(qiáng)大功能,許多軟件都推出手機(jī)版,讓你隨時隨地
進(jìn)入專區(qū)>專業(yè)的游戲下載、綜合門戶網(wǎng)站
Copyright 2009-2016 www.i95191.cn 版權(quán)所有
鄂ICP備17018784號-1
熱門評論
最新評論