一、获取图像
有两种获取图像的方法:
1、直接输入磁盘上已经有的图像文件。
选择【文件】菜单下的【输入图像文件】命令,或者点击工具条的【输入图像】工具,弹出打开文件对话框,选择要识别的图像文件。
方正锐思3.5支持.BMP、.TIF、.JPG(JPEG)三种图像格式。
2、通过扫描获取图像。
选择【文件】菜单下的【扫描图像】命令,或者点击工具条的【扫描图像】工具,通过扫描仪把印刷品扫描到方正锐思3.5里。
建议:扫描时设置扫描原稿为“文字”,扫描类型为黑白二色,分辨率最好设置为300dpi。
二、版面纠斜
扫描时若图像倾斜,对识别效果有较大影响,需要在识别前对图像进行版面纠斜。方正锐思3.5的自动纠斜功能减轻了用户的这部分工作。在缺省情况下,【文件】菜单下【选项】中的【自动倾斜校正】选项是选中的,无需用户干预。若未选中此项,用户也可点击工具条中的【版面纠斜】工具,主动对版面进行纠斜。
三、版面分析
版面分析就是对图像进行识别前的处理,目的是为识别作准备,包括区域划分、确定每个区域的属性(文本、图像、表格)等。版面分析由方正锐思3.5在识别前自动完成,用户也可手动操作完成。
版面分析可以识别整个图像,也可以只识别图像部分区域的内容。
选择【图像】菜单下的【版面分析】命令,或者直接点击工具条的【版面分析】工具,方正锐思3.5会给当前图像划分出若干个区域(框)。
也可以用鼠标直接在图像上画矩形框。假如不选择区域则会对整篇图像进行识别。
可以画多个框,每个框都有编号,编号从0开始计数。识别时是按照框的标号顺序进行识别的。
画框后,可以用鼠标拖动框边线调整框的尺寸。用鼠标点击框中的区域不松开可以拖动框的位置。
未选中的框显示为蓝色,选中的框显示为红色,进入【手工调整框顺序】状态的框显示为绿色。
4、识别
设置好区域后,选择【识别】菜单下的【识别】命令,或者点击工具条的【识别】工具进行识别。弹出识别进度条:
若有多个框,则方正锐思3.5将自动按框的标号顺序进行识别。
等待一段时间后,识别的结果显示在后编改视图的右上部分窗口里。右下的窗口显示原始图像文件。
5、后编改
在后编改视图里对识别结果进行修改,可对照下面窗口显示的原始图像纠正识别错误的文字。有疑问的字符显示为蓝色。
识别完成后,方正锐思3.5自动进入后编改窗口
后编改窗口的最上面显示出当前光标所在位置的字符以及前相关字符和后相关字符供选择。
后编改窗口支持输入和删除,可直接进行编辑修改。其中,输入的字符以紫色显示。
或者通过选择【编辑】菜单的【上一疑问处】和【下一疑问处】命令对有疑问的字(蓝色字符)进行修正。修正后的字符以紫色显示。
6、通过后编改后的文字内容就可以输出了。选择【文件】菜单下的【输出识别结果】命令,弹出对话框,把当前正在编辑的文本输出为一个WORD文件或文本文件,或两种文件格式同时输出。
若选择【输出识别结果到同一文件】,则把当前工程里所有图像的识别结果都输出到一个文件里。
或者直接选择工具条的【输出结果】工具,则把当前选中图像的结果输出,弹出【输出识别结果】对话框,选择输出的目标路径,以及输出的格式,点击【确定】按钮。
方正锐思3.5支持输出的文本文件类型有三种:MS WORD文件(.doc文件)、文本文件(即.txt文件)、文本文件(.txt)&& MS WORD文件。