|
紫光OCR7.5专业版使用较为简单,有些用户初次接触该软件,使用上不太熟练,往往会碰到一些问题,下面就实际使用做一点介绍:
一、扫描文字
同扫描图象一样,首先启动OCR软件,在其中调出扫描仪驱动界面后,扫描文稿,而后退出扫描界面,对扫描后的文稿画框、倾斜校正、识别和存盘。 扫描时的注意事项
1、分辨率的设定 原稿字号小于5号字时,分辨率设为600DPI;其余为300DPI。
2、亮度值(也称临界值或阀值;根据扫描仪界面不同)的调节 一般情况下,使用默认值即可,若预扫描后,文字图象过深或过浅(报纸类原稿预扫描结果会较深;铜板纸类原稿预扫描结果会较浅),可能会影响识别率,需要在扫描仪驱动界面上做亮度(临界值或阀值)调节,以便在最终扫描时,可以更适合于OCR进行识别。不少用户是因为未调节相应的亮度值,从而导致最后识别文字的结果不理想甚至很差。
3、扫描仪的设置 扫描仪驱动界面上的设置:扫描模式只能设置为黑白二值(或称为文字Text lineArt),不应该设置为彩色模式或灰度模式;在“滤镜”上调节成“无”,不使用任何滤镜;也不应该使用去网功能。
二、识别时的注意事项
1、注意字体的选择 本OCR可识别“简体多体”、“繁体多体”、“纯英文”和“手写体”,根据需要选择。
2、注意排版格式 具体包括“横排正文”、“竖排正文”、“表格”和“图形”,同样按照原稿具体情况而定。选择表格识别时,应选择图标栏上的相应的“表格”图标键。
3、多栏识别 原稿为多栏时,应按文章的顺序,逐栏画框操作,以便按顺序进行识别,给以后的版面文章的恢复做准备,否则以后文章的顺序会出现混乱。
三、存盘的注意事项
1、一般文件 普通文章可以在识别后,直接存储为*.TXT文件,效果同普通打字输入是一样的。
2、版面恢复 如果是表格或者是多栏文章,最好存为*.rtf文件。具体方法是(以表格为例):识别后,在“文件”菜单内选择“导出”命令,选择*.rtf文件格式,起文件名存盘。而后在WORD 97内直接打开该RTF文件,可以进行进一步编辑和打印等操作。
3、识别后的表格恢复EXCEL电子表格形式
(1)根据需要,用户往往要将识别后的表格转为电子表格,以便在以后调入其他应用软件内使用。这是可以实现的,具体方法如下:按照正常表格识别及其存盘(*.RTF文件),自word97内调出该文件,进行校对和修改;而后另存为*.htm文件;再从EXCEL内调出已经存好的*.htm文件,选择另存为*.xls文件即可将该表格转换成了EXCEL表格。
(2)以“复制”和“粘贴”法进行表格转换:在WORD内,单击点选所要转换的表格,自“表格”内执行“选定表格”;自“编辑”内选择“复制”,将表格复制到剪贴板上;启动EXCEL工作表状态,光标移动到插入的地方,自“编辑”菜单内选择“粘贴”即可将表格复制到了所需位置,存盘后,形成EXCEL表格。
四、多页批识别功能
若需识别的文章有多页组成,使用OCR的批量识别功能十分方便。首先将多页文件以TIF的格式按页面顺序依次扫描后存盘。而后再打开它们,一次性进行批量识别,好处是速度快,效率高。(要求:文件版面不可太过复杂,页数根据计算机配置适量进行多页批量识别) 批量识别的方法:
1、 启动紫光OCR7.5,选择“打开”文件命令。
2、 在“打开”对话框中,勾选右下角“[V]打开多页”选框,出现下拉界面。
3、 再上栏中按顺序依次选择文件名,而后选择“增加”,文件随即加入下栏内。
4、 选择完毕,执行“打开”命令。
5、 根据需要,选择文件的格式及字体。
6、 自“命令”菜单内,选择“识别所有页”。
7、 待全部识别完成后,选择退出标记,关闭OCR7.5。
8、 出现“关闭所有文件”窗口后,勾选“合并所有结果文件”,点按“合并为”按钮,将合并后的文件以TXT文件格式定义,起文件名后,点“保存”,退回到“关闭所有文件”窗口。
9、 其余项目根据需要选或不选,并点“确定”,文件识别及合并完毕。 对识别与合并后的文件进行编辑:
1、 启动WORD。
2、 选择“打开”文件,找到所需编辑的文件后,点“打开”。
3、 自“格式”菜单内,选择“自动套用格式”。
4、 选择“现在自动套用格式”(默认“常规文档”),选择“确定”。
5、 根据需要,做手动调整(段落、行间距、缩进等)。
6、 进行重新排版编辑、存盘或打印。
常见问题:
1. 识别后出现乱码
1) 分辨率设定太低,一般应设定为300dpi。
2) 扫描时误设定了镜像,将文字扫描反了。
3) 原稿不清(如传真件、油印试卷、报纸等),若是报纸可使用调节临界值或亮度以得到较好的扫描效果并提高识别率。
4) 设定识别模式不对(纯英文、繁体多体等)。
2. 不识别
1) 是否扫描结果为黑底白字。
2) 是否含有图形、表格等。
3) 是否版面分析做的不正确(横排正文、竖排正文、表格、图形等)。
4) 表格过于复杂会造成识别一半或不识别等错误。
3. OCR在扫描时报“非法操作”
1) 是否扫描时设置为“彩色或灰度”方式,OCR只能设定“黑白”方式进行文字扫描。
2) OCR的版本是否为3.5。 4.OCR识别繁体字得到简体字而非繁体字? 请在select znner-coder种选择GBK-code(All China)
5.OCR扫描时,报“装入TWAIN.dll错误”
1) 使用的是否为紫光扫描仪。
2) 是否未安装扫描仪的驱动。 6.退不出OCR? 在退出OCR的窗口中是否将“合并所有结果文件”或“以新文件命名”选中,而未命名。 |