版本:v1.0.0.1 中文已注册免费版大小:44.4M
类别:文字处理系统:WinAll, WinXP
立即下载尚书七号ocr破解版是一款比较专业的文字识别软件,具体使用步骤下方有详细的叙述,跟汉王之类的ocr大致相同,具体都在一些小细节和识别率方面有点差别,推荐给有需要的用户下载使用!
本程序系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的程序系统。 目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的程序系统来满足这种海量录入需求。本程序系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的程序系统。
识别字符
简体字符集:国标GB2312-80的全部一、二级汉字6800多个。纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
识别字号 初号 小六号字体。
表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。
可支持繁体WINDOWS系统
1、打开尚书七号软件程序
2、填写姓名、公司和序列号,已经自动集成填写【序列号SSH70 20020307】单击下一步继续安装
3、选择安装的地址(一定不要放在系统盘里哦),然后点击下一步
4、稍等一会儿就可以安装完成了
首先把图片保存成分辨率300以上(别再低了)的jpg图片,tif好像也可以。
在尚书七号软件中打开图片,点击放大或者缩小调整好画面大小,然后选择区域,点击“识别”——“开始识别”,确定好后输出就可以了!
具体操作步骤
步骤1:获取文字图像文件。
选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开)命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。
步骤2:对扫描的图像页进行调整
选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”(提供自动和手动实现方法)及“旋转”等命令,将扫描的图像页进行调整。
步骤3:版面分析与文字识别转化
版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。
设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。
步骤4:校对修改
自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够提供识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法(如图3出现的黄色提示行的出现)。
提供的校对方法,一眼就能够看到图像原文和识别出文本的差别,如果发现识别有误,可以进行修改。
步骤5:输出
如果检查修改后确认无误,选择识别结果的“输出”菜单,输出的文件格式有:RTF、HTML、XLS、22238,可以根据自己的需要选择对应的格式。如果用户想得到类似原文的识别结果,请选择RTF格式。把RTF格式输出的文件用word打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。
1、扫描设置不当,扫描图像时的扫描分辨率(Resolution)一般应设为300dpi,如果文档字体较小则需要将扫描分辨率设定为更高值如400dpi或600dpi。缩放比例(Scaling)设为100%,亮度阀值(Threshold,Brightness)需根据纸张和印刷的质量调节,避免扫描图像过黑或过淡 。
解决方法:
1.尚书七号识别图片时如果全部显示乱码,说明图片的分辨率较低,无法识别。
2.这时候可以用photoshop把图片分辨率调大,这样分辨率高了,虽然看清来不清晰,但是对于尚书七号来说足够了。
2、如自动版面分析有错误,这时请用户用鼠标自己划分出正确的版面块;版面块的版式设置错误,如将横版的设置为竖版,竖版的设置为横版等,这时请用户自行将块的版式修改正确。
3、原稿印刷质量太差,笔画断裂严重、油墨太浓、字与字之间粘连严重等也可能使识别率显着降低。
4、识别语言选项选择不当,应根据原稿正确选择“简体”、“简繁”或“英文”。
查看全部