OCR随心提供快速,准确的整页光学字符识别(OCR)软件开发。NET和ActiveX COM工具包。使用OCR整页文本识别,自动旋转,以及创建可搜索的文档随心添加到您的应用程序。
该软件开发工具包(SDK)也支持纠偏,二值化,字符的神器出山:www.shenqi73.com位置信息,并分割文件,图像和文本元素。它支持输出到多个文本和文本加图像格式,包括Microsoft Word兼容的RTF文件和标准的Adobe PDF文件。
识别文本13种语言:英语,德语,法语,西班牙语,葡萄牙语,意大利语,瑞典语,荷兰语,丹麦语,匈牙利语,波兰语,挪威语和芬兰语。 OCR随心为每种语言提供了一个字典,并且还支持用户自定义字典的话,是特定于应用程序的。
在OCR Xpress的自动旋转功能检测图像中的文本的正确方向,并相应地转动整个页面。它也可以在扫描过程中,成为歪斜歪斜文件。
字符的位置信息,让用户纂或突出显示文本的OCR Xpress的使用所包含的NotateXpress组件中的原始图像。用户也可以建立自己的PDF文件,使用位置信息隐藏的文本放置在正确的位置。报告的识别为每个字符的信心的帮助,也可以使用OCR随心一并与其他如OCR引擎SmartZone执行投票,从而提高所得的识别精度。
OCR随心标志字符识别低的信心,使开发人员能够轻松地构建到他们的应用程序中的文字校对和字符替换等功能。这使用户能够作出检讨及修正文本之前输出
下面是一些主要特点的“OCR随心的ActiveX”:
技术说明
·编程环境:Win32可视化的开发环境,包括Visual Studio 2008
·示例代码包含:VB.NET,C#,VB,DELPHI,VC + +,HTML
·面向对象的API。NET用户
·部署。NET内作为管理控制,是完全符合的。NET 1.1及以上
也可以用在任何开发环境承载ActiveX COM管制的
·可用于在多线程环境中执行线程安全的同步处理()。
·支持用户指定的调试日志记录级别
·客户机/服务器的Web开发能力
·执行操作的黑白和彩色图像,包括提取彩色图像的能力,并将其插入到可搜索的文档
·支持文件含有高达999页
文本和字体风格辨识
·执行OCR的数字图像上,提供中的文本:
·适当的衬线字体,无衬线,或等宽字体风格
·A是最接近正常,粗体,斜体或粗斜体的形式公认的字体的字体
·在很宽的范围内的字体大小缩放
语言识别
·识别文本在英语,法语,德语,意大利语,西班牙语,葡萄牙语,丹麦语,荷兰语,瑞典语,挪威语,匈牙利语,波兰语,和芬兰
·认识一种语言在一个时间
·包括所有支持的语言的字典
·接受并应用用户定义的词语在自定义词典
自动旋转
·接受输入图像在任何方向自动旋转0度,90度,180度或270度
·返回施加的旋转量
·使用文本来确定方向
·高度优化的速度
字符位置信息
·返回字符的所有字符的位置信息(确认有高有低的信心)
使用此功能纂或突出显示文本使用所包含的NotateXpress组件的原始图像。
·使用此功能来建立你自己的PDF文件,使用位置信息隐藏的文本放置在正确的位置。
·使用中的每个字符的识别置信OCR随心和其识别引擎一起与其他OCR引擎,如SmartZone,执行投票,从而提高了两个引擎的识别精度。
文字纠错能力
·识别字符识别低信心
·修正文本之前输出的文档
·建立到应用程序中的文字校对和字符替换功能
图像二值化
·创建从24位彩色和8位灰度的黑白图像的图像文件格式,图像的输入和转换ImagXpress文件V8提供的支持
·保留非文本的颜色区域重新插入到输出文档
偏移校正
·全页去歪斜的影像上,以15度的倾斜
图像输入
·OCR随心包括的的ImagXpress文件(阅读完整的的ImagXpress文件V8产品说明),图像输入(包括TIFF,JPEG,JBIG2,更多)
·输入未编程内存中的图像数据
文件输出格式
·OCR随心的输出是一个数字文件,其中包含未格式化的文本,格式化文本,或格式化文本加图像数据,在多种文件格式提供。随心专业OCR下面列出的所有类型的文件,包括PDF输出。 OCR随心标准输出下面列出的所有文件类型,除了PDF。
·ASCII
没有换行符的ASCII码
ASCII换行
ASCII码和智能格式(定位与空间)
ASCII,逗号分隔(每行一个领域)
ASCII,制表符分隔
·Excel中V2.X(与后来的版本兼容)
·HTML的子文件夹相同的名称中包含图像,
·PDF
PDF?可检索的图像(原始图像与隐藏文本),PDF版本1.4文件(专业版)
PDF格式的文本和图形(标准),PDF版本1.4文件(专业版)
PDF图片,PDF版本1.4文件(专业版)
·RTF用于导入到Word,WordPerfect中,等等。
·的WordPerfect 5.0,WordPerfect 5.1软件
·所有图像文件格式ImagXpress(请参阅“支持的文件格式”ImagXpress文件支持)
分割
·自动或手动定位的输入图像的区域和拣选它们作为任一图像(可以保留其颜色)或含有可识别的文本区域
·访问各地区分别,或重新组合成完全格式化的文件,如RTF或PDF文件
限制:
·水印输出文件