您的位置:首页 > 软件下载 > 图像处理 >
形文通用表单识别软件

形文通用表单识别软件

  • 类型:图像处理
  • 大小:39.6M
  • 平台:WinAll
  • 语言:简体中文
  • 版本:2010.1.2.100225
  • 时间:2022-09-06 18:25
软件简介
基本简介 形文通用表单识别软件

《形文通用表单识别软件》是利用光学字符识别(OCR)技术,自动识别采集表单上要素信息,用以代替传统的手工录入模式,提高工作效率,节约企业成本。
《形文通用表单识别软件》使企业实现各类表单自动录入,是实现企业电子信息化的优选产品。它能高效地处理金融、工商、税务、教育、统计等各行业的各类表单,并且该系统支持多种表单混合识别,如转账支票、汇款单、进账单、税单、问卷调查等表单样式识别及表单要素信息识别的自动录入。
二、 产品的组成
1. 配置工具
配置工具是用户定制表单识别方案的应用程序。用户可以使用配置工具定制单种或多种表单混合的识别方案。

2. 识别引擎
识别引擎是根据表单识别方案和表单图像,进行识别处理,获取表单要素信息的软件模块。
系统提供了强大的API接口,方便用户而把识别软件嵌入相应的应用系统中,满足各行各业的需求。
API接口如下表:
函数名 函数说明
CreateInstance 创建一个识别引擎实例
FreeInstance 释放指定识别引擎实例
UploadScheme 加载表单要素识别方案
ImageFileToBitmapStream 将其它格式的图像文件转换成位图流
ReviseBitsDPI 修正表单图像分辨率
CalculateOtioseBorder 计算图像黑边参数
PruneOtioseBorder 根据参数剪除图像黑边
RecognizeForm 表单识别
GetFormInfo 获得表单识别信息
GetElementInfo 获得要素识别信息
GetCellInfo 获得单元识别信息
GetCharacterInfo 获得字符识别信息
GetRectInOriginalBits 得到指定范围在原始图像上的映射范围

3. 测试工具
测试工具是用于测试表单要素识别效果的应用程序,使用它可以方便了解识别效果和快速统计识别的通过率。
测试工具界面如下:

三、 产品功能
1. 强大表单样式识别,系统基于表格特征提取及表单中线的定位,自动区分表单类型。表单识别和要素识别是一个集成的产品,两者可以一起使用也可以独立使用一个功能。
2. 智能识别引擎。识别引擎不但识别字符类型丰富,还可以识别非字符信息,如条形码、勾选框、答题卡、LOGO等各种影像信息。
3. 提供功能灵活的模板制作工具,通过模板制作工具,用户在很短的时间内就能够定制完成自己的识别模板;
4. 具有自动倾斜校正、自动判断表格是否颠倒并进行正转等功能;对于扫描影像的黑边能自动判别并自动去除。
5. 丰富的编程接口,用户可以根据实际情况,将核心灵活地嵌入到所需的应用程序中。

四、 技术特点
《形文通用表单识别软件》可实现自动区分表单种类、自动提取识别表单所有数据、自动校对识别结果等功能。与目前其他通用识别技术相比,具有如下特色:
1. 易用性
配置工具提供了强大表单识别方案的定制,可以定制各类各行业表单的识别方案;API函数提供了强大的二次开发接口,方便用户自定义开发;测试工具根据配置好的方案和图像文件,可以直观的看到识别结果,方便客户进行测试和演示。
2. 识别引擎
表单样式识别采用直线提取算法,快速提取表单的直线特征,然后根据直线特征进行样式识别和重叠处理,效果优异。
表单要素识别使用了先进的神经网络、人工智能技术,具有良好的识别效果,尤其在手写体字符的识别上,与同类产品相比较,有明显优势。
3. 定制工具
产品为表单要素识别提供配置工具,可以通过参数的方式定制表单要素的识别方法和识别过程,使应用开发商具备了自主的二次开发能力,可为最终客户快速展示识别效果。
4. 适应性强
产品根据多年积累的表单要素识别的研发经验,针对表单的各种情况,进行了全面的归纳、分析和总结,使产品具有较强的适应能力,能适应较多表单识别的需要;支持多种表单影像源(如黑白二值、灰度、彩色影像),支持各种通用影像格式(如BMP、JPG、TIFF等),对各种书写方式(如:手写、机打、印制),书写格式(如:连续、线隔、字隔、方格),书写样式(如:字体、颜色),可能出现的噪声,有着较为全面的考虑。
5. 扩展特性
产品采用扩展性较强的结构设计,除内置的要素通用识别方法和要素专用识别方法可根据需要扩展外,还预留了要素定制识别方法的接口,在内置的通用方法和专用方法无法满足用户需要的情况下,可根据用户的特别需要定制特别识别方法。

五、 技术参数及运行环境
1、表单样式识别率
通过率99%以上,误识率为零。
2、单字符识别率
根据实际应用及测试结果,本产品针对各类单字信息识别率可以达到如下指标:
印刷数字:99%
印刷英文:99%
印刷汉字:99%
手写数字:98%
手写英文:98%
手写大写金额:98%
3、要素识别率
在实际的应用环境中,目前针对北京地区10万张支票的各要素识别率统计情况,系统可以达到如下指标:
支票号:99%
日期:94%
账号:98%
大写金额:90%
小写金额:90%
支付密码:86%
磁码:99%
4、替代人工率
整票识别正确率大于70%;如果按照每张支票7项要素计算,实际需要人工干预占5%。
5、系统运行环境
操作系统:Windows 2000/XP
网络环境:TCP/IP协议的网络环境

六、 适用范围
1、政府部门:各种申请表、申报表的录入及其处理
银行、证券、保险部门:大量的存单、储单、支票、内2、部流转票据、证券买卖单据、保险单的录入及其处理
3、工商、税务部门:各种纳税申报表、财务报表以及汇算清缴表的录入及其处理
4、统计部门:各类社会调查表(如人口普查表、农业普查表、商业调查表)的录入及其处理
5、人事部门:人事登记表、人事测评考核表的录入及其处理
6、教育、医疗部门:成绩单录入、病情统计表的录入及其处理
7、制造业:进出库票据、定货单的录入及其处理
8、企、事业单位:财务报表、单位内部报表、产品发布时订单的录入及其处理
9、其它行业或部门表格数据录入

相关最新
最新推荐
本类推荐
软件排行