《手写数字识别技术的应用.doc》由会员分享,可在线阅读,更多相关《手写数字识别技术的应用.doc(9页珍藏版)》请在咨信网上搜索。
(完整版)手写数字识别技术的应用 手写数字识别技术的应用 林晓帆 丁晓青 吴佑寿 手写数字识别(handwritten numeral recognition)是光学字符识别 技术(optical character recognition,简称ocr)的一个分支,它研究的 对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。 在整个ocr领域中,最为困难的就是脱机手写字符的识别。到目前为 止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就, 但距实用还有一定距离.而在手写数字识别这个方向上,经过多年研究, 研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输 入提供了一种解决方案。 一、研究的实际背景 字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是 用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息, 目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统; 另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号 和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理 这类信息的核心技术是手写数字识别.这几年来我国开始大力推广的“三 金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别 技术实现信息的自动录入,无疑会促进这一事业的进展。因此,手写数字 的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大 的社会和经济效益。 二、研究的理论意义 手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论 价值: 1.阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的 研究基本上与文化背景无关,这样就为各国,各地区的研究工作者提供了 一个施展才智的大舞台。在这一领域大家可以探讨,比较各种研究方法。 2.由于数字识别的类别数较小,有助于做深入分析及验证一些新的 理论。这方面最明显的例子就是人工神经网络(ann)———相当一部分 的ann模型和算法都以手写数字识别作为具体的实验平台,验证理论的有 效性,评价各种方法的优缺点. 3.尽管人们对手写数字的识别已从事了很长时间的研究,并已取得 了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比, 这仍是一个有难度的开放问题(openproblem). 4.手写数字的识别方法很容易推广到其它一些相关问题———一个 直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数 字和英文字母的识别放在一块儿研究的。 三、研究的难度 数字的类别只有十种,笔划又简单,其识别问题似乎不是很困难。但 事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正 确率高,甚至也不如联机手写体汉字识别率高,而只仅仅优于脱机手写体 汉字识别。这其中主要原因是:第-,数字的字形信息量很小,不同数字 写法和字形相差不大,使得准确区分某些数字相当困难;第二,数字虽然 只有十种,而且笔划简单,但同一数字写法千差万别,全世界各个国家各 个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界 各种写法的极高识别率的通用性数字识别系统。另外,在实际应用中,对 数字识别单字识别正确率的要求要比文字要苛刻得多。这是因为,数字没 有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及的财 会、金融领域其严格性更是不言而喻的。因此,用户的要求不是单纯的高 正确率,更重要的是极低的、千分之一甚至万分之一以下的误识率。此外 ,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度 过低的方法是行不通的.因此,研究高性能的手写数字识别算法是一个有 相当的挑战性的任务. 四、学习和测试样本库的选择 正如前一部分提到的,手写数字的写法带有明显的地区性和民族性, 因而选择一个可供系统训练和测试使用的样本库是手写数字识别研究的重 要基础之一,对识别系统的性能也有重要的影响。研究者对所需的样本库 有两种选择:一是自己根据需要建立专门的样本库,二是选用其它机构做 好的现成的样本库。前者的优点是帖近自己的应用,缺点也是明显的:要 费相当的精力且代表性很难保证,与其它人的结果不好比较。因此,现在 的趋势是使用有权威性的通用样本库。目前,比较有代表性的、样本数量 较大的手写数字样本库有:(1).nist数据库,由美国国家标准与技术 局收集;(2).cedar数据库,是由纽约州立大学buffalo分校计算机科 学系文本分析与识别中完成的邮政编码的样本库;(3).etl数据库,由 日本电工技术研究所收集;(4).itpt数据库,由日本邮电通信政策研 究所收集。 五、识别系统性能的评价 作为一个识别系统,我们最终要用某些参数来评价其性能的高低,手 写数字识别也不例外。评价的指标除了借用一般文字识别里的通常做法外 ,还要根据数字识别的特点进行修改和补充。 对一个手写数字识别系统,可以用三方面的指标表征系统的性能: 正确识别率aΚ正确识别样本数/全部样本数*100% 替代率(误识率)sΚ误识样本数/全部样本数*100% 拒识率rΚ拒识样本数/全部样本数*100% 三者的关系是:a+s+rΚ100% 数字识别的应用中,人们往往很关心的一个指标是“识别精度”,即 :在所有识别的字符中,除去拒识字符,正确识别的比例有多大,我们定 义: 识别精度pΚa/(a+s)*100%。 一个理想的系统应是r,s尽量小,而p,a尽可能大。而在一个实际系 统中,s,r是相互制约的,拒识率r的提高总伴随着误识率s的下降,与此 同时识别率a和识别精度p的提高。因此,在评价手写数字识别系统系统时 ,我们必须综合考虑这几个指标。另外,由于手写数字的书写风格、工整 程度可以有相当大的差别,因此必须弄清一个指标在怎样的样本集合下获 得的。 以上多种因素使得不同系统的性能很难做绝对比较,根据作者从文献 中所看到的和在科研实践中的体会,可以认为目前手写数字识别研究的较 高水平是:对自由书写的数字,在不拒识时达到96%以上的识别率;在拒 识少于15%的样本时,误识率能降到0.1%以下。 六、手写数字的识别方法 手写数字识别在学科上属于模式识别和人工智能的范畴。在过去的四 十年中,人们想出了很多办法获取手写字符的关键特征。这些手段分两大 类:全局分析和结构分析.对前者,我们可以使用模板匹配、象素密度、 矩、特征点、数学变换等技术。这类的特征常常和统计分类方法一起使用 。对后者,多半需要从字符的轮廓或骨架上提取字符形状的基本特征,包 括:圈、端点、节点、弧、突起、凹陷、笔画等等。与这些结构特征配合 使用的往往是句法的分类方法. 多年的研究实践表明,对于完全没有限制的手写数字,几乎可以肯定 :没有一种简单的方案能达到很高的识别率和识别精度.因此,最近这方 面的努力向着更为成熟、复杂、综合的方向发展。一方面,研究工作者努 力把新的知识运用到预处理,特征提取,分类当中,如:神经网络、数学 形态学等。作者认为,在手写数字识别的研究中,神经网络技术和多种方 法的综合是值得重视的方向。 七、基于手写数字识别的典型应用 手写数字识别有着极为广泛的应用前景,这也正是它受到世界各国的 研究工作者重视的一个主要原因。下面我们将介绍基于手写数字识别的应 用系统的特殊要求,以及一些以手写数字识别技术为基础的典型应用。 (一)基于手写数字识别的应用系统的特殊要求: 尽管手写数字识别与一般的文本(如:汉字,英文等)识别同属于光 学字符识别(ocr)的大范畴,从应用的角度出发,手写数字识别应用系 统有很多特殊的要求: 1.识别精度要达到很高的水平 在一般的文本识别中,信息的冗余较大,有充分的上下文信息,因而 对识别的精度要求不是十分高,达到98%-99%就足够了。而在数字识别 中,由于没有上下文关系,数据中的每一位数字都至关重要(试想:在财 务报表中,把40,000元认成90,000元,从字符识别的角度仅认错了一个 数字,但对用户而言,这是一个绝对不能容许的错误)。一般来说,这类 实用系统的精度至少应在99.9%以上。前面已经提到,高性能的自由手 写数字识别是一个很困难的问题,至今为止还没有什么方法能与人的辨识 能力相比,那么在目前的技术水平下,如何满足高精度的要求呢? (1)要求书写者用规定的字型认真填写,避免使用某些容易造成混 淆的变体. 这个限制对用户可能是很不方便的,因为这意味着书写速度的降低和 书写习惯的改变,但从整体上,系统的识别水平将有大幅度的提高,能很 大程度上提高系统的运行效率. (2)提高拒识率。 通过提高拒识率就可以减低误识率,直到达到指定的精度要求。当然 ,拒识的增多意味着操作人员的介入的增加,这对用户是极为不利的。 (3)加入逻辑校验。 在通信系统中,人们常通过加校验码来保证数据的高质量传输,常见 的校验码有:奇偶校验,汉明码等。在基于手写数字的应用系统中,我们 也可以采用类似的方法.不过,这时校验方式应尽量简单,直观,利于填 写人快速算出. 2.对处理速度也有很高的要求 数字识别面对的都是极其大量的数据报表,一般都要求达到每分钟几 页到几十页的处理能力(包括扫描到完成识别的全过程)。而众所周知, 处理速度与处理精度是一对矛盾,现在既要达到前面提到的高识别精度, 又要有如此之高的速度,无疑增加了系统的设计难度.不过近年来,硬件 水平提高很快,目前市场上已有较低价格,每分钟可扫描10-20页的高性 能扫描仪;微机的运算速度更是飞快提高。这些都为高的处理速度奠定了 坚实的基础。 3.要能批量自动作业 在一般的文本识别中,多是操作者一页页地送入文本,手工帮助机器 进行版面分割(机器的自动分割能力往往是十分有限的)后再开始识别, 很难保证高质量的批量自动识别。而在数字识别系统中这是一个必须做到 且应能做到的基本要求.原因如下: (1)如果每页的处理都要人手工帮助完成,系统的综合处理速度无 法达到要求; (2)扫描仪的自动进纸(adf-automaticdocumentfeeding)技术已 十分成熟; (3)处理的对象在很多情况下是版面完全相同的大批表格,很容易 作到栏目的自动提取。 4.要有便于批量快速校对修改的手段 (二)手写数字识别在大规模数据统计中的应用: 在大规模的数据统计(如:行业年检、人口普查等)中,需要输入大 量的数据,以前完全要手工输入,则需要耗费大量的人力和物力。近年来 在这类工作中采用ocr技术已成为一种趋势。 因为在这种应用中,数据的录入是集中组织的,所以往往可以通过专 门设计表格和对书写施加限制以便于机器的自动识别。目前国内的大多数 实用系统都要求用户按指定规范在方格内填写.另外,这些系统往往采用 合适的用户界面对识别结果做全面的检查,最终保证结果正确无误。可以 看出,这是一类相对容易的应用,对识别核心算法的要求比较低,是目前 国内很多单位应用开发的热点。 (三)手写数字识别在财务、税务、金融领域中的应用: 财务、税务、金融是手写数字识别大有可为的又一领域.随着我国经 济的迅速发展,每天等待处理的财务、税务报表、支票、付款单等越来越 多.如果能把它们用计算机自动处理,无疑可以节约大量的时间、金钱和 劳力。与上面提到的统计报表处理相比,在这个领域的应用难度更大,原 因有:1.对识别的精度要求更高;2.处理的表格往往不止一种,一个系 统应能智能地同时处理若干种表格;3.由于处理贯穿于整个日常工作之 中,书写应尽量按一般习惯(如:不对书写者的写法做限定,书写时允许 写连续的字串,而不是在固定的方格内书写),这样对识别及预处理的核 心算法要求也提高了。 (四)手写数字识别在邮件分拣中的应用: 随着人们生活水平的提高,经济活动的发展,通信联系的需求使信函 的互换量大幅度增加,我国函件业务量也在不断增长,预计到2000年,一 些大城市的中心邮局每天处理量将高达几百万件,业务量的急剧上升使得 邮件的分拣自动化成为大势所趋。在邮件的自动分拣中,手写数字识别( ocr)往往与光学条码识别(obr---opticalbarreading),人工辅助 识别等手段相结合,完成邮政编码的阅读。目前使用量最大的ovcs分拣机 的性能指标:ocr拒分率30%,ocr分拣差错率1.1%。 九、手写数字识别技术展望 随着国家信息化进程的加速,手写数字识别的应用需求将越来越广泛 ,因此应当加强这方面的研究工作。作者认为,应用系统的性能的关键与 瓶颈仍然在于手写数字识别核心算法性能上,最终目标是研究零误识率和 低拒识率的高速识别算法。此外,尽早建立反映中国人书写习惯的、具有 国家标准性质的手写数字样本库也是当务之急.
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
相关知识
深度学习 花卉识别
深度学习应用开发
【10月23日】机器学习实战(一)KNN算法:手写识别系统
看图识花的算法,如何识别植物?
成都市数字农业创新应用基地建设技术指南
数字农业技术在病虫害防治中的应用
探究在数字技术综合应用下商业插画发展趋势.doc
pytorch实现简单卷积神经网络(CNN)网络完成手写数字识别
遗传标记的发展和分子标记的检测技术(2001年)资源
能源行业碳中和路径下的数字技术(三)——碳汇中的数字技术
网址: 手写数字识别技术的应用.doc https://m.huajiangbk.com/newsview764877.html
上一篇: Pytorch神经网络【手写数字 |
下一篇: 利用Python实现手写数字识别 |