微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

ocrstyle 图片识别文字

程序名称:ocrstyle

授权协议: BSD

操作系统: Windows

开发语言: C/C++

ocrstyle 介绍

Optical Character Recognition

背景

本程序最初是想用于发票识别的,目前可以通过ocrengine和imageprocess动态库进行二次开发。

功能

编译环境

  • ocrstyle 使用的Qt4.8开发的。
  • ocrengine 使用Visual C++ Express 2008开发的。这个工程依赖third-party目录下的Tesseract OCR开发库,目前是google维护的,当时开发的时候官方只有VC2008的开发库,于是就用的VC2008开发了。项目地址:http://code.google.com/p/tesseract-ocr/。
  • imageprocess 使用的Visual C++ Express 2010开发的。这个工程依赖于OpenCV。项目地址:http://opencv.org/
  • buildscripts/ocrstyle.nsi 打包安装包使用的NSIS。

动态库的接口

  • ImageProcessAPI.h 主要功能:图像的加载、灰度处理、倾斜校正、保存等。
  • OCREngine.h 主要功能:配置识别的语言、传入要识别的图像数据、获得文本。

思路

  • 扫描的电子发票一般都有点倾斜,所以要对图片进行倾斜校正。为了方便识别需要进行灰度处理。
  • 一般是要识别发票上的部分内容,所以要想办法把要识别的文本区域的图像数据传给Tesseract OCR,然后获得文本。

ocrstyle 官网

https://github.com/vwarship/ocrstyle

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐