VerySource

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 4833|回复: 27

渴求OCR文字识别技术支持

[复制链接]

1

主题

7

帖子

6.00

积分

新手上路

Rank: 1

积分
6.00
发表于 2020-12-14 15:30:01 | 显示全部楼层 |阅读模式
前一段时间拿到毕业设计的题目《OCR文字识别系统设计》,当时头脑一片茫然~~~
要求实现图文转换,主要指将常用图像(.bmp|.jpg|.gif|.pdf)中的文字信息提取到常用文档(.txt|.doc|)中,识别效率要求为80%。开发工具自选。
  从来没接触过这个东东,真不知如何下手。
  望各位高手不吝传授相关知识与技术。
回复

使用道具 举报

1

主题

7

帖子

6.00

积分

新手上路

Rank: 1

积分
6.00
 楼主| 发表于 2020-12-14 15:45:01 | 显示全部楼层
英文,汉字编码,也请各位告之。
回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-12-21 13:45:01 | 显示全部楼层
你要能实现了就牛逼了,靠你肯定实现不了
回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-12-21 14:00:01 | 显示全部楼层
自己把字库的信息都读进来,图片里面的字的字体,大小,格式得一摸一样,而且然后一个点一个点的去对,看看大概百分之多少是匹配的,然后给个阈值,超过这个阈值的就认为是匹配的了。
以上是最理想的状态了,自己在画图板里面写几个字进去,而且位置,颜色也最好固定。不理想的状态就是你得自己做文字定位,二值化处理,还有模糊识别。。。
要是让你识别扫描的图片,可以明确的告诉你这个识别率是不可能达到的。
回复

使用道具 举报

0

主题

11

帖子

11.00

积分

新手上路

Rank: 1

积分
11.00
发表于 2020-12-21 14:15:01 | 显示全部楼层
ocr识别本身就是个技术难点
你们老师真够为难你 你告诉他 做不了
他肯定会给你降低要求的
回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-12-21 14:30:01 | 显示全部楼层
识别数字最简单

小波算法  看看吧  不过准确率要看输入的情况
回复

使用道具 举报

1

主题

7

帖子

6.00

积分

新手上路

Rank: 1

积分
6.00
 楼主| 发表于 2020-12-21 16:15:01 | 显示全部楼层
可是她告诉我说,她不会。让我自己搞定,~~`走一步算一步了
回复

使用道具 举报

1

主题

39

帖子

27.00

积分

新手上路

Rank: 1

积分
27.00
发表于 2020-12-21 20:00:01 | 显示全部楼层

我觉得识别一方面考虑算法,一方面可以考虑一些限制条件。
回复

使用道具 举报

0

主题

46

帖子

23.00

积分

新手上路

Rank: 1

积分
23.00
发表于 2020-12-21 20:15:01 | 显示全部楼层
让你写分析、设计,就是说不用先实现的,还没到编写代码的阶段。。
  

回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-12-21 20:30:01 | 显示全部楼层
现在的学校都很nb啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|CopyRight © 2008-2023|verysource.com ( 京ICP备17048824号-1 )

快速回复 返回顶部 返回列表