注册 登录
编程论坛 C++教室

求助,想用c++编写一个汉字识别的东东

p_c 发布于 2015-05-10 23:19, 647 次点击
一个小程序,可以识别文字信息,不管是图片里的还是word里的,最好是图片里的也能识别,现在一点想法都没有,请大神们指教。
7 回复
#2
诸葛欧阳2015-05-11 02:11
图片里的文字很难识别吧,有的文字是以图形的方式储存的
#3
诸葛欧阳2015-05-11 02:12
一般都是用扫描器扫描的
#4
wp2319572015-05-11 05:52
百度一下ocr
#5
yangfrancis2015-05-11 07:32
多数登录程序之所以要求验证码,一个重要目的就是确认该次登录是人为行为,不是木马软件登录。要是这种图片文字也被识别了的话……后果你知道的。
#6
wmf20142015-05-11 08:26
图像识别技术繁多,那都是高大上的项目,不是说做就能做到的。
敢问楼主数学功底如何?如果高等数学一般,我建议你还是做些其他的吧,20岁前数学没打好基础,以后用双倍的努力也补不回,光一个Canny算子边缘检测就会弄得你找不着北的。
#7
rjsp2015-05-11 16:25
我用开源的 tesseract-ocr
记得要进行一下样本训练,否则识别率接近零。
#8
p_c2015-05-14 21:40
额  没想到这个东西这么高深,我的想法其实很简单,就是因为有些pdf文件中全是图片存的文字信息,粘贴复制起来很不方便,所以才有此想法,看来自己的功底还是不够啊,谢谢各位的宝贵建议,在下一定好好努力
1