asysbang

 找回密码
 立即注册
查看: 2956|回复: 0
打印 上一主题 下一主题

text2img

[复制链接]

520

主题

2

好友

6551

积分

管理员

Rank: 80Rank: 80Rank: 80Rank: 80Rank: 80

最佳新人 活跃会员 热心会员 推广达人 宣传达人 灌水之王 突出贡献 优秀版主 荣誉管理 论坛元老

跳转到指定楼层
楼主
发表于 2019-9-5 17:13:46 |只看该作者 |倒序浏览
将文字转化成图片,这个对于生成训练数据有很大的作用
尤其是tesseract 4.0

text2image --find_fonts --fonts_dir ~/.fonts --text training_text.txt --min_coverage .9  --outputbase result --render_per_font=false

这里用的是~/.fonts目录下自己新添加的手写字体
Total chars = 767
Font Monaco failed with 10 hits = 1.30%
laowu Medium : 767 hits = 100.00%, raw = 362 = 100.00%

一定要看到raw这样的才是可以使用的字体

!!!生成tif时,一定不要加“--find_fonts”这个参数,否则上面会有说明的字符串,并且不能生成box文件
text2image  --fonts_dir ~/.fonts --text training_text.txt --min_coverage .9  --font "laowu Medium" --outputbase result
成功的话会生成tif和对应的box文件,可以用jtessBoxeditor查看

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|aSys-帮 ( 京ICP备13033689号 )

GMT+8, 2026-1-28 23:17 , Processed in 0.040198 second(s), 19 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部