<?xml version="1.0" encoding="gbk"?>
<rss version="2.0">
  <channel>
    <title>asysbang - 中文识别</title>
    <link>http://www.asysbang.com/forum.php?mod=forumdisplay&amp;fid=126</link>
    <description>Latest 20 threads of 中文识别</description>
    <copyright>Copyright(C) asysbang</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Mon, 08 Jun 2026 16:18:32 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>http://www.asysbang.com/static/image/common/logo_88_31.gif</url>
      <title>asysbang</title>
      <link>http://www.asysbang.com/</link>
    </image>
    <item>
      <title>zinnia系列</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=849</link>
      <description><![CDATA[针对手写汉字识别(online)轨迹识别专题

1.zinnia

   make install 之后找不到库文件  可以通过安装zinnia-utils来补救

2.tegaki

 https://github.com/tegaki/

3.wagomu

https://www.cnblogs.com/tomboy/archive/2012/09/23/2698921.html



model ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Thu, 10 Sep 2020 08:09:35 +0000</pubDate>
    </item>
    <item>
      <title>识别分类</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=795</link>
      <description><![CDATA[分为两种：

1.联机手写识别
   基于笔迹的识别   Zinnia
    https://tegaki.github.io/     可以下载到zinnia的中文字库
     Tomoe  和 wagomu 也可以学习一下


2.脱机手写识别
   基于图片的识别]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 25 Mar 2020 07:47:52 +0000</pubDate>
    </item>
    <item>
      <title>tess in android</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=782</link>
      <description><![CDATA[https://github.com/alexcohn/tess-two

原来的https://github.com/rmtheis/tess-two  已经不维护了



编译：
1.下载tess-two 
2.下载tesseract 和leptonica   然后放到tess-two的空目录下

3.tess-two/AndroidManifest.xml  添加

4.tess-two/jni/Applica ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Tue, 31 Dec 2019 07:51:48 +0000</pubDate>
    </item>
    <item>
      <title>中文训练待解决问题</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=777</link>
      <description><![CDATA[1.只针对一种手写字体，从0开始训练

2.增量训练比较chi_sim 和HanS的区别，在基础上实现个别不识别的汉字

3.什么情况下需要评估数据，是否是必须的

4.Phase E: Generating lstmf files  这个怎么变成多线程并发的

         尝试拆分多个训练文本？
        ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Tue, 24 Dec 2019 06:49:23 +0000</pubDate>
    </item>
    <item>
      <title>中文增量训练4.0</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=759</link>
      <description><![CDATA[#在官方中文训练结果的基础上，做增量训练

#背景
几张中文图片，用官方的chi_sim识别效果不理想，需要自己训练，提高识别准确率

#步骤
1.搭建训练环境
   按照官方或者网上教程有很多可以参考，目标是保证tesstrain.sh , lstmtraining等命令可以正确执行

2. ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 13 Nov 2019 03:56:43 +0000</pubDate>
    </item>
    <item>
      <title>字体下载网站</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=751</link>
      <description><![CDATA[http://ziti.sozi.cn/search.php?keyword=%CA%D6%D0%B4%CC%E5&amp;searchtype=titlekeyword&amp;channeltype=0&amp;kwtype=1&amp;pagesize=20&amp;typeid=0&amp;cacheid=8018208&amp;PageNo=22]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Fri, 18 Oct 2019 03:50:25 +0000</pubDate>
    </item>
    <item>
      <title>window编译tesseract</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=749</link>
      <description><![CDATA[===需求===
1.window平台调用tesseract
2.需要编译对应的动态库和静态库

===过程===
1.下载tesseract源代码
2.安装配置cmake ，cppan
3.tesseract目录下执行cppan，下载所需的库
4.创建build_x64目录
5.cmake_ui设置src和build目录
6.configure生成vs项目
7 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Fri, 11 Oct 2019 05:59:09 +0000</pubDate>
    </item>
    <item>
      <title>window编译Leptonica</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=748</link>
      <description><![CDATA[===需求===
1.编译动态库和静态库，可以在vs中使用(for tesseract)

===过程===
1.下载leptonica代码
2.下载cppan和cmake(需要配置环境变量)
3.不要在leptonica目录下执行cppan(否则的话会下载很多依赖的库)
4.在leptonica目录创建build_x64目录
5.cmake 界面so ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Fri, 11 Oct 2019 02:42:54 +0000</pubDate>
    </item>
    <item>
      <title>window平台编译</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=747</link>
      <description><![CDATA[https://ci.appveyor.com/project/zdenop/tesseract/builds/27911843/job/aeb3f1gmrmegfds9?fullLog=true



https://blog.csdn.net/qq_37781464/article/details/89816534]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Thu, 10 Oct 2019 02:57:39 +0000</pubDate>
    </item>
    <item>
      <title>text2img</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=733</link>
      <description><![CDATA[将文字转化成图片，这个对于生成训练数据有很大的作用
尤其是tesseract 4.0

text2image --find_fonts --fonts_dir ~/.fonts --text training_text.txt --min_coverage .9  --outputbase result --render_per_font=false

这里用的是~/.fonts目录下自己新添加的手写 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Thu, 05 Sep 2019 09:13:46 +0000</pubDate>
    </item>
    <item>
      <title>4.x训练记录</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=732</link>
      <description><![CDATA[针对4.0开始支持的lstm训练，想学习了解一下，但这个目前资料太少，看起来一头雾水
这里做一些记录，方便以后整理

参考https://ivanzz1001.github.io/rec ... /tesseract-traininghttps://ivanzz1001.github.io/records/post/ocr/2017/09/18/tesseract-training#101 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 04 Sep 2019 09:31:08 +0000</pubDate>
    </item>
    <item>
      <title>3.x训练记录</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=731</link>
      <description><![CDATA[参考地址：
1.https://github.com/tesseract-ocr ... seract-for-training
2.https://blog.csdn.net/a745233700/article/details/80175883

一.软件准备
    安装tesseract ， java ， jTessBoxEditor
二.准备样本图片  (二三四可以用下面红色部分代替)
    同样 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 04 Sep 2019 06:56:10 +0000</pubDate>
    </item>
    <item>
      <title>自定义扩展</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=730</link>
      <description><![CDATA[1.批处理多个文件

#!/bin/bash

echo \&quot;deal all png in this directory\&quot;

files=`ls`

for file in $files

do

    if [ -f \&quot;$file\&quot; ]; then
        extension=\&quot;${file##*.}\&quot;
        res=\&quot;${file%.*}\&quot;
        if [ $extension == \'png\' ];then
    .]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 04 Sep 2019 02:48:27 +0000</pubDate>
    </item>
    <item>
      <title>命令行详解</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=729</link>
      <description><![CDATA[记录各种命令行

tesseract --help-extra 比tesseract --help  会显示更多的命令

--psm 7    当成一行文本来处理


tesseract --help-psm
Page segmentation modes:
  0    Orientation and script detection (OSD) only.
  1    Automatic page segmentatio ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 04 Sep 2019 02:40:25 +0000</pubDate>
    </item>
    <item>
      <title>data下载地址</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=728</link>
      <description><![CDATA[https://github.com/tesseract-ocr/tessdata

chi_sim.traineddata



chi_sim_vert.traineddata[/url]



带vert和不带的区别？？？]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Wed, 04 Sep 2019 02:39:27 +0000</pubDate>
    </item>
    <item>
      <title>tesseract4.0训练</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=704</link>
      <description><![CDATA[#需求
原文地址
https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00
参考地址：https://blog.csdn.net/panbiao1999/article/details/74638749

```
介绍：
tesseract4.0集成了基于神经网络的识别引擎，比之前的版本准确率有显著的提高，
 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Tue, 03 Sep 2019 06:03:35 +0000</pubDate>
    </item>
    <item>
      <title>可以参考的代码</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=703</link>
      <description><![CDATA[#参考代码

```
Makefile
Makefile.am
Makefile.in
README.md
         ---编译相关

apiexample_test.cc                             最基础的识别函数
applybox_test.cc
baseapi_test.cc
baseapi_thread_test.cc
bitvector_test.cc
cleanapi_test.cc
 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Tue, 03 Sep 2019 06:03:05 +0000</pubDate>
    </item>
    <item>
      <title>识别文字的基础函数</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=702</link>
      <description><![CDATA[#代码

```
#include \&quot;iostream\&quot;
#include \&quot;tesseract/baseapi.h\&quot;
#include \&quot;leptonica/allheaders.h\&quot;
using namespace std;
int main () {
  char *outText;
  cout GetUTF8Text();
  cout &gt; start
======&gt;&gt;&gt; init ok
======&gt;&gt;&gt; get text : 启 动 BALL
`` ..]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Tue, 03 Sep 2019 06:02:34 +0000</pubDate>
    </item>
    <item>
      <title>tesseract安装</title>
      <link>http://www.asysbang.com/forum.php?mod=viewthread&amp;tid=701</link>
      <description><![CDATA[#Tesseract

#安装
```
下载地址：https://github.com/UB-Mannheim/tesseract/wiki
```

#遇到问题
```
载入语言失败 Failed loading language
明明eng.traineddata和chi_sim.traineddata都在“/usr/local/share/tessdata/”目录下
解决：后来发现文件大小不 ...]]></description>
      <category>中文识别</category>
      <author>admin</author>
      <pubDate>Tue, 03 Sep 2019 06:01:53 +0000</pubDate>
    </item>
  </channel>
</rss>