关于 java:Getting error: \\”bad read of inttemp!\\” 在 Tesseract 2 中训练新字体时
Getting error: "bad read of inttemp!" when training a new font in Tesseract 2
我正在尝试为 Tesseract 训练一种可以在我的 Android 应用程序中使用的新字体。我只需要训练数字,所以我创建了一个训练图像、框文件和 unicharset 文件。
我已按照培训说明进行操作,但是当我尝试运行 tesseract 时,它显示
我做错了什么?如何诊断此错误?
相关讨论
- 训练是相当痛苦的。仔细检查您的训练工作流日志中的警告和错误。如果出现问题,您的训练数据将毫无用处。
- @gabe,你能推荐任何有用的链接吗?
- 我在 groups.google.com/forum/?fromgroups=#!forum/tesseract-ocr 上花了很多时间,也许这对你来说是 gitorious.org/ancient-greek-training-for-tesseract/…
- 谢谢加布。我会调查这个:)
- 它适用于 tesseract 3,但也许它有助于 michaeljaylissner.com/blog/...
- vietocr.sourceforge.net/training.html 一个盒子编辑器可能有用
http://code.google.com/p/tesseract-ocr/issues/detail?id=155
事实证明,tesseract 仍在返回"C:\\\\Program Files\\\\Tesseract-OCR"文件夹 - 包括使用培训文件夹中的 3.0 培训 exe。我从哪里运行命令没有区别 - 猜测 tesseract 当它有一个路径变量时会忽略它。
替换了该文件夹中的所有 3.0 exe 和培训文件。放入 2.0.4 文件中,提取命令有效!!!出于各种原因,我应该更快地解决问题,但是..
试试这个
http://www.win.tue.nl/~aeb/linux/ocr/tesseract.html
THE END
二维码