一个朋友和我有兴趣为CV项目培训tesseract-OCR引擎.我们尝试使用一些包装器,如PyTesser和pyocr,但结果目前还不如我们需要的那么准确.因此,我们希望尝试培训tesseract以更好地为我们的目的(即标识食品标签上的文本),但安装培训工具方面遇到麻烦.
我们试过的
看看谷歌代码网站,‘Compiling’ page on the tesseract’s google code wiki说,培训工具只能在版本3.03上使用.但是,tesseract-ocr的Google代码“下载”页面只有3.02的资料. “编译”页面的底部还有一些关于在Windows和OSX上安装版本3.03的评论,但还没有对Linux用户的评论.
也似乎有一些3.03 source package for Ubuntu,但我们不知道如何在我们的电脑上访问它,“编译”页面说我们需要运行这些命令:
make training sudo make training-install
我们还发现了一个关于tesseract 3.03的google group thread,但是再次似乎这些帖子不包括Linux用户的建议(除非我们在初始读取期间错过了一些东西).
这实际上是一个非常简单的命令行安装问题吗?或者,有没有一种方式火车tesseract 3.02(我们目前已经安装)?我们一直在看错误的地方提供信息吗?
任何建议或链接到安装tesseract-ocr 3.03 for Linux发行版的说明将不胜感激!谢谢.
Tesseract可以直接安装在Ubuntu 14.04中
原文链接:https://www.f2er.com/ubuntu/347315.htmlsudo apt-get install tesseract-ocr
我不知道如果你可以在旧版本的Ubuntu中执行,因为这个回购可能会在更新的Ubuntu版本中更新.