阿拉伯语的开源OCR

我正在寻找一个OCR库或任何我可以用来从图像中读取阿拉伯字母的样本。我用Google搜索了很多东西并没有找到任何东西。请提前帮助谢谢。

TesseractOCR可能是最好的开源OCR引擎,并且它可以识别的内容非常灵活。 它允许使用自定义数据进行培训,因此只要您愿意投入工作(即创建培训集),基本上任何语言都是可能的。

tesseract (带有gui接口) 提供的工具可以帮助您创建数据集,您可以在其中指定字符的边界框和相应的转录。

编辑:从另一篇文章(上面已链接)注意到已经为3.01版创建了阿拉伯语培训集。 您只需要插入阿拉伯数据就可以解决问题:)。

您可以尝试使用Abbyy Fine Reader ,他们可能会使用您正在寻找的语言。