用于屏幕文本的OCR（光学字符识别）

我正在尝试创建一个软件，通过捕获屏幕截图自动化PC，然后OCR（光学字符识别）它寻找特定按钮点击（例如）。我有鼠标和键盘控制部分，但现在，我需要一个OCR来处理屏幕截图。我发现Tesseract OCR似乎不能很好地与屏幕文本一起使用。文本太小，或者某些文本似乎已连接，例如K和X.我该如何处理？

p / s：这是一个自动测试程序。

我不确定这是否适合您，但我在自动化中看到的一些更好的OCR是由Tevron的CitraTest完成的。它包含一个包含字体的库，如果没有字体集，它们将根据您的提交创建一个新字体。使用此工具的长期因素是成本和与可变屏幕分辨率相关的常见问题。