Tag: ocr

用于屏幕文本的OCR(光学字符识别)

我正在尝试创建一个软件,通过捕获屏幕截图自动化PC,然后OCR(光学字符识别)它寻找特定按钮点击(例如)。 我有鼠标和键盘控制部分,但现在,我需要一个OCR来处理屏幕截图。 我发现Tesseract OCR似乎不能很好地与屏幕文本一起使用。 文本太小,或者某些文本似乎已连接,例如K和X.我该如何处理? p / s:这是一个自动测试程序。

如何在C#中使用tesseract 3.02训练数据?

我可以通过命令提示符使用新训练的tessedata(版本3.02)获得正确的OCR输出,但我希望在带有DLL ref的C#代码中使用相同的输出。我已尝试使用tessnet2_32.dll引用但是它抛出exception因此如何使用或通过C#代码使用DLL引用访问tesseract 3.02版本训练的tessedata?

在C#中使用MODI进行OCR。 需要从内存中读取图像,而不是磁盘

我正在尝试使用MODI在内存中已有的位图上执行OCR。 我似乎无法找到解决方案,因为我找到的所有示例都使用create方法从磁盘中获取图像并为OCR做好准备。但是,我已经在内存上有图像并且写入和读取了我往返磁盘会消耗太多时间。 Bitmap bmp = … //Instantiate the MODI.Document object MODI.Document md = new MODI.Document(); //The Create method grabs the picture from disk snd prepares for OCR. md.Create(“C:\\bmp.gif”); //but I don’t want to read from disk 🙁 //Do the OCR. md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true); //Get the first (and only image) MODI.Image image = (MODI.Image)md.Images[0]; //Get the […]

Tesseract空白页面

我使用tesseract来检测图像上的字符。 try { using (var engine = new TesseractEngine(@”C:\Users\ea\Documents\Visual Studio 2015\Projects\ocrtTest”, “eng”, EngineMode.Default)) { using (var img = Pix.LoadFromFile(testImagePath)) { Bitmap src = (Bitmap)Image.FromFile(testImagePath); using (var page = engine.Process(img)) { var text = page.GetHOCRText(1); File.WriteAllText(“test.html”, text); //Console.WriteLine(“Text: {0}”, text); //Console.WriteLine(“Mean confidence: {0}”, page.GetMeanConfidence()); int p = 0; int l = 0; int w = 0; […]

模糊匹配字符串中的多个单词

我正在尝试使用Levenshtein Distance的帮助在OCR页面上找到模糊关键字(静态文本)。 为此,我想给出允许的一定百分比的错误(比如15%)。 string Keyword = “past due electric service”; 由于关键字长度为25个字符,我想允许4个错误(25 * .15向上舍入) 我需要能够将它与…进行比较 string Entire_OCR_Page = “previous bill amount payment received on 12/26/13 thank you! current electric service total balances unpaid 7 days after the total due date are subject to a late charge of 7.5% of the amount due or $2.00, whichever/5 greater. […]

是否有任何免费的.NET OCR库可以直接在应用程序窗口上执行OCR?

我正在寻找一个免费的.NET OCR库,它可以在给定的应用程序窗口甚至内存中的映像上进行OCR(我可以自己拍摄应用程序窗口的快照)。 我看过tessnet2和MODI,但都需要一张位于磁盘上的图像。 我需要使用OCR,因为我试图编写脚本的应用程序做了一些使用Windows API无法读取的古怪的东西,我需要从屏幕上抓取数据。 我已经测试了tessnet2和MODI ,他们都可以阅读文本,但因为这必须在一个无法写入磁盘的环境中运行,我需要它能够直接从applciation窗口读取或者一些内存流的类型。 我认为OCR是我唯一的选择,但可能还有其他方法,我没想到。 建议? 根据注释进行编辑: Environment是一个没有磁盘访问权限的C#.NET Windows应用程序。 它是一个应用程序,它具有动态编译和执行的代码,并且此代码在不需要除内存之外的任何资源的上下文中运行。

c#OCR无法识别数字(tesseract 2)

我正在尝试提取以下数字: http : //img96.imageshack.us/img96/5630/aelgg.png 它失败了,我得到了〜作为回报。 我正在使用谷歌的tesseract 2,使用C#(开源c#包装器),现在我想知道,这个图像是否太难用于OCR? 因为数字是直的清晰。 你有没有其他的OCR引擎可以解决这个问题? 编辑 我也尝试过使用Asprise OCR ( http://asprise.com/product/ocr/selector.php ),但它也无法解析图像……

如何从pdf图像中查找文本?

我正在开发一个C#应用程序,我将PDF文档转换为图像,然后在自定义查看器中呈现该图像。 在尝试搜索生成的图像中的特定单词时,我遇到了一些砖墙,我想知道最好的方法是什么。 我应该找到搜索到的单词的x,y位置吗?

.NET有免费的OCR API吗?

在我的项目中,我需要自动化一个使用captha的Web应用程序。 我在很多论坛上都看到OCR可以用来解决validation码的问题,所以我想知道OCR可以解决我的问题吗? 如果是,那么.NET是否有任何开源OCR API? 如果OCR不是解决方案,请向我提供一些解决方案。 谢谢。

C#中的Tesseract.NET

您是否知道如何使用垃圾桶和垃圾桶的分步指南http://www.pixel-technology.com/freeware/tessnet2/ 我花了两天时间尝试使用它来编译时我被要求输入一个在我从网站下载的zip文件中不存在的dll。 任何帮助将不胜感激。