Tag: ocr

C＃中的良好开源OCR: C＃中是否有一个很好的开源OCR实现？我试图解决以下问题。我有一个包含框的文档，人们在框中输入他们的ID号。现在我想弄清楚程序中的id号。谢谢你，巴拉

Windows 7 OCR API: 我一直在审查Office 2007 MODI OCR的替代品（OneNote的2010解决方案质量/结果比2007年更低:-(）。我注意到一旦安装了可选的tifffilter ，Windows 7就包含一个OCR库 OCR组件已安装到 %programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll 但我没有看到任何API？有没有人看到如何在C＃中优化界面？解答：找到解决方案，一旦安装了可选的tiff ifilter win7function，我就可以使用http://www.codeproject.com/KB/cs/IFilter.aspx上的代码/ exe获取截图的文本输出。另外，如果为.png和.jpg添加相同的[HKEY_CLASSES_ROOT.tiff \ PersistentHandler]，那么OCR也适用于jpg和png。

iTextSharp从特定位置读取: 从PDF文件中读取数据时，我遇到使用iTextSharp的问题。我想要实现的是只读取PDF页面的特定部分（我想只检索位于恒定位置的地址信息）。我在阅读以下所有页面时看到了iTextSharp的用法： StringBuilder text = new StringBuilder(); if (File.Exists(fileName)) { PdfReader pdfReader = new PdfReader(fileName); for (int page = 1; page <= pdfReader.NumberOfPages; page++) { ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy(); string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy); currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText))); text.Append(currentText); } pdfReader.Close(); } return text.ToString(); 但是我怎样才能将它限制在特定的位置？我愿意使用任何东西，甚至是OCR技术，因为将来某些文件可能会成为图像（但此时不是必需的）。这个项目只适合我，所以没有商业用途。谢谢！

.NET OCRing图像: 我正在尝试使用MODI来OCR一个窗口的程序。它适用于截图我使用win32 interop以编程方式抓取，如下所示： public string SaveScreenShotToFile() { RECT rc; GetWindowRect(_hWnd, out rc); int width = rc.right – rc.left; int height = rc.bottom – rc.top; Bitmap bmp = new Bitmap(width, height); Graphics gfxBmp = Graphics.FromImage(bmp); IntPtr hdcBitmap = gfxBmp.GetHdc(); PrintWindow(_hWnd, hdcBitmap, 0); gfxBmp.ReleaseHdc(hdcBitmap); gfxBmp.Dispose(); string fileName = @”c:\temp\screenshots\” + Guid.NewGuid().ToString() + “.bmp”; bmp.Save(fileName); return fileName; } […]

Tesseract OCR简单的例子: 嗨，你能不能给我一个简单的例子来测试Tesseract OCR，最好是在C＃中。我试过这里的演示。我下载了英文数据集并在C盘中解压缩。并修改代码如下： string path = @”C:\pic\mytext.jpg”; Bitmap image = new Bitmap(path); Tesseract ocr = new Tesseract(); ocr.SetVariable(“tessedit_char_whitelist”, “0123456789”); // If digit only ocr.Init(@”C:\tessdata\”, “eng”, false); // To use correct tessdata List result = ocr.DoOCR(image, Rectangle.Empty); foreach (tessnet2.Word word in result) Console.WriteLine(“{0} : {1}”, word.Confidence, word.Text); 不幸的是，代码不起作用。程序死于“ocr.Init（…”行。即使使用try-catch，我甚至无法获得exception。我能够运行vietocr ！但这对我来说是一个非常大的项目。我需要一个像上面这样的简单例子。谢谢

Tesseract OCR引擎无法从自动生成的图像中读取文本，但可以从MS Paint中的CUT读取: 我正在为Tesseract OCR引擎使用.NET包装器。我有一个大型文档是PNG。当我在MS油漆中切出一段图像然后将其送入引擎时，它可以工作。但是当我在代码中执行此操作时，引擎无法识别图像中的文本。图像看起来相同，并且属性不会显得非常偏离。所以我有点困惑。这是两张图片。来自MS涂料：来自代码：这是我从MS油漆图像中得到的：并通过代码：他们真的很相似所以我不确定为什么它不能识别第二个文本。以下是我如何生成图像。 public Bitmap CropImage(Bitmap source, Rectangle section) { Bitmap bmp = new Bitmap(section.Width, section.Height); Graphics g = Graphics.FromImage(bmp); g.DrawImage(source, 0, 0, section, GraphicsUnit.Pixel); return bmp; } private void Form1_Load(object sender, EventArgs e) { Bitmap source = new Bitmap(test); Rectangle section = new […]

阿拉伯语的开源OCR: 我正在寻找一个OCR库或任何我可以用来从图像中读取阿拉伯字母的样本。我用Google搜索了很多东西并没有找到任何东西。请提前帮助谢谢。

如何在C＃项目中实现和执行OCR？: 我已经搜索了一段时间以及所有我见过的OCR库请求。我想知道如何实现最纯净，易于安装和使用OCR库以及安装到C＃项目的详细信息。如果可行，我只想像通常的dll参考一样实现它… 例： using org.pdfbox.pdmodel; using org.pdfbox.util; 还有一个小的OCR代码示例会很好，例如： public string OCRFromBitmap(Bitmap Bmp) { Bmp.Save(temppath, System.Drawing.Imaging.ImageFormat.Tiff); string OcrResult = Analyze(temppath); File.Delete(temppath); return OcrResult; } 所以请考虑我对OCR项目并不熟悉，并给我一个答案，比如跟假人说话。编辑：我猜人们误解了我的要求。我想知道如何将这些开源OCR库实现到C＃项目以及如何使用它们。作为dup给出的链接没有给出我要求的答案。

Tesseract OCR库 – 学习字体: 好吧，我正在使用这个OCR的编译.NET版本，可以在@ http://www.pixel-technology.com/freeware/tessnet2/找到我有它工作，但是这个目的是翻译车牌，遗憾的是引擎真的不能准确翻译一些字母，例如这里是我扫描的图像来确定字符问题结果： 12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ 因此，以下字符被错误地翻译： 1，O，Q，W 这似乎并不太糟糕，但是在我的车牌上，结果并不是那么好： = H4 ODM = LDH IFW 假试验 = NR4 y2k 你可能会说，我已经尝试过降噪，提高对比度，并删除不是绝对黑色的像素，没有真正的改进。显然你可以“学习”引擎新的字体，但我想我需要重新编译.NET的库，似乎这是在我没有的Linux操作系统上执行的。所以我不知道接下来会尝试什么，我已经编写了一个快速的控制台应用程序，纯粹是为了测试目的，如果有人想尝试它。如果有人有任何想法/图形处理/图书馆的想法，我很感激听到他们。