Tag: ocr

C#中的良好开源OCR

C#中是否有一个很好的开源OCR实现? 我试图解决以下问题。 我有一个包含框的文档,人们在框中输入他们的ID号。 现在我想弄清楚程序中的id号。 谢谢你,巴拉

Windows 7 OCR API

我一直在审查Office 2007 MODI OCR的替代品(OneNote的2010解决方案质量/结果比2007年更低:-()。我注意到一旦安装了可选的tifffilter ,Windows 7就包含一个OCR库 OCR组件已安装到 %programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll 但我没有看到任何API? 有没有人看到如何在C#中优化界面? 解答:找到解决方案,一旦安装了可选的tiff ifilter win7function,我就可以使用http://www.codeproject.com/KB/cs/IFilter.aspx上的代码/ exe获取截图的文本输出。 另外,如果为.png和.jpg添加相同的[HKEY_CLASSES_ROOT.tiff \ PersistentHandler],那么OCR也适用于jpg和png。

iTextSharp从特定位置读取

从PDF文件中读取数据时,我遇到使用iTextSharp的问题。 我想要实现的是只读取PDF页面的特定部分(我想只检索位于恒定位置的地址信息)。 我在阅读以下所有页面时看到了iTextSharp的用法: StringBuilder text = new StringBuilder(); if (File.Exists(fileName)) { PdfReader pdfReader = new PdfReader(fileName); for (int page = 1; page <= pdfReader.NumberOfPages; page++) { ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy(); string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy); currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText))); text.Append(currentText); } pdfReader.Close(); } return text.ToString(); 但是我怎样才能将它限制在特定的位置? 我愿意使用任何东西,甚至是OCR技术,因为将来某些文件可能会成为图像(但此时不是必需的)。 这个项目只适合我,所以没有商业用途。 谢谢!

.NET OCRing图像

我正在尝试使用MODI来OCR一个窗口的程序。 它适用于截图我使用win32 interop以编程方式抓取,如下所示: public string SaveScreenShotToFile() { RECT rc; GetWindowRect(_hWnd, out rc); int width = rc.right – rc.left; int height = rc.bottom – rc.top; Bitmap bmp = new Bitmap(width, height); Graphics gfxBmp = Graphics.FromImage(bmp); IntPtr hdcBitmap = gfxBmp.GetHdc(); PrintWindow(_hWnd, hdcBitmap, 0); gfxBmp.ReleaseHdc(hdcBitmap); gfxBmp.Dispose(); string fileName = @”c:\temp\screenshots\” + Guid.NewGuid().ToString() + “.bmp”; bmp.Save(fileName); return fileName; } […]

Tesseract OCR简单的例子

嗨,你能不能给我一个简单的例子来测试Tesseract OCR,最好是在C#中。 我试过这里的演示。 我下载了英文数据集并在C盘中解压缩。 并修改代码如下: string path = @”C:\pic\mytext.jpg”; Bitmap image = new Bitmap(path); Tesseract ocr = new Tesseract(); ocr.SetVariable(“tessedit_char_whitelist”, “0123456789”); // If digit only ocr.Init(@”C:\tessdata\”, “eng”, false); // To use correct tessdata List result = ocr.DoOCR(image, Rectangle.Empty); foreach (tessnet2.Word word in result) Console.WriteLine(“{0} : {1}”, word.Confidence, word.Text); 不幸的是,代码不起作用。 程序死于“ocr.Init(…”行。即使使用try-catch,我甚至无法获得exception。 我能够运行vietocr ! 但这对我来说是一个非常大的项目。 我需要一个像上面这样的简单例子。 谢谢

Tesseract OCR引擎无法从自动生成的图像中读取文本,但可以从MS Paint中的CUT读取

我正在为Tesseract OCR引擎使用.NET包装器。 我有一个大型文档是PNG。 当我在MS油漆中切出一段图像然后将其送入引擎时,它可以工作。 但是当我在代码中执行此操作时,引擎无法识别图像中的文本。 图像看起来相同,并且属性不会显得非常偏离。 所以我有点困惑。 这是两张图片。 来自MS涂料: 来自代码: 这是我从MS油漆图像中得到的: 并通过代码: 他们真的很相似所以我不确定为什么它不能识别第二个文本。 以下是我如何生成图像。 public Bitmap CropImage(Bitmap source, Rectangle section) { Bitmap bmp = new Bitmap(section.Width, section.Height); Graphics g = Graphics.FromImage(bmp); g.DrawImage(source, 0, 0, section, GraphicsUnit.Pixel); return bmp; } private void Form1_Load(object sender, EventArgs e) { Bitmap source = new Bitmap(test); Rectangle section = new […]

桌面软件中的Onenote OCRfunction

是否有API使用Onenote OCRfunction自动识别图像中的文本?

阿拉伯语的开源OCR

我正在寻找一个OCR库或任何我可以用来从图像中读取阿拉伯字母的样本。我用Google搜索了很多东西并没有找到任何东西。请提前帮助谢谢。

如何在C#项目中实现和执行OCR?

我已经搜索了一段时间以及所有我见过的OCR库请求。 我想知道如何实现最纯净,易于安装和使用OCR库以及安装到C#项目的详细信息。 如果可行,我只想像通常的dll参考一样实现它… 例: using org.pdfbox.pdmodel; using org.pdfbox.util; 还有一个小的OCR代码示例会很好,例如: public string OCRFromBitmap(Bitmap Bmp) { Bmp.Save(temppath, System.Drawing.Imaging.ImageFormat.Tiff); string OcrResult = Analyze(temppath); File.Delete(temppath); return OcrResult; } 所以请考虑我对OCR项目并不熟悉,并给我一个答案,比如跟假人说话。 编辑:我猜人们误解了我的要求。 我想知道如何将这些开源OCR库实现到C#项目以及如何使用它们。 作为dup给出的链接没有给出我要求的答案。

Tesseract OCR库 – 学习字体

好吧,我正在使用这个OCR的编译.NET版本,可以在@ http://www.pixel-technology.com/freeware/tessnet2/找到 我有它工作,但是这个目的是翻译车牌,遗憾的是引擎真的不能准确翻译一些字母,例如这里是我扫描的图像来确定字符问题 结果: 12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ 因此,以下字符被错误地翻译: 1,O,Q,W 这似乎并不太糟糕,但是在我的车牌上,结果并不是那么好: = H4 ODM = LDH IFW 假试验 = NR4 y2k 你可能会说,我已经尝试过降噪,提高对比度,并删除不是绝对​​黑色的像素,没有真正的改进。 显然你可以“学习”引擎新的字体,但我想我需要重新编译.NET的库,似乎这是在我没有的Linux操作系统上执行的。 所以我不知道接下来会尝试什么,我已经编写了一个快速的控制台应用程序,纯粹是为了测试目的,如果有人想尝试它。 如果有人有任何想法/图形处理/图书馆的想法,我很感激听到他们。