Tag: 屏幕抓取

HttpRequest：通过AuthLogin: 我需要创建一个简单的程序，使用给定的凭据记录到某个网站，然后导航到某个元素（链接）。它甚至可能（我的意思是这个Authlogin的东西）？编辑：抱歉 – 我在我的公司机器上，我无法点击“投票”或“添加评论” – 页面上写着“完成，但页面上有错误”（IE ..）。我非常感谢您的回答和评论，您帮助了我很多！

是否有任何免费的.NET OCR库可以直接在应用程序窗口上执行OCR？: 我正在寻找一个免费的.NET OCR库，它可以在给定的应用程序窗口甚至内存中的映像上进行OCR（我可以自己拍摄应用程序窗口的快照）。我看过tessnet2和MODI，但都需要一张位于磁盘上的图像。我需要使用OCR，因为我试图编写脚本的应用程序做了一些使用Windows API无法读取的古怪的东西，我需要从屏幕上抓取数据。我已经测试了tessnet2和MODI ，他们都可以阅读文本，但因为这必须在一个无法写入磁盘的环境中运行，我需要它能够直接从applciation窗口读取或者一些内存流的类型。我认为OCR是我唯一的选择，但可能还有其他方法，我没想到。建议？根据注释进行编辑： Environment是一个没有磁盘访问权限的C＃.NET Windows应用程序。它是一个应用程序，它具有动态编译和执行的代码，并且此代码在不需要除内存之外的任何资源的上下文中运行。

你如何登录网页并在C＃中检索其内容？: 你如何登录网页并在C＃中检索其内容？

在c＃中屏幕抓取一个windows应用程序: 我需要从Windows应用程序中抓取数据以在另一个程序中运行查询。有谁知道我在.NET中做这个的好起点？

如何在此上下文中使用WebClient.DownloadDataAsync（）方法？: 我的计划是让用户在我的程序中写下电影标题，我的程序将异步提取适当的信息，这样UI就不会冻结。这是代码： public class IMDB { WebClient WebClientX = new WebClient(); byte[] Buffer = null; public string[] SearchForMovie(string SearchParameter) { //Format the search parameter so it forms a valid IMDB *SEARCH* url. //From within the search website we’re going to pull the actual movie //link. string sitesearchURL = FindURL(SearchParameter); //Have a method download asynchronously the […]

在C＃中查看生成的源（在AJAX / JavaScript之后）: 有没有办法从C＃应用程序查看生成的网页源（所有AJAX调用和JavaScript DOM操作之后的代码），而无需从代码中打开浏览器？使用WebRequest或WebClient对象查看初始页面工作正常，但如果页面大量使用JavaScript来更改页面加载时的DOM，则这些页面无法准确显示页面。我尝试过使用Selenium和Watin UI测试框架，它们完美地工作，提供所有JavaScript操作完成后显示的生成源。不幸的是，他们通过打开一个非常慢的实际Web浏览器来实现这一点。我已经实现了一个selenium服务器，可以将这项工作卸载到另一台机器上，但仍有很大的延迟。是否有.Net库可以加载和解析页面（如浏览器）并吐出生成的代码？显然，谷歌和雅虎并没有为他们想要蜘蛛的每个页面开放浏览器（当然，他们可能拥有比我更多的资源……）。除非我愿意剖析开源浏览器的源代码，否则是否有这样的库或我运气不好？解好的，谢谢大家的帮助。我有一个比Selenium快10倍的工作解决方案。呜！感谢来自beansoftware的这篇旧文章，我能够使用System.Windows.Forms.WebBrowser控件下载页面并解析它，然后给em生成源代码。即使控件在Windows.Forms中，你仍然可以从Asp.Net运行它（这就是我正在做的），只需记住将System.Window.Forms添加到项目引用中。关于代码有两个值得注意的事情。首先，在新线程中调用WebBrowser控件。这是因为它必须在单线程公寓上运行。其次，GeneratedSource变量设置在两个地方。这不是由于智能设计决定:)我仍在努力，并在我完成后更新这个答案。多次调用wb_DocumentCompleted（）。首先下载初始HTML，然后在第一轮JavaScript完成时再次下载。不幸的是，我正在抓的网站有3个不同的加载阶段。 1）加载初始HTML 2）执行第一轮JavaScript DOM操作3）暂停半秒然后进行第二轮JS DOM操作。由于某种原因，第二轮不是由wb_DocumentCompleted（）函数引起的，但是当wb.ReadyState == Complete时它总是被捕获。那么为什么不从wb_DocumentCompleted（）中删除它呢？我仍然不确定为什么它没有被抓住，这是珠宝软件文章推荐的地方。我要继续研究它。我只是想发布这个代码，所以任何有兴趣的人都可以使用它。请享用！ using System.Threading; using System.Windows.Forms; public class WebProcessor { private string GeneratedSource{ get; set; } private string URL { get; […]

Tag: 屏幕抓取

HttpRequest：通过AuthLogin

是否有任何免费的.NET OCR库可以直接在应用程序窗口上执行OCR？

你如何登录网页并在C＃中检索其内容？

在c＃中屏幕抓取一个windows应用程序

如何在此上下文中使用WebClient.DownloadDataAsync（）方法？

在C＃中查看生成的源（在AJAX / JavaScript之后）

ASP.NET 5中的dependency injection和对象处理

C＃中的Tesseract.NET

可以集成到C＃应用程序中的差异工具

如何使我的通用比较器（IComparer）处理空值？

将hex字符串转换回char

哪个是C＃和.NET的“最佳”数据访问框架/方法？

在c＃中只读一个列表

基于单元格值的DataGrid行背景

使用C＃解析复杂的JSON结果

如何使用LINQ在XML中按名称获取元素

使用MongoDB时如何按惯例应用BsonRepresentation属性

为什么在取消选中asp.net中的复选框时不会触发checkchanged事件

首先拆分然后加入字符串的子集

正则表达式：如何从字符串中获取单词（C＃）

Winform DatagridView数字列排序