C#库类似于HtmlUnit

我需要编写独立的应用程序,它将“浏览”外部资源。 C#中有lib自动处理cookie并支持JavaScript(我认为不需要通过JS)吗? 主要目标是保持会话活动并提交表单,以便我可以在登录后通过多步骤注册过程或“浏览”网站。 我查看了Html Agility Pack,但看起来它不包含我需要的function – 表单提交或cookie支持。

谢谢,Artem。

查看Data Extracting SDK ,它允许通过HtmlProcessor类发布数据。 如果库中遗漏了您的工作项,您也可以在这里添加 。

如果您有兴趣为C#编写自己的htmlunit版本,那么IKVM项目可能会有所帮助。 http://www.ikvm.net/

HtmlAgilityPack专门用于解析HTML。 您可以使用.NET Framework中的WebRequest类来处理通信和cookie。

请参阅我在.NET上进行Web抓取的博客文章。 这不会回答你所有的问题,但会让你在那里的一部分。

Selenium,它使用实际的浏览器,但是是一个跨浏览器平台。 取决于是否有一个实际的浏览器运行 – 它的工作原理是通过代理将javascript注入浏览器。 http://seleniumhq.org/support/