Tag: 抓取

在C#中实现动态Web Scraper的逻辑

我期待用C#窗口forms开发Web scraper。 我想要完成的是如下: 从用户获取URL。 在WINForms中的IE UI控件(嵌入式浏览器)中加载网页。 允许用户选择文本(连续,小(不超过50个字符))。 从加载的网页。 当用户希望保留该位置( HTML DOM位置 )时,必须将其持久保存到DB中,以便用户可以在其后续访问期间使用该位置来获取该位置中的数据。 假设加载的网站是一个价格网站,并且引用的费率不断变化,我们的想法是坚持DOM层次结构,这样我下次就可以遍历它。 如果所有HTML元素都具有其id属性,我将能够这样做。 在id为null的情况下,我无法完成此操作。 有人可以建议一个有效的想法(如果可能的话,这是一个最低限度的代码片段)。 即使您可以共享一些在线资源,它也会有所帮助。 谢谢, 维杰