如何从Html标签中获取值?

我想从网页中的html标签中获取一些数据。 例如,我有一个网站,其中有“www.example.com/test.html”,这是我要分割的文本。 我想要第一个URL,第一个文本介于第一个span标记和最后一个文本之间的最后一个span标记之间。

我怎么能用C#ASP.NET 2.0(而不是3.5)做到这一点?

 icon  I want this text.  
and i want here

你需要看看:

  • Html敏捷包

这是codePlex.com的示例

  HtmlDocument doc = new HtmlDocument(); doc.Load("file.htm"); foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) { HtmlAttribute att = link["href"]; att.Value = FixLink(att); } doc.Save("file.htm"); 

希望这可以帮助

如果你给控件一个id并将它们设置为runat =“server”,你应该能够直接在你的代码中引用它们。

所以你的页面应该是这样的:

  icon  I want this text.  
and i want here