获取HTML元素的值

我在文本文件中有网页的HTML代码。我希望我的程序返回标签中的值。我想让“朱利叶斯”出局

Julius

我需要正则表达吗？否则什么是字符串函数可以做到这一点？

您应该使用像htmlagilitypack这样的html解析器.Regex不是解析HTML文件的好选择，因为HTML不严格，也不是常规的格式。

您可以使用以下代码使用HtmlAgilityPack检索它

 HtmlDocument doc = new HtmlDocument(); doc.Load(yourStream); var itemList = doc.DocumentNode.SelectNodes("//span[@class='hidden first']")//this xpath selects all span tag having its class as hidden first .Select(p => p.InnerText) .ToList(); //itemList now contain all the span tags content having its class as hidden first

我会使用Html Agility Pack来解析C＃中的HTML。

我强烈建议你研究像HTML Agility Pack这样的东西

我几天前问过同样的问题并且使用HTML Agility Pack，但这里是你想要的正则表达式

这个将忽略属性

 ]*>(.*?)

这个将考虑属性

 ]*>(.*?)

获取HTML元素的值

Windows Phone 8：监视混合C＃/ C ++中的内存使用情况

XAML中的WPF文本块绑定

接口/抽象类编码标准

.NET中的串口通信

如何以编程方式在Windows 8.1手机中找到imei号码？

在Silverlight应用中使用“dynamic”关键字时出错

WPF / C＃将自定义对象列表数据绑定到ListBox？

从字符串属性名称创建通用表达式

与OleDB连接的entity framework – 我只是简单的坚果？

命令行分析程序库 – 布尔参数