HTMLAgilityPack解析InnerHTML
Token1 Token2 Token3
我尝试从div中提取Token2
我设法让Token1和Token3得到:
HtmlNodeCollection headerFooter = doc.DocumentNode.SelectNodes("//div//b");
如何使用HTMLAgilityPack直接提取Token2?
一个脏选项是用doc.DocumentNode.SelectNodes(“// div”)中的string.empty替换Token1和Token2。InnerText,但我想它可以用HTMLAgilityPack以更干净的方式完成…
文本在文本节点中; 所以你应该能够看到“// div / text()”并连接:
StringBuilder sb = new StringBuilder(); foreach (HtmlAgilityPack.HtmlTextNode node in doc.DocumentNode.SelectNodes("//div/text()")) { sb.Append(node.Text.Trim()); } string s = sb.ToString();