如何使用RegEx Asp.net C#抓取BODY html标签内的所有内容(来自字符串)
{是的,以上或多或少解释了它} 🙂
Regex oRegex = new Regex("(.*?)", RegexOptions.Multiline);
如果身体中有任何属性,上面似乎不起作用。
使用HTML Agility Pack (假设它是html,而不是xhtml):
HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(html); string body = doc.DocumentNode.SelectSingleNode("/html/body").InnerHtml;
不要使用正则表达式。 使用旨在解析XML / HTML的东西:
XmlDocument.SelectSingleNode("//body").InnerXml;
将字符串加载到XmlDocument中 ,使用SelectSingleNode函数(将XPath表达式作为参数),然后从生成的XmlNode中提取所需内容。
我最终通过使用RegexOptions.Singleline
而不是使用RegexOptions.Singleline
来解决它