如何使用RegEx Asp.net C#抓取BODY html标签内的所有内容(来自字符串)

{是的,以上或多或少解释了它} 🙂

Regex oRegex = new Regex("(.*?)", RegexOptions.Multiline);

如果身体中有任何属性,上面似乎不起作用。

使用HTML Agility Pack (假设它是html,而不是xhtml):

 HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(html); string body = doc.DocumentNode.SelectSingleNode("/html/body").InnerHtml; 

不要使用正则表达式。 使用旨在解析XML / HTML的东西:

 XmlDocument.SelectSingleNode("//body").InnerXml; 

将字符串加载到XmlDocument中 ,使用SelectSingleNode函数(将XPath表达式作为参数),然后从生成的XmlNode中提取所需内容。

我最终通过使用RegexOptions.Singleline而不是使用RegexOptions.Singleline来解决它