我怎么读.docx文件?

我有一个.docx文件,它包含许多我要批量邮件的电子邮件地址。 如何通过c#读取docx文件?

最简单的方法可能是使用Open XML SDK 2.0

获取Visual Studio 2008的代码片段以获取一些示例

我强烈建议下载Open XML SDK生产力工具,它将帮助您了解Open XML文件的结构,甚至可以帮助您根据文档结构生成与SDK一起使用的源代码。 您可以从SDK的同一页面下载该工具。 它是100MB,但值得下载。

您可以简单地使用Docx库,它非常好用且易于使用。

有关如何使用的示例以及许多示例和video,请查看其GitHub页面。 要下载,您可以从这里下载

您可以通过Interop读取Microsoft Office文件,也可以通过Open XML读取Office> 2007文件:

  • Interop : http : //blogs.techrepublic.com/howdoi/? p = 190
  • Open XML : http : //msdn.microsoft.com/en-us/library/bb656295(office.12).aspx

是的,我知道这是一篇非常古老的post,但这些信息可能会帮助正在搜索论坛的其他人。

使用Sourceforge中的这个库。 添加对该库的引用,然后:

Code7248.word_reader.TextExtractor extractor = new TextExtractor(filePath);

string contents = extractor.ExtractText();

Office 2007及更高版本遵循OpenXML格式。 您需要打包API才能打开和阅读文档部件

http://msdn.microsoft.com/en-us/library/system.io.packaging.aspx

http://openxmldeveloper.org

docx文件实际上是归档文件。

您可以将它们解压缩到它们的复合XML文件中,并通读相关的XML文件(file.docx \ word \ document.xml))并提取电子邮件地址。

该库将帮助您解压缩存档: .Net Zip Library

有免费的方式来阅读doc和docx文件,它可以帮助你。

 Document doc = new Document(); doc.LoadFromFile("yourfile.docx"); 

http://freeword.codeplex.com/