有没有人知道如何以编程方式轻松地将PDF转换为docx格式

我们有几个第三方系统为我们提供PDF。 我们希望转换这些PDF,以便在不使用Adobe产品的情况下在Web上显示。 理想情况下,我们希望使用Silverlight来呈现PDF,但无法将PDF转换为Xaml或使用docx格式作为中间人。 有很多库可以提供PDF,但这不是我们需要的。

如果有一个库可以做到这一点,那么.net lib会更好,但如果这是一个选项,我们也可以使用命令行运行转换。

Aspose销售.Net转换器库。

将PDF转换为SVG(ghostscript会这样做)并将其作为一系列图像导入:我不是.net程序员,但我知道可以使用system.io.packaging类完成,因为它值得,由Mono项目在.net之外实现。

另一个选择,如果您实际上不需要更改pdf文档中的任何内容,您可以使用pdf.js将pdf文档呈现为html 5.有关详细信息,请参阅此博客文章。

http://andreasgal.com/2011/06/15/pdf-js/

有许多从PDF到XPS的转换器是XAML的子集。

[更新]一些参考链接

  • 什么是XPS文件的结构
  • XPS或XAML查看器嵌入.NET应用程序?