将PDF转换为可以通过Word打开的任何内容

想要通过C#,所有内联,没有Process.Start()…和免费…可以是RTF,HTML,无论情况如何……只要我可以在Word中打开,我可以然后保存为RTF,然后我可以在RichTextBox中加载。

我知道这些年来类似的问题充斥着这个论坛,但似乎没有什么能解决我所要求的问题。

编辑:

看起来可以在这里完成: http : //www.itextpdf.com/examples/iia.php?id = 275

使用PDF库(如iTextSharp)来解析PDF。 您将能够访问PDF中的所有文本和图像,并转换为您想要的任何表示forms。

还有其他解决方案(例如安装xpdf和shelling – 如果传入正确的命令行参数,它将转换为html)。

我不确定Word是否可以打开pdf,除非您在word文档中创建了pdf。

我认为唯一的快速解决方案是购买或找到进行PDF处理的第三方库,然后使用它的API来提取您需要的文本。 在任何情况下,任何情况下的文本格式都非常糟糕我相信。 另外请注意,一些显示文本的pdf实际上将其保存为图像,因此无法获取数据。