Tag: docx

使用c#突出显示Docx中的文本

我需要在docx文件中突出显示一个句子,我有这个代码,并且它适用于许多文档,但是我注意到对于某些文档,文档中的文本是逐字设置的,而不是整个句子,我的意思是每个单词都带有它自己的Run,所以在搜索那个句子时,找不到它,因为它在docx中逐字逐句。 注意:我正在使用阿拉伯语文本。 private void HighLightText_userSentence(Paragraph paragraph, string text, string title, string author, decimal percentage, string _color) { string textOfRun = string.Empty; var runCollection = paragraph.Descendants(); Run runAfter = null; //find the run part which contains the characters foreach (Run run in runCollection) { if (run.GetFirstChild() != null) { textOfRun = run.GetFirstChild().Text.Trim(); if (textOfRun.Contains(text)) { //remove […]

在WebBrowser控件中查看Docx文档

我已经尝试了几天,将一个单词docx文件加载到一个存在于windows窗体c#中的webbrowser控件中。 经过几天的努力才能完成这项工作,但在谷歌的帮助下以及一些有用的post我已经成功完成了它并且它是完美的。 我通过以下方式完成了: 将docx文件转换为临时html文件。 我将我的webbrowser控件导航到该临时html文档。 只有我注意到一个问题:webbrowser控件似乎在Web Layout中查看文件。 这就是Ms-Word Web Layout,您知道在Ms-Word,读取模式,打印布局和Web布局中有3种主要的查看布局。 问题在于,一些格式错误的docx文件在该webbrowser控件中全部出现偏差,因为它会将它们拉伸出来,好像它们会出现在实际的Web浏览器应用程序中一样。 现在我想要实现的是能够以与Ms-Word中的Print Layout类似的方式查看该webbrowser控件的内容,或者至少是控件在控件自己的大小内重新调整内容。 (如果我的代码是必要的,那么我可以提供它)

有没有人知道如何以编程方式轻松地将PDF转换为docx格式

我们有几个第三方系统为我们提供PDF。 我们希望转换这些PDF,以便在不使用Adobe产品的情况下在Web上显示。 理想情况下,我们希望使用Silverlight来呈现PDF,但无法将PDF转换为Xaml或使用docx格式作为中间人。 有很多库可以提供PDF,但这不是我们需要的。 如果有一个库可以做到这一点,那么.net lib会更好,但如果这是一个选项,我们也可以使用命令行运行转换。

将Word DOCX文件另存为PDF

我正在使用openxml来创建Word DOCX文件。 我想将这些文档创建为PDF文件后保存。 有没有办法在openxml中做到这一点? 我认为答案是否定的。 如果不是,是否有推荐的库或工具可用于将DOCX文件保存/打印为PDF(以编程方式,在.NET中)? 我查看了sharpPDF(PDFSharp),看来这个库只是用于从头开始生成PDF,而不是将DOCX保存为PDF。 我可以以某种方式以完全自动化的方式打印到已安装的PDF打印机,可爱的PDF或Windows 7内置的PDF打印机吗? 更新:寻找免费的非病毒许可证,最好不需要额外的安装。

DocX克隆表并在索引处插入

我使用C#制作一个简单的Windows应用程序,使用Novacode来操作Word文档。 我在我的Word文档中有一个我想要克隆的源表。 我可以使用以下代码找到源表: Table sourceTable = document.Tables[3]; 我可以通过行和列看到这实际上是我要克隆的表。 我的Word文档中有一个字符串,就在它之后我想插入克隆的源表。 事实上,我可能需要不止一次插入它。 我不知道如何找到我的字符串,它的索引,然后在该索引处插入一个或多个克隆表。 谢谢。

如何从docx文档中读取元数据信息?

我需要实现的是拥有一个word文档模板(docx),它将包含标题,作者姓名,日期等。 然后,用户将使用此模板来完成该模板。 我需要创建一个ac#程序,它将接收docx文件并读取所有感兴趣的信息(标题,名称,日期,……)。 所以我的问题是: 如何将元数据放入模板中说:这是标题,这是日期,这是名称等? (不是以编程方式) 如何以编程方式读取该信息?

以编程方式将Word(docx)转换为PDF

好吧,在你想到“不是这样的另一个问题”之前,请先阅读此内容。 我有一个应用程序(ASP.NET MVC 3中的Web应用程序)使用DocX库在DocX中生成Word文件。 应用程序采用模板并使用数据库中的所有数据填充它。 现在我想创建一个创建的docx文件的PDF版本。 我知道箴言是一种选择,但不适合我,因为我的预算很少。 其他我需要花钱的库也是不可能的。 我没有sharepoint服务器,因此Word Automation Services也不是一个选项。 所以我有两个选项(我知道),他们都使用了iTextSharp 。 不知道哪个更好。 我可以使用docx文件中生成的XML并将其转换为iTextSharp可用的版本。 我可以创建PDF,就像我用模板创建docx一样。 任何人都知道它有多少工作,哪两个有更好的性能,如果有可能的话。 我知道第二个选项的缺点是,当我更改模板时,我必须为两个版本更改它。 如果您有更好的解决方案(免费),欢迎您分享。

如何在C#(.NET)中加载MS Word文档的文本?

如何在不执行此操作的情况下将MS Word文档(.doc和.docx)加载到内存(变量)? wordApp.Documents.Open 我不想打开MS Word,我只想在里面找到那个文字。 你给了我DOCX的答案,但DOC怎么样? 我想要免费和高性能的解决方案 – 不要打开12.000个Word实例来处理所有这些。 🙁 Aspose是商业产品,900美元是我做的太多的方式。

使用OpenXML SDK用换行符替换docx文件上的文本(换行符)

我正在尝试使用C#替换整个 DOCX文件上的特定字符串,并使用换行符(换行符)。 我要搜索的文本字符串可以位于文件的段落或表格中。 我目前正在使用下面的代码替换文本。 using (WordprocessingDocument doc = WordprocessingDocument.Open(“yourdoc.docx”, true)) { var body = doc.MainDocumentPart.Document.Body; foreach (var text in body.Descendants()) { if (text.Text.Contains(“##Text1##”)) { text.Text = text.Text.Replace(“##Text1##”, Environment.NewLine); } } } 问题:当我运行此代码时,输​​出DOCX文件将文本替换为空格(即“”)而不是换行符。 如何更改此代码才能使其正常工作?

使用C#读取doc和docx文件,而无需在服务器上安装MS Office

我正在开发一个项目(asp.net,c#,vb 2010,.net 4),我需要读取DOC和DOCX文件,我已经上传了(我已经完成了上传部分)。 棘手的部分是我没有在服务器上安装MS Office而且我无法使用它。 是否有任何公共图书馆可以包含在我的项目中,而无需安装任何东西? 这两个文档都很简单: NUMBER TAB STRING NUMBER TAB STRING NUMBER TAB STRING … 我需要为每一行(段落)提取数字和字符串。 愿有人帮忙吗? 我应该再次重复一遍,因为我无法在服务器上安装任何东西。