Tag: ms word

使用Visual Studio 2010 Express将.doc保存/转换为.html

我有一个word文档的文件夹,我想转换为html进行进一步处理。 我只有Visual Studio 2010 Express版。 可以使用快递版吗? 我找到了如何进行转换的示例,但是它们需要Microsoft.Office.Tools.Word库,它不附带Express。 编辑:我发现它,它实际上在COM对象中称为Microsoft Word 12.0对象库,它是Microsoft.Office.Interop.Word命名空间。

通过Office API将多个Word文档另存为HTML

我有大量需要解析的Word文档。 由于它们都是从同一个模板创建的,我认为最好的方法是将它们保存为HTML文件并解析HTML本身。 虽然将单个Word文档保存为HTML非常容易,但我还没有找到一种从Word内部执行批量过程的方法。 因此,我试图找到一种方法来利用Microsoft Office / Word API来实现这一目标。 如何使用Word API将许多Word文档另存为HTML? 提前致谢。 更新:更多细节…… 一些文档扩展名为.doc ,而其他文档扩展名为.docx 。 我希望这不是问题,但如果是,我只需将它们全部转换为.docx ,希望使用API​​或DocX 。 说到DocX,我在作者的博客上看到,可以使用以下代码将.docx文件保存为HTML: using System; using System.Collections.Generic; using System.Linq; using System.Text; using Word = Microsoft.Office.Interop.Word; using Microsoft.Office.Interop.Word; namespace ConsoleApplication1 { class Program { static void Main(string[] args) { // Convert Input.docx into Output.doc Convert(@”C:\users\cathal\Desktop\Input.docx”, @”c:\users\cathal\Desktop\Output.doc”, WdSaveFormat.wdFormatDocument); /* * Convert […]

向Word文档中的现有表添加行(打开XML)

我需要使用现有表(例如,3列)打开现有Word文档(.docx)并向该表添加新行。 有没有办法做到这一点? 我正在使用Open XML 我正在创建这样的表(第一次): Table tbl = new Table(); // Set the style and width for the table. TableProperties tableProp = new TableProperties(); TableStyle tableStyle = new TableStyle() { Val = “TableGrid” }; // Make the table width 100% of the page width. TableWidth tableWidth = new TableWidth() { Width = “5000”, Type = […]

在没有Microsoft.Office.Interop的情况下,将.NET doc和docx格式转换为.NET Core中的PDF

我需要在浏览器中显示Word .doc和.docx文件。 没有真正的客户端方式来执行此操作,并且出于法律原因,这些文档无法与Google文档或Microsoft Office 365共享。 浏览器无法显示Word,但可以显示PDF,因此我想在服务器上将这些文档转换为PDF然后显示。 我知道这可以使用Microsoft.Office.Interop.Word完成,但我的应用程序是.NET Core,无法访问Office互操作。 它可以在Azure上运行,但它也可以在Docker容器中运行。 似乎有很多类似的问题,但大多数人都在询问全框架.NET或假设服务器是Windows操作系统,任何答案对我都没用。 如何在不访问Microsoft.Office.Interop.Word 情况下将.doc和.docx文件转换为.pdf ?

有没有办法动态生成word文档而无需在机器上有文字

我打算动态地在Web服务器上生成Word文档。 在c#中有这样做的好方法吗? 我知道我可以编写Word来做这个,但我更喜欢另一种选择。

服务器Word自动化权限(一些答案和一些问题)

我试图使用word自动化来计算word文档中的页数。 到目前为止,我遇到了这些错误: Retrieving the COM class factory for component with CLSID {000209FF-0000-0000-C000-000000000046} failed due to the following error: 80070005. 打开文档时单词卡住了。 我目前的决议和目前采取的步骤是: 将注册表项[HKEY_CLASSES_ROOT\AppID\WINWORD.EXE]从{A86A40B3-0008-4D41-975C-BB586C7121E3}更改为{00020906-0000-0000-C000-000000000046} 。 在DCOM配置DCOMCNFG.EXE进行了以下更改: 在其appID“{A86A40B3-0008-4D41-975C-BB586C7121E3}”下显示的“Microsoft Word应用程序”中,为用户提供了iusr_本地午餐权限(仅限)并将标识设置为“启动用户”。 在“Microsoft Office Word 97 – 2003文档”中也被一些人称为“Microsoft Word文档”(可能取决于word版本)我给iusr和iwam完全启动和访问权限,将身份validation级别设置为“无”,设置启动用户到我自己的管理员用户。 “2-b”部分中所有3个mod的组合最终使所有这些考验成功并且现在正在运行。 使用我自己的用户进行启动是在打开文档时对单词卡住的响应。 将validation设置恢复为默认值会导致错误“1”。 将启动用户设置回“启动用户”会导致错误“2”。 目前的情况是一切正常,但只有当我的用户登录并在机器上处于活动状态时我才不会因为我必须使用我自己的用户必须登录并且认证设置为没有。 我写这个作为一个答案,为那些在我这里努力工作的人,并希望得到一些答案,我可以如何提高安全性,即删除启动用户和设置回认证,而不是每周7天每天24小时登录生产机器(当站点启动时)。 开发机器规格: Windows XP Pro 32位 IIS 5.1 经典ASP网站 COM + C#对象执行自动化。

如何识别word表中的合并列和行?

我需要阅读表格中的所有文字。 通过使用下面我可以从表中读取内容。 https://1drv.ms/w/s!Ah-Jh2Ok5SuHel9ZpB-V5DZ66DM这里我上传了一个包含表格的虚拟Docx文件。 foreach (Word.Row row in tb.Rows) { foreach (Word.Cell cell in row.Cells) { string cellText = “”; if (cell.Range != null) { cellText = cell.Range.Text.ToString().Trim().Replace(“\r\a”, “”); } } } 但对于以下3个案例,我面临问题。 案例1:显示在表1中,合并了两个列单元格。 通过使用上面的代码,我能够读取所有值,但与其他行相比,它的迭代次数减少了一次。 在这里我如何识别该行是否合并了cell / s? 案例2:在表2中显示,这里合并了2行。 迭代时我从tb.Rows获得以下错误无法访问此集合中的各个行,因为该表具有垂直合并的单元格。 在这里我如何识别表是否合并了行? 案例3:显示在表3中。表格在表格内。 通过使用上面的代码,它只识别一个表和cellText = cell.Range.Text.ToString().Trim().Replace(“\r\a”, “”) ; 在此行的末尾执行cellText获取当前单元格+内部表格单元格值的所有值。 即2abcd。 在这里我如何迭代内部表?

使用XML和C#创建Word文档

我为报告创建了一个xml模板。 用户应该能够通过在C#中创建的程序添加信息以根据自己的需要个性化此报告 如何编辑实体的内容然后从用户放入文本框然后在单词上显示?

如何以编程方式在ms字中设置文本样式?

情况: 我正在使用MS Word文档的内容。 我根据某些规则改变了一些单词的颜色。 每个KeyPress事件都会出现单词着色。 问题: 当用户键入满足我的规则类型的单词的单词变为彩色并感染将在彩色文本后面输入的未来文本 。 但未来的文字可能不符合规则。 从一方面来看,只是键入的文本不应该是彩色的,而另一方面它已经着色,因为它不幸地在彩色文本之后, 并被它的风格感染 。 问题:如何抓取与当前光标位置对应的Word.Range对象并将字体颜色显式设置为中性默认颜色? 我试过了 Word.Range r = app.Application.ActiveDocument.Range( app.Application.ActiveDocument.Bookmarks[@”\Sel”].Range.Start, app.Application.ActiveDocument.Bookmarks[@”\Sel”].Range.End); r.Font.Color = WdColor.wdColorBlack; 和 Word.Range r = app.Application.ActiveDocument.Bookmarks[@”\Sel”].Range; r.Font.Color = WdColor.wdColorBlack;

使用C#在docx中选择页面

我目前在一个变量中得到整个word文档,如下所示: docs.ActiveWindow.Selection.WholeStory(); docs.ActiveWindow.Selection.Copy(); IDataObject data = Clipboard.GetDataObject(); wholestory()函数选择整个word文档。 如果我可以逐页选择,请建议我。