Tag: abcpdf

ABCPDF:将PDF文件拆分为单页PDF文件

我正在使用ABCpdf工具,我试图将1TB的PDF文件(因此效率问题)分成单页PDF文件。 我尝试过以下方法: Doc theSrc = new Doc(); theSrc.Read(“C://development//pdfSplitter//Bxdfbc91ca-fc05-4315-8c40-798a77431ee0xP.pdf”); for (int i = 1; i <= theSrc.PageCount; i++) { Doc singlePagePdf = new Doc(); singlePagePdf.Rect.String = singlePagePdf.MediaBox.String = theSrc.MediaBox.String; singlePagePdf.AddPage(); singlePagePdf.AddImageDoc(theSrc, i, null); singlePagePdf.FrameRect(); singlePagePdf.Save("C://development//pdfSplitter//singlePDF//singlePage"+i+".pdf"); singlePagePdf.Clear(); } theSrc.Clear(); 这个非常快,但它不保留旋转的页面,他们需要。 我试图手动旋转它们,但这很快就变得有点混乱了,它们并没有像原始文档那样精确地出现。 我也尝试过: Doc theSrc = new Doc(); theSrc.Read(“C://development//pdfSplitter//Bxdfbc91ca-fc05-4315-8c40-798a77431ee0xP.pdf”); for (int i = 1; i <= theSrc.PageCount; i++) […]

ABCpdf转换html锚点以跳转到同一PDF中的另一个页面

我正在使用ABCpdf动态生成PDF,其中包含可链接到同一PDF中其他页面的目录。 问题是HTML中锚标记的路径变为临时文件的绝对路径。 例如,ABCpdf将呈现链接的href: Link 在PDF中: file:/// C:/Users/Aaron/AppData/Local/Temp/ABCpdf/pdfCMMYPSF.htm#elementId 这是我生成PDF的方式: Doc pdf = new Doc(); pdf.HtmlOptions.AddLinks = true; pdf.Rect.Rectangle = new System.Drawing.Rectangle(20, 80, 572, 702); int id = pdf.AddImageHtml(pdfHTML, true, pdf.HtmlOptions.BrowserWidth, true); while (pdf.Chainable(id)) { pdf.Page = pdf.AddPage(); id = pdf.AddImageToChain(id); } pdf.HtmlOptions.LinkPages(); for (int i = 0; i < pdf.PageCount; i++) { pdf.PageNumber = i; pdf.Flatten(); […]

ABCpdf上的符号字体

我正在使用ABCpdf.net组件将HTML转换为PDF。 某些HTML使用Symbol字体显示某些字符。 不幸的是,我们正在使用来自第三方的HTML,并且无法更改。 我的开发环境正确显示字体,但我的生产环境不会。 它就像没有安装字体一样,即使它是。 如果我在生产环境中在Internet Explorer中呈现相同的HTML,则显示正常。 我尝试将字体嵌入为.eot并在标题中提供@ font-face样式。 我尝试过使用TheDoc.AddFont(’Symbol’)。 有什么建议? 产品:ABCpdf .NET 7 x64 生产操作系统:Windows Server 2003 x64,IE8 开发操作系统:Win7 x64,IE8

如何使用ABCPdf.NET从PDF文件的所有页面中提取文本?

如何使用ABCPdf.NET工具从PDF文件中提取内容文本? 我尝试了GetText方法,但没有提取内容: var doc = new Doc(); var url = @”…/FileName.pdf”; doc.Read(url); string xmlContents = doc.GetText(“Text”); Response.Write(xmlContents); doc.Clear(); doc.Dispose(); 我的pdf有近1000个单词,但GetText只返回4-5个单词。 我意识到它只返回第一页的文本。 所以问题应该是“如何从pdf文件的所有页面中提取文本?” – (更改标题以使其更清晰)。 谢谢,