C#使用PDFBox-0.7DLL文件通过命令行转换PDF为TXT示例代码

以下是使用 PDFBox-0.7 DLL 文件在 C# 中通过命令行将 PDF 文件转换为 TXT 的示例代码:

using System;
using System.Diagnostics;

class Program
{
    static void Main(string[] args)
    {
        string pdfFile = "example.pdf"; // 输入的 PDF 文件路径
        string txtFile = "output.txt"; // 输出的 TXT 文件路径

        Process process = new Process();
        process.StartInfo.FileName = "java"; // 使用 Java 运行 PDFBox
        process.StartInfo.Arguments = $"-jar pdfbox-app-0.7.0.jar ExtractText {pdfFile} {txtFile}";
        process.StartInfo.UseShellExecute = false;
        process.StartInfo.RedirectStandardOutput = true;
        process.StartInfo.RedirectStandardError = true;

        process.Start();
        string output = process.StandardOutput.ReadToEnd();
        string error = process.StandardError.ReadToEnd();

        process.WaitForExit();

        if (!string.IsNullOrEmpty(error))
        {
            Console.WriteLine("Error: " + error);
        }
        else
        {
            Console.WriteLine("PDF to TXT conversion completed successfully.");
        }
    }
}

步骤说明:

1. 下载 PDFBox 的 JAR 包并将其与 C# 项目一起使用。

2. 调用 java 命令行工具执行 PDFBox JAR 文件,指定 PDF 文件与输出 TXT 文件路径。

3. 输出转化过程的状态信息。

这段代码通过 C# 运行外部的 Java PDFBox 工具来完成文件格式转换。

zip 文件大小:10.62MB