C#使用PDFBox-0.7DLL文件通过命令行转换PDF为TXT示例代码
以下是使用 PDFBox-0.7 DLL 文件在 C# 中通过命令行将 PDF 文件转换为 TXT 的示例代码:
using System;
using System.Diagnostics;
class Program
{
static void Main(string[] args)
{
string pdfFile = "example.pdf"; // 输入的 PDF 文件路径
string txtFile = "output.txt"; // 输出的 TXT 文件路径
Process process = new Process();
process.StartInfo.FileName = "java"; // 使用 Java 运行 PDFBox
process.StartInfo.Arguments = $"-jar pdfbox-app-0.7.0.jar ExtractText {pdfFile} {txtFile}";
process.StartInfo.UseShellExecute = false;
process.StartInfo.RedirectStandardOutput = true;
process.StartInfo.RedirectStandardError = true;
process.Start();
string output = process.StandardOutput.ReadToEnd();
string error = process.StandardError.ReadToEnd();
process.WaitForExit();
if (!string.IsNullOrEmpty(error))
{
Console.WriteLine("Error: " + error);
}
else
{
Console.WriteLine("PDF to TXT conversion completed successfully.");
}
}
}
步骤说明:
1. 下载 PDFBox 的 JAR 包并将其与 C# 项目一起使用。
2. 调用 java 命令行工具执行 PDFBox JAR 文件,指定 PDF 文件与输出 TXT 文件路径。
3. 输出转化过程的状态信息。
这段代码通过 C# 运行外部的 Java PDFBox 工具来完成文件格式转换。
10.62MB
文件大小:
评论区