tika最新版本,tika-app-1.0.jar,提取office和pdf文档内容
Java 15 次浏览
老项目里常遇到 Office 文档或 PDF 要提取内容的情况?tika-app-1.8.jar真的挺管用的。Apache 出品,支持格式全,像.doc、.xlsx、.pdf、.html,基本都能解析,效果还不错。 用tika-app解析docx只要一行命令,连依赖都省了。比如你扔个 PDF 进去,
JavaME 0 次浏览