.rtf转.txt程序源码

是否为文件格式转换感到烦恼?自己写程序,是否面临过以下问题: 1.中文文件名无法读取2.遍历文件夹不彻底,分不清文件和文件夹3.各种形式的文件比较杂乱,不知如何筛选得到想要的文件作者打算做一个系列,专攻各种形式的格式转换,最后集合成模块开源供大家使用。利用Python自身功能,到调用其他软件与模组,都会有。这是第一个版本,唯一的bug在于如果文件夹层数比较多,不能第一次就修改完所有非法文件名,但是多运行几次就可以了!第二个版本正在光速赶来,预期包含筛选文件类型、输出文件夹目录结构等进阶功能。欢迎大家多多留言,说出你需要的功能,我们一起促成良性互动。作者主要领域在文本分析、话语分析与自然语言处理,其中涉及到很多语料的格式转换、清晰、标注,再到后面的分词、降维、建模。因此会自己设计一些“无用小发明”。之所以后续开源,是真心希望这些东西能够帮助到国内语言学科的发展,为后来者做类似研究扫清不必要的障碍。不过,自己摸爬滚打的过程也非常难能可贵。创作不易,希望大家多多支持。数据无价,大家处理前切记备份!
py 文件大小:1.32KB