Practical Text Mining with Perl文本挖掘指南

文本利器里的老江湖,Perl在这本《Practical Text Mining with Perl》里又证明了一次自己真不是吃素的。别看 Perl 有点“上古感”,它在文本挖掘这块还是挺能打的。书里讲的内容也挺全,像什么TF-IDF朴素贝叶斯情感甚至LDA主题建模,几乎都有涉及。重点是,都是带代码讲,直接拿来用都行。

文本预那一段实用,比如用 Perl 写正则清洗脏数据、分词、格式标准化这些,实际开发里基本天天都用得上。还有关联规则、Apriori算法那块,讲得挺细,逻辑清晰,代码也好懂。

如果你本来就对数据感兴趣,手上又碰巧有点文本类的数据需要,那这本书真的蛮合适的。尤其是熟一点 Perl 的开发者,用起来会更顺手。就算是初学者也没事,书里配的例子挺接地气,跟着敲一敲就能上手。

啦,如果你已经习惯用Python搞文本挖掘,这本书更像是个参考工具。但有一点不得不说,Perl 在文本上的正则能力是真的强,有些复杂的场景,还真是它更顺。

,《Practical Text Mining with Perl》属于那种用起来舒服,看完能马上用得上的实战书。如果你手头有些社交媒体文本、新闻数据啥的,想从头撸一套文本流程,不妨翻一翻这本。

你也可以顺带看看下面这些相关文章,对理解TF-IDFApriori情感等概念也挺有的。

pdf 文件大小:17.57MB