Practical Text Mining with Perl文本挖掘指南
文本利器里的老江湖,Perl在这本《Practical Text Mining with Perl》里又证明了一次自己真不是吃素的。别看 Perl 有点“上古感”,它在文本挖掘这块还是挺能打的。书里讲的内容也挺全,像什么TF-IDF、朴素贝叶斯、情感甚至LDA主题建模,几乎都有涉及。重点是,都是带代码讲,直接拿来用都行。
文本预那一段实用,比如用 Perl 写正则清洗脏数据、分词、格式标准化这些,实际开发里基本天天都用得上。还有关联规则、Apriori算法那块,讲得挺细,逻辑清晰,代码也好懂。
如果你本来就对数据感兴趣,手上又碰巧有点文本类的数据需要,那这本书真的蛮合适的。尤其是熟一点 Perl 的开发者,用起来会更顺手。就算是初学者也没事,书里配的例子挺接地气,跟着敲一敲就能上手。
啦,如果你已经习惯用Python搞文本挖掘,这本书更像是个参考工具。但有一点不得不说,Perl 在文本上的正则能力是真的强,有些复杂的场景,还真是它更顺。
,《Practical Text Mining with Perl》属于那种用起来舒服,看完能马上用得上的实战书。如果你手头有些社交媒体文本、新闻数据啥的,想从头撸一套文本流程,不妨翻一翻这本。
你也可以顺带看看下面这些相关文章,对理解TF-IDF、Apriori、情感等概念也挺有的。
17.57MB
文件大小:
评论区