中文分词词库整理,包括百度、搜狗等各大词库,全面详尽
PHP 22 次浏览
Mustard 是一款专为 Swift 语言设计的字符串分词库,帮助开发者轻松实现分词操作。
Swift 23 次浏览
IK 分词器的常用停止词库,1500 个词,清理文本杂音还挺方便的。你用 Elasticsearch 做中文搜索时,少不了要这些“没啥实际意义”的词,比如“”“”“一个”这类,用上这个库,能帮你省不少事。 停止词库其实就是在分词的时候,把一些常见但无用的词先过滤掉,不让它们出现在搜索结果里。这个库覆
PHP 0 次浏览
通过引入新的文本数据,扩充QQ词库。
C 29 次浏览
想体验飞快中文分词?这款纯C打造的分词工具,速度高达每秒1万字! 软件包仅100K,完全开源免费,内置86万词库,并提供详细的操作指南和测试用例。 使用超简单:1. 解压后放到 D 盘根目录。2. 打开命令行窗口,输入 d:cfenci.exe 回车即可。 性能测试结果:* 1000字以内:
C 23 次浏览
以下是经过整理的中文停止词库,为开发者提供参考。文本分词时,可首先参考官方提供的示例,其中包括全分词和精确分词。
Python 26 次浏览
姓名文档清单,适用于Python练习和《编程小白的第一本Python入门书》第七章类联系。
Python 25 次浏览