Coreseek中文全文搜索引擎

中文搜索的难点,主要卡在分词这块儿。coreseek算是比较早就把这问题得还不错的方案。它其实就是在Sphinx的基础上,加了中文分词,能直接跑中文搜索,挺方便的。

3.2.14 版本和 4.1 版本都能用,不过 3.2.14 是基于老旧的 Sphinx 0.9.9,不支持像sql_attr_string这种后面才有的功能。4.1 好点,基于 2.0.2,新功能能跑起来。

装起来也不麻烦,Sphinxcoreseek可以并存,不冲突。你要是还在用 PHP 搞站内搜索,或者对 Elasticsearch 下不了手,那这个方案就蛮合适的。

还有几个相关资源,想深入了解可以看这些链接,比如PHP 中文分词搜索实现CoreSeek 中文站内搜索引擎,都挺实用的。

如果你有老项目,或者现在手头正好需要一个能跑中文的轻量级全文搜索,不妨折腾下coreseek,至少先跑起来试试。

folder
站内全文搜索引擎 coreseek 预估大小:669个文件
file
Makefile.am 2KB
file
mk_dist.bat 222B
file
Makefile.am 3KB
folder
AUTHORS 文件夹
file
Makefile.am 335B
file
model.aff 2KB
file
model.bin 108KB
file
model.bin 104KB
file
model.bin 42KB
file
model.bin 104KB
file
model.bin 30KB
file
model.bin 37KB
file
model.bin 30KB
file
model.bin 33KB
file
Makefile.am 335B
file
Makefile.am 322B
file
Makefile.am 164B
file
Makefile.am 1KB
file
Makefile.am 2KB
file
configure.ac 13KB
zip 文件大小:4.27MB