Coreseek中文全文搜索引擎
中文搜索的难点,主要卡在分词这块儿。coreseek算是比较早就把这问题得还不错的方案。它其实就是在Sphinx的基础上,加了中文分词,能直接跑中文搜索,挺方便的。
3.2.14 版本和 4.1 版本都能用,不过 3.2.14 是基于老旧的 Sphinx 0.9.9,不支持像sql_attr_string
这种后面才有的功能。4.1 好点,基于 2.0.2,新功能能跑起来。
装起来也不麻烦,Sphinx和coreseek可以并存,不冲突。你要是还在用 PHP 搞站内搜索,或者对 Elasticsearch 下不了手,那这个方案就蛮合适的。
还有几个相关资源,想深入了解可以看这些链接,比如PHP 中文分词搜索实现和CoreSeek 中文站内搜索引擎,都挺实用的。
如果你有老项目,或者现在手头正好需要一个能跑中文的轻量级全文搜索,不妨折腾下coreseek,至少先跑起来试试。
站内全文搜索引擎 coreseek
预估大小:669个文件
Makefile.am
2KB
mk_dist.bat
222B
Makefile.am
3KB
AUTHORS
文件夹
Makefile.am
335B
model.aff
2KB
model.bin
108KB
model.bin
104KB
model.bin
42KB
model.bin
104KB
4.27MB
文件大小:
评论区