同义词词林中文词汇知识库

汉语词汇研究的老朋友《同义词词林》,挺适合做自然语言的参考数据源。它不是那种翻词典式的工具书,更像是有条理的词汇知识库。里面的编码系统虽然一开始看着有点懵,但摸清规则后,查词和找同义关系挺高效的。比如你要做个语义相似度比对的功能,或者做问答系统中的同义问法识别,用它来训练词向量、构建词林树结构都比较靠谱。

它的分类挺细,像“阿波罗”、“阿比让”这种冷门词都有编号,查起来方便。对应的代码像Am03D03@这类,看似复杂,其实是多层级标注,一层层拆开看就明白了。

哦对,它不仅适合做中文工具训练语料,也蛮适合做前端数据结构练习素材,比如你可以根据编码组织成树形结构,在 UI 上做分类联动选择啥的,锻炼思路。

如果你是做文本、中文 NLP、教育产品、或者搞词汇知识图谱的,这本《同义词词林》还挺值得收藏下的。

txt 文件大小:1.43MB