The Go Programming Language条件随机场小结

命名实体识别相关的资料其实网上一大把,但要说比较系统又带代码示例的,还得看这篇总结。基于规则统计模型、再到比较火的条件随机场(CRF),它都讲了,连 CRF++ 工具怎么用都顺带提了下,比较贴心。

序列标注任务里,CRF 还挺常见的,像识别人名、地名这种,规则不固定,用传统方法就挺头疼的。这时候 CRF 的概率建模就派上用场了。文中还了判别式模型生成式模型的差别,嗯,讲得不啰嗦,挺容易上手的。

你要是用 Python 做中文 NER,那这资料真可以一看。它还推荐了些挺实用的链接,比如 CRF++ 工具库、自然语言的中英文词性标注,还有一个用逻辑回归预测降水概率的小 demo,蛮有意思的。

如果你刚开始摸 NLP,建议先从规则 vs 统计入手,看完这篇你就有谱了。要是你已经了解基本原理了,可以直接跳到 CRF 那部分看重点,节省时间。

pdf 文件大小:859.01KB