conlleval.pl CRF++结果评估脚本
CRF++的输出结果怎么评估?老实说,手动对比实在太累。conlleval.pl
这个小工具就挺省事的,专门用来评测 CRF 结果,是命名实体识别这类任务,效果一目了然。输出精确率、召回率、F1 啥的都有,格式也比较清晰,适合直接拿来或者画图用。
conlleval.pl 的原理其实不复杂,就是读取 CRF 的输出结果(基本是三列:词、标签、预测),按 BIO 格式来计算指标。你只要把结果丢进去,它就能快速帮你跑完评估,响应也快,适合开发时频繁验证模型效果。
用法也蛮简单,Linux/Mac 直接在终端里运行,像下面这样:
perl conlleval.pl < result>
Windows 下装个 Perl 环境就行,比如 Strawberry Perl。
你要是还不熟 CRF++,可以先看看这篇入门。另外,Python 的 CRF 代码实例也不错,配合起来练练手,思路就清晰了。
哦对了,conlleval.pl
对格式挺挑的,列和空格别弄错,不然容易出错。建议你评估前先手动检查一遍或者写个小脚本清洗下。
如果你经常调 CRF 模型,那conlleval.pl
确实是个挺顺手的工具。反正脚本不大、依赖少,随时能跑,不香吗?
12.74KB
文件大小:
评论区