python学习笔记
python的基础笔记,其实实现是个简单版本并不难,文本切成句子,以句子相似性作为相互链接的权值,构造一个矩阵。有了权值矩阵就可以利用pagerank来得到每个句子的最终得分。计算好没个句子的出度入度,给个初始的得分,迭代更新至收敛,得分最高则作为摘要。计算句子相似性有很多办法,切词算集合距离,sentence2vec算欧式距离等等,切词集合距离的办法比较糙,效果一般,还是考虑了语意相似会好一些。这种办法一般在比较规矩的文档,如新闻,效果还可以
452.68KB
文件大小:
评论区