基于CNN的中文文本分类算法应用与场景
利用word2vec获取中文文本向量,再输入卷积网络分类。
可应用场景
- 垃圾邮件过滤
- 情感分析
运行方法
1. 训练:run python train.py
2. 查看summaries:run tensorboard --logdir /{PATH_TO_CODE}/runs/{TIME_DIR}/summaries/
3. 分类:run python eval.py
提示
- 可自指定分类文件
- 若需测试准确率,需指定标签文件
推荐环境
- python 2.7.13
- tensorflow 1.0.0
- gensim 1.0.1
- Ubuntu16.04 64bit
neal23333-zh_cnn_text_classify-master.zip
预估大小:30个文件
zh_cnn_text_classify
文件夹
train.py
9KB
data_helpers.py
4KB
word2vec_helpers.py
3KB
eval.py
5KB
README.md
2KB
runs
文件夹
1492954581
文件夹
checkpoints
文件夹
model-300.meta
100KB
13.32MB
文件大小:
评论区