基于Apriori算法挖掘英语词汇关联规则

实验流程如下:

  1. 数据预处理:对五个数据表(交通、语言、典籍、建筑、植物)进行预处理,提取order_id和dishes_name两列,整合成一个包含125行2列的detail_clear.csv文件。

  2. 生成二元矩阵:使用English 01矩阵.ipynb文件,将detail_clear.csv转化为二元0-1矩阵,并保存为ruledata.csv文件。

  3. 应用Apriori算法:通过Generate rules.ipynb文件,设置支持度为0.3和置信度为0.5,运行Apriori算法,生成155条关联规则,并保存至rules.csv文件。

通过上述步骤,我们可以有效地利用Apriori算法挖掘英语词汇之间的关联规则。

zip 文件大小:9.05KB