基于Apriori算法挖掘英语词汇关联规则
实验流程如下:
-
数据预处理:对五个数据表(交通、语言、典籍、建筑、植物)进行预处理,提取order_id和dishes_name两列,整合成一个包含125行2列的detail_clear.csv文件。
-
生成二元矩阵:使用English 01矩阵.ipynb文件,将detail_clear.csv转化为二元0-1矩阵,并保存为ruledata.csv文件。
-
应用Apriori算法:通过Generate rules.ipynb文件,设置支持度为0.3和置信度为0.5,运行Apriori算法,生成155条关联规则,并保存至rules.csv文件。
通过上述步骤,我们可以有效地利用Apriori算法挖掘英语词汇之间的关联规则。
9.05KB
文件大小:
评论区