连续值决策树

算法原理:

采用ID3算法,以信息增益率为依据选择分裂属性。

连续值处理:

将数据按特征属性排序,相邻元素的中间点为潜在分裂点。依次分裂数据并计算期望信息,期望信息最小的点为最佳分裂点。

代码:

  • 生成决策树:decisiontree.py
  • 绘制决策树:treePlotter.py
zip 文件大小:9.82KB