数据特征提取与处理

分类变量特征提取:

用独热编码将分类变量表示为二进制特征向量。

文本特征提取:

使用词库模型将文本转换为特征向量,并可过滤停用词。

特征向量降维:

可通过停用词过滤减少特征向量的维数。

pdf 文件大小:5.71MB