人脸识别图像的数据预处理技术
二、数据处理
1. 检查变量中的缺失值
2. 将教育程度和自雇状态结合起来,可以通过每组贷款金额中位数的变化来提供良好的贷款估计
3. 处理Self_Employed、Credit_History和Loan_Amount_Term的缺失值。86%的Self_Employed值为“NO”,故将缺失值估计为“NO”比较可靠
处理Credit_History的缺失值:
df['Credit_History'].value_counts()
df['Credit_History'].fillna(1, inplace=True)
处理Loan_Amount_Term的缺失值:
1. 检查变量中的缺失值
2. 将教育程度和自雇状态结合起来,可以通过每组贷款金额中位数的变化来提供良好的贷款估计
3. 处理Self_Employed、Credit_History和Loan_Amount_Term的缺失值。86%的Self_Employed值为“NO”,故将缺失值估计为“NO”比较可靠
处理Credit_History的缺失值:
df['Credit_History'].value_counts()
df['Credit_History'].fillna(1, inplace=True)
处理Loan_Amount_Term的缺失值:
4.91MB
文件大小:
评论区