Pandas学习(四)——缺失值处理
常见缺失值处理有两种方法:
1)删除
Nantest1 = test_1
pd.isnull(Nantest1).any()
此时是存在缺失值的
data2 = Nantest1.dropna()
pd.isnull(data2).any()
使用dropna()函数后删除缺失值,此时数据表中不在含有缺失值。
此方法会删除缺失值所在的整行
2)替换
Nantest1["SO2"].fillna(Nantest1["SO2"].mean(),inplace = True)
pd.isnull(Nantest1).any()
使用fillna(value, inplace = True ) 函数替换所有缺失值,替换后数据表中不再有缺失值,此处是以SO2列的中位数替换掉了所有的缺失值。
共有 0 条评论