Pandas统计dataframe列中为NaN的行数

这分为两种情况:缺少值NaN和字符串NaN。

缺少值NaN

df = pd.DataFrame({'value':[np.nan, np.nan, 1, 5, 7]})
print (df)
value
0 NaN
1 NaN
2 1.0
3 5.0
4 7.0
count = df['value'].isna().sum()
#或者 count = df['value'].isnull().sum()
print (count)
2

判断列的值是否为nan,可以使用isna()或者isnull()函数。

字符串NaN

df = pd.DataFrame({'value':['NaN', 'NaN', 1, 5, 'NaN']})
print (df)
value
0 NaN
1 NaN
2 2
3 5
4 NaN
count = df['value'].eq('NaN').sum()
#或者count = (df['value'] == 'NaN').sum()
print (count)
3


版权声明:著作权归作者所有。

相关推荐

Pandas dataframe重命名列名

Pandas重命名有三种方法:1、使用columns重命名>>> df = pd.DataFrame({'$a':[1,2], '$b': [10,20]}) >>> df.columns = ['a', 'b'] >>> df  &n

Spark DataFrame join后移除重复的列

在Spark,两个DataFrame做join操作后,会出现重复的列。有两种方法可以用来移除重复的列。方法一:join表达式使用字符串数组(用于join的列)df1.join(df2, Seq("id","name"),"left") 这里DataFrame df1和df2使用了id和name两列来做join,返回的结

Linux统计目录下所有文件的行数

这里提供两种方法来统计目录下所有文件的行数:1、结合使用find和wc:find . -name '*.pl' | xargs wc -l 另外,此命令也可以改为:( find ./ -name '*.pl' -print0 | xargs -0&n