我有一个包含许多NaN值的DataFrame。 我想删除包含太多NaN值的行;具体来说:7个或更多。
我试过用了 dropna 有几种方式,但似乎很清楚它贪婪地删除包含的列或行 任何 NaN值。
这个问题 (按行切片Pandas DataFrame),告诉我如果我可以编译一个具有太多NaN值的行的列表,我可以用一个简单的方法删除它们
df.drop(rows)
我知道我可以使用。来计算非空值 计数 函数,我可以从总和中减去并以这种方式获得NaN计数(是否有直接计算连续NaN值的方法?)。但即便如此,我也不确定如何编写一个逐行遍历DataFrame的循环。
这是我认为正确的一些伪代码:
### LOOP FOR ADDRESSING EACH row:
m = total - row.count()
if (m > 7):
df.drop(row)
我仍然是熊猫的新手,所以我对解决这个问题的其他方法非常开放;他们是更简单还是更复杂。