1.创建带有缺失值的数据库:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])    # 随机产生5行3列的数据  
df.ix[1, :-1] = np.nan    # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan

print('\ndf1')    # 输出df1,然后换行
print(df)

查看数据内容:

详解pandas删除缺失数据(pd.dropna()方法)

2.通常情况下删除行,使用参数axis = 0,删除列的参数axis = 1,通常不会这么做,那样会删除一个变量。

print('\ndrop row')
print(df.dropna(axis = 0))

删除后结果:

详解pandas删除缺失数据(pd.dropna()方法)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

标签:
pandas,pd.dropna(),pandas删除缺失数据

免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
白云城资源网 Copyright www.dyhadc.com

评论“详解pandas删除缺失数据(pd.dropna()方法)”

暂无“详解pandas删除缺失数据(pd.dropna()方法)”评论...

RTX 5090要首发 性能要翻倍!三星展示GDDR7显存

三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。

首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。

据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。