加载文件 pd.read_csv('',sep=',')
打开*.csv
文件分隔符默认为 逗号,
打开tsv
文件需要设置为 制表符\t
表格尺寸 pd.shape
按列名访问表pd['cname']
指定列名
按index访问表 df.loc[2]
指定index
按块访问表df.iloc[[1,2],:]
指定行,列
匹配访问表df.query('name == "twy"')
描述eg:name == "twy" and age < 30
信息类型df.info()
删除信息df.drop(columns=['id'])
缺失值df.isnull()
返回True活着False 用 .sum()
计算列中所有缺失值个数
删除缺失值df.dropna()
直接替换inplace=True
返回新的表inplace=False
填补缺失值df.fillna(0)
用0填充
dumy化df = pd.get_dummies(df)
转载请注明来源 https://tianweiye.github.io