panda基础

加载文件 pd.read_csv('',sep=',')

打开*.csv文件分隔符默认为 逗号,

打开tsv文件需要设置为 制表符\t

表格尺寸 pd.shape

按列名访问表pd['cname']

指定列名

按index访问表 df.loc[2]

指定index

按块访问表df.iloc[[1,2],:]

指定行,列

匹配访问表df.query('name == "twy"')

描述eg:name == "twy" and age < 30

信息类型df.info()

删除信息df.drop(columns=['id'])

缺失值df.isnull()

返回True活着False 用 .sum()计算列中所有缺失值个数

删除缺失值df.dropna()

直接替换inplace=True

返回新的表inplace=False

填补缺失值df.fillna(0)

用0填充

dumy化df = pd.get_dummies(df)


转载请注明来源 https://tianweiye.github.io