常用功能一、读入CSV
data = pd.read_csv('C:\\Users\\路径.csv')
如果涉及中文标题,加入参数: data = pd.read_csv('C:\\Users\\路径.csv',encoding='GBK')
data.dtypes # 查看dataframe 的数据类型
data.columns # 列名列表
data.shape 获取行列,返回数组,可以在后面加[0] 行 [1] 列
dfname._stat_axis.values.tolist() # 行名称
dfname.columns.values.tolist() # 列名称
暴力重命名所有列 data.columns = ['A','B'] 按照顺序重新命名所有列
data.rename(columns={'A':'a', 'B':'b', 'C':'c', 'D':'d'}, inplace = True) 这种方式可以任意更改自己想修改的列明,且不用注意顺序。
常用功能四、新增列
df['e'] = df['d']- 1
常用功能五、筛选
a. 筛选行列 : df.at、 df.ix、df.loc、df.iloc等用法
df['a']
df.ix 可以用数字也可以用列明来筛选 如: data.ix[1,1] data.ix["a","B"]
df.loc 只能用行名和列名来筛选 data.loc["b","B"] data.loc['b':'c','B','C']
df.iloc 只能用数字 data.loc[1,1]
df.at 可以支持数字行序和列名的混合使用: data[1,'a'] 可支持变量序号 如: for i in range(0,100): print(data.at[i,'shop_name'])
b. 筛选空值、等于某值:
单条件: df[df.D>0]
多条件: df[(df.D>0)&(df.C<0)]
包含多值: df.A.isin([‘重庆’,’成都’])
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。