pandas中groupby中as_index的功能到底是什么?
解决方法:
当你不理解某事时,print()是你的朋友.它多次清除疑惑.
看一看:
import pandas as pd
df = pd.DataFrame(data={'books':['bk1','bk1','bk1','bk2','bk2','bk3'], 'price': [12,12,12,15,15,17]})
print(df)
print(df.groupby('books', as_index=True).sum())
print(df.groupby('books', as_index=False).sum())
输出:
books price
0 bk1 12
1 bk1 12
2 bk1 12
3 bk2 15
4 bk2 15
5 bk3 17
price
books
bk1 36
bk2 30
bk3 17
books price
0 bk1 36
1 bk2 30
2 bk3 17
当as_index = True时,您在groupby()中使用的键将成为新数据帧中的索引.
将列设置为索引时获得的好处是:
>速度.根据索引列过滤值时,例如. df.loc [‘bk1′],因为索引列的散列会更快.它不必遍历整个书籍专栏就能找到’bk1’.它只计算’bk1’的哈希值并在1中找到它.
>轻松.当as_index = True时,您可以使用这种语法df.loc [‘bk1′],这种语法更短更快,而df.loc [df.books ==’bk1’]则更长,更慢.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。