微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

2、pandas的value_counts()和describe()

一、value_counts

    pandas 的value_counts()函数可以对Series里面的每个值进行计数并且排序。

    value_counts是计数,统计所有非零元素的个数,认以降序的方式输出Series。

    按区域进行分类统计降序排列,如果要升序排列可以添加参数ascending = True):

统计每个区域的占比(指定normalize参数为True,也可以用sum函数进行计算):

    空值是认剔除掉的,value_counts()返回的结果是一个Series数组,可以跟别的数组进行运算。

    value_count()跟透视表里(pandas或者excel)的计数很相似,都是返回一组唯一值,并进行计数,这样能快速找出重复出现的值。

    还有value_counts()函数是针对Series的,不是针对DataFrame的,所以只能是单列。

 

二、describe函数统计计数函数

    describe函数总结数据集分布的中心趋势,分散和形状,不包括NaN值。

    DataFrame.describe(percentiles=None,include=None,exclude=None),可以快速的求出一些算术运算指标:

   include包含all、[np.number]和[np.object]三个值,describe属性可以对数值型变量(include=['number'])和离散型变量(include=['object'])进行描述性统计

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐