搜索
简帛阁>技术文章>python pandas中的agg函数用法

python pandas中的agg函数用法

pandas中的agg函数

python中的agg函数通常用于调用groupby()函数之后,对数据做一些聚合操作,包括sum,min,max以及其他一些聚合函数

如下所示:

>>> df = pd.read_excel(r"D:/myExcel/1.xlsx")
>>> df
        A   B   C
0     bob  12  45
1  millor  15  23
2     bob  34  88
3     bob  98  23

(1)获取按A分组后B列的最大值

>>> df.groupby(by='A').agg({'B':'max'})
         B
A         
bob     98
millor  15

(2)获取按A分组后B列的最大值和最小值

>>> df.groupby(by='A').agg({'B':['max','min']})
         B    
       max min
A             
bob     98  12
millor  15  15

(3)获取按A分组后B列的最大值和最小值以及C列的最大值

>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'})
         B       C
       max min min
A                 
bob     98  12  23
millor  15  15  23

(4)默认是以函数名称命名的,可以修改

>>> df.groupby(by='A').agg(
b_min=pd.NamedAgg(column='B', aggfunc='min'),
b_max=pd.NamedAgg(column='B', aggfunc='max'))
        b_min  b_max
A                   
bob        12     98
millor     15     15

通常在调用完agg函数后需要reset_index,因为pandas会默认将groupby()的列也做为index传到结果中

>>> df.groupby('A').B.agg(['min', 'max'])
        min  max
A               
bob      12   98
millor   15   15
>>> df.groupby('A').B.agg(['min', 'max']).reset_index()
        A  min  max
0     bob   12   98
1  millor   15   15

这就是python小工具关于agg函数的介绍,挺有用 的一个函数。 

pandas详解 聚合运算agg()

在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()很方便进行聚合操作。

1. 创建DataFrame对象

import pandas as pd
df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})

grouped = df1.groupby(['sex','smoker'])
# sex有 F M 二值,smoker有 Y N 二值,故分成四组。

2. 单列聚合

grouped['age'].agg('mean')
sex  smoker
F    N         30.0
     Y         28.0
M    N         40.0
     Y         17.5
Name: age, dtype: float64

3. 多列聚合

grouped.agg('mean')

4. 多种聚合运算

grouped['age'].agg(['min','max'])

5. 多种聚合运算并更改列名

grouped['age'].agg([('A','mean'),('B','max')])

6. 不同的列运用不同的聚合函数

grouped.agg({'age':['sum','mean'], 'weight':['min','max']})

7. 使用自定义的聚合函数

def Max_cut_Min(group):
    return group.max()-group.min()

grouped.agg(Max_cut_Min)

8. 方便的descibe

grouped.describe()

目录pandas中的agg函数pandas详解聚合运算agg()1创建DataFrame对象2单列聚合3多列聚合4多种聚合运算5多种聚合运算并更改列名6不同的列运用不同的聚合函数7使用自定义的聚合函数
这篇文章主要介绍了汇编语言AAD,DAA,DAS用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下AAD为下面的除法做准备,把AL和AH两个单
PassayearlearninginHangzhou,yifenfeiarrivalhometownNingboatfinallyLeaveNingbooneyear,yifenfeihaveman
摘要:数字化时代下,华为云数据管理服务DAS基于AI技术,于近期推出了智能SQL分析(包括慢SQL发现、SQL透视)、workload级别索引推荐、存储空间预测等运维特性,加上原有的数据库运维能力,
DAShttps://wwwprimaresearchorg/das2016/12thDocumentAnalysisSystemshttps://das2018cvltuwienacat/en/13
一、存储的分类根据服务器类型分为:封闭系统的存储和开放系统的存储,封闭系统主要指大型机,开放系统指基于Windows、UNIX、Linux等操作系统的服务器;开放系统的存储分为:内置存储外挂存储外挂存
标准库的string类提供了3个成员函数来从一个string得到c类型的字符数组:c_str()、data()、copy(p,n)。1c_str():生成一个constchar*指针,指向以空字符终止
题目内容:输入N×N阶矩阵(N使用define定义),输出其两条对角线上的各元素之和。【要求:①定义函数voidInput(inta[N][N],),其功能是输入矩阵的数据;②定义函数intAddD
1、/***获取模版文件格式资源://模块@主题/控制器/操作*@paramstring$template模版资源地址*@paramstring$layer视图层(目录)名称*@returnstrin
**关于快排函数的一些说明**qsort,包含在stdlibh头文件里,函数一共四个参数,没返回值一个典型的qsort的写法如下qsort(s,n,sizeof(s[0]),cmp);第一个参数是参