R语言中的分组计算-菠菜365定位-365bet主页器-bt365开户-菠菜365定位

点击下载本文全部代码

一、aggregate()函数分组计算问题在R语言中有多种处理办法，包括tapply()、group_by()和aggregate()等，其中aggregate()是最为出色、灵活和常用的函数。

首先查看aggregate()的基本格式：

aggregate(x, # x是需要被分组计算的值列

by, # by是分组的依据列，是一个list对象

FUN, # FUN是分组计算使用的统计函数名

...,

simplify = TRUE, # simplify设置结果是否需要简化

drop = TRUE) # drop设置是否去除未被使用的列

二、简单分组计算InsectSprays是R语言的自带数据集，记录了不同杀虫剂使用后的虫子数量，使用head(InsectSprays)可以快速浏览数据格式：

> head(InsectSprays)

count spray

1 10 A

2 7 A

3 20 A

4 14 A

5 14 A

6 12 A

如果我们希望评估不同杀虫剂的有效性，就需要计算每种杀虫剂样本的统计值。以下代码实现了计算各种杀虫剂的平均效力。代码中，InsectSprays$count是虫子数量列，是要被分组的值列；by需要一个list对象，list内的要素格式为“结果的分组条件列名 = 表中的分组条件列名”，前后列名可以不一致；FUN选择了最普通的均值函数，可以根据需要替换为max, min, median等甚至是自定义的函数，但注意不要添加"()"。

> result <- aggregate(x = InsectSprays$count,

+ by = list(spray = InsectSprays$spray),

+ FUN = mean)

> result

spray x

1 A 14.500000

2 B 15.333333

3 C 2.083333

4 D 4.916667

5 E 3.500000

6 F 16.666667

三、交叉分组计算warpbreaks是R语言的自带数据集，记录了织布机的异常数据，使用head(warpbreaks)进行可以快速浏览数据格式：

> head(warpbreaks)

breaks wool tension

1 26 A L

2 30 A L

3 54 A L

4 25 A L

5 70 A L

6 52 A L

当分组条件为多个时，只需要在by属性的list对象内添加多个分组信息。

> result <- aggregate(warpbreaks$breaks,

+ by = list(wool = warpbreaks$wool,

+ tension = warpbreaks$tension),

+ FUN = median)

> result

wool tension x

1 A L 51

2 B L 29

3 A M 21

4 B M 28

5 A H 24

6 B H 17

四、自定义函数分组计算由于aggregate()函数中FUN属性是不限制函数（能正常使用的前提下）的，因此可以编写自身需要的自定义函数。如以下代码定义了返回标准差与均值的比值，即变异系数。

cv <- function(vector){

sd(vector)/mean(vector)

}

只需要在FUN中调用cv即可计算每个分组的变异系数，继续使用前一个例子的数据。

> result <- aggregate(warpbreaks$breaks,

+ by = list(wool = warpbreaks$wool,

+ tension = warpbreaks$tension),

+ FUN = cv)

> result

wool tension x

1 A L 0.4061834

2 B L 0.3493249

3 A M 0.3608439

4 B M 0.3277194

5 A H 0.4183441

6 B H 0.2605903

R语言中的分组计算

相关推荐

汉庭酒店的会员卡是怎么办理的？有什么优惠吗？

全新技艺《蓝月传奇》装备附灵系统大更新

阴阳师赤舌阴阳师赤舌哪里多跑跑车赤舌

PS4上一共出了多少游戏游戏数量统计及发展趋势分析

合作伙伴

R语言中的分组计算

相关推荐

汉庭酒店的会员卡是怎么办理的？有什么优惠吗？

全新技艺《蓝月传奇》装备附灵系统大更新

阴阳师赤舌 阴阳师赤舌哪里多跑跑车赤舌

PS4上一共出了多少游戏 游戏数量统计及发展趋势分析

合作伙伴

阴阳师赤舌阴阳师赤舌哪里多跑跑车赤舌

PS4上一共出了多少游戏游戏数量统计及发展趋势分析