在嵌套数据中包含分组列
我想对每组变量a和b. 问题是nest()不包括模型所需的分组变量。
expand.grid(a = LETTERS[1:3], b = LETTERS[1:2], c=1:3, d=1:3) %>%
group_by(a, b) %>%
nest()
将所得的表包括a和b在“外部”和c和d在嵌套tibble。如何将a和添加b到嵌套的 tibble 中?
回答
使用 cur_data_all() 创建一个 3 列数据框,其中最后一列 nest 是一个列表,其中每个组件都是 a,b 组中的 4 列数据框。
ans <- expand.grid(a = LETTERS[1:3], b = LETTERS[1:2], c=1:3, d=1:3) %>%
group_by(a, b) %>%
summarize(nest = list(cur_data_all()), .groups = "drop")
给予:
> ans
# A tibble: 6 x 3
a b nest
<fct> <fct> <list>
1 A A <tibble [9 x 4]>
2 A B <tibble [9 x 4]>
3 B A <tibble [9 x 4]>
4 B B <tibble [9 x 4]>
5 C A <tibble [9 x 4]>
6 C B <tibble [9 x 4]>
> names(ans$nest[[1]])
[1] "a" "b" "c" "d"
如果需要一个只有一个 ccolumn nest 的数据框等于上面的 nest 列(属性除外),那么此代码将起作用。
expand.grid(a = LETTERS[1:3], b = LETTERS[1:2], c=1:3, d=1:3) %>%
group_modify(~ tibble(nest = group_split(., a, b)))