在嵌套数据中包含分组列

我想对每组变量ab. 问题是nest()不包括模型所需的分组变量。

expand.grid(a = LETTERS[1:3], b = LETTERS[1:2], c=1:3, d=1:3) %>% 
   group_by(a, b) %>% 
   nest()

将所得的表包括ab在“外部”和cd在嵌套tibble。如何将a和添加b到嵌套的 tibble 中?

回答

使用 cur_data_all() 创建一个 3 列数据框,其中最后一列 nest 是一个列表,其中每个组件都是 a,b 组中的 4 列数据框。

ans <- expand.grid(a = LETTERS[1:3], b = LETTERS[1:2], c=1:3, d=1:3) %>% 
   group_by(a, b) %>% 
   summarize(nest = list(cur_data_all()), .groups = "drop")

给予:

> ans
# A tibble: 6 x 3
  a     b     nest            
  <fct> <fct> <list>          
1 A     A     <tibble [9 x 4]>
2 A     B     <tibble [9 x 4]>
3 B     A     <tibble [9 x 4]>
4 B     B     <tibble [9 x 4]>
5 C     A     <tibble [9 x 4]>
6 C     B     <tibble [9 x 4]>

> names(ans$nest[[1]])
[1] "a" "b" "c" "d"

如果需要一个只有一个 ccolumn nest 的数据框等于上面的 nest 列(属性除外),那么此代码将起作用。

expand.grid(a = LETTERS[1:3], b = LETTERS[1:2], c=1:3, d=1:3) %>% 
  group_modify(~ tibble(nest = group_split(., a, b)))


以上是在嵌套数据中包含分组列的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>