在R中的多行上过滤一个组

我有一个像这样的数据框,带有 ID 和两个条件:

df <- data.frame(ID=c("A", "A", "A", "B", "C"), cond1=c("yes", "yes", "no", "no", "yes"), cond2=c("no", "no", "yes", "yes", "yes"))
df
   ID cond1 cond2
1  A   yes    no
2  A   yes    no
3  A    no   yes
4  B    no   yes
5  C   yes   yes

我想过滤适用 cond1 和 cond2 的 ID(=是),但它不必在同一行中为真。这意味着我想过滤掉 ID A 和 C,而不是 B。

我尝试使用 dplyr 对 group_by() 和 filter() 进行分组:

df %>%
group_by(PID)%>%
filter(cond1==yes&cond2==yes)

但这只会过滤出一个 PID/行,其中 cond 1 和 cond 2 都适用(所以只有 ID C/行 5)。

我可以做些什么来按组过滤 PID/行,其中有两个条件,在一组中 t0 都为真,但在一行中不为真?

谢谢!

回答

你可以使用any-

library(dplyr)

df %>%
  group_by(ID) %>%
  filter(any(cond1 == 'yes') && any(cond2 == 'yes')) %>%
  ungroup

#  ID    cond1 cond2
#  <chr> <chr> <chr>
#1 A     yes   no   
#2 A     yes   no   
#3 A     no    yes  
#4 C     yes   yes  


以上是在R中的多行上过滤一个组的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>