删除重复的组dplyrr

我有以下数据框:

df <- structure(list(GENE= c("ENS1", "ENS2", 
"ENS3", "ENS4", "ENS1",  "ENS2", "ENS3"), group= c(1L, 
1L, 1L, 2L, 3L, 3L, 3L)), 
class = "data.frame", row.names = c(NA, -7L))

GENE  group
ENS1  1
ENS2  1
ENS3  1
ENS4  2
ENS1  3
ENS2  3
ENS3  3

由于第 1 组和第 3 组相同,我想删除其中之一。我怎样才能做到这一点?

谢谢

回答

使用碱R选项stack+ unstack+duplicated

setNames(
    type.convert(
        stack((u <- unstack(df))[!duplicated(u)]),
        as.is = TRUE
    ), names(df)
)

这使

  GENE group
1 ENS1     1
2 ENS2     1
3 ENS3     1
4 ENS4     2


以上是删除重复的组dplyrr的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>