Pandas-查找在每个班级组中显示的唯一值
我有一个 python 熊猫表,如下所示:
class | id
_____________________
A 12311894945
A 12311760566
A 12311433981
A 12299990440
A 12291758744
B 12311894945
B 12311760566
B 12311433981
B 12299990440
B 12291758744
C 12299990440
C 12291758744
我想获得属于每个类组的唯一 id 值,以便预期结果如下:
[12299990440, 12291758744]
我在想也许是一个 groupby 类和某种交叉,但我看不出这两个操作是如何在 Pandas 中一起完成的。
回答
尝试:
uniques = df.groupby('id')['class'].nunique()
uniques[uniques.eq(df['class'].nunique()) ].index
输出:
Int64Index([12291758744, 12299990440], dtype='int64', name='id')