如何在python中分组和计算二项式变量?并绘制此图
我有一个这样的数据框:
| 国家 | 问题1 | 问题2 |
|---|---|---|
| 法国 | 是的 | 不 |
| 意大利 | 是的 | 是的 |
| 法国 | 是的 | 不 |
| 德国 | 不 | 是的 |
| 意大利 | 不 | 是的 |
回答
如何分组和计算二项式变量?
我们可以编码在列中的值question1和question2使用get_dummies,然后sum每唯一编码值country获得的数的计数Yes和No每每个问题country
counts = pd.get_dummies(df.set_index('country')).sum(level=0)
question1_no question1_yes question2_no question2_yes
country
france 0 2 2 0
italy 1 1 0 2
germany 1 0 0 1
如何制作这个情节?
过滤包含_Yes名称后缀的问题列,然后调用plotpandas dataframe的方法 withkind=bar创建一个条形图,显示Yes每个国家对应的问题数
counts.filter(like='_yes').plot(kind='bar')