如何在python中分组和计算二项式变量?并绘制此图

我有一个这样的数据框:

国家 问题1 问题2
法国 是的
意大利 是的 是的
法国 是的
德国 是的
意大利 是的

回答

如何分组和计算二项式变量?

我们可以编码在列中的值question1question2使用get_dummies,然后sum每唯一编码值country获得的数的计数YesNo每每个问题country

counts = pd.get_dummies(df.set_index('country')).sum(level=0)

         question1_no  question1_yes  question2_no  question2_yes
country                                                          
france              0              2             2              0
italy               1              1             0              2
germany             1              0             0              1

如何制作这个情节?

过滤包含_Yes名称后缀的问题列,然后调用plotpandas dataframe的方法 withkind=bar创建一个条形图,显示Yes每个国家对应的问题数

counts.filter(like='_yes').plot(kind='bar') 


以上是如何在python中分组和计算二项式变量?并绘制此图的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>