熊猫总和然后除以唯一计数

我有一个 df 看起来像这样:

test = pd.DataFrame({'date': ['1/07/2019', '1/08/2019', '1/08/2019','1/07/2019', '1/08/2019', '1/09/2019', '1/07/2019', '1/07/2019'],
                     'basket_id': ['AB789', 'CD674', 'KL237', 'AB789', 'CD674', 'RS234', 'ST089', 'OP448'],
                     'product_id': ['1839', '0368', '5360', '2524', '1036', '1184', '9280', '7721'],
                   'revenue': [400, 500, 350, 200, 100, 450, 50, 150]})
print(test)

现在我想创建一个名为 temp_test 的 df,它显示日期、收入总和、唯一篮子 ID 的计数,最后是每个篮子的平均收入列。

temp_test = test.groupby(['date']).agg({'revenue': sum, 'basket_id': 'nunique'}).reset_index()
temp_test['rev_per_basket'] = test['revenue'] / test.groupby(['date'])['basket_id'].nunique()
print(temp_test)

但是,我的 rev_per_basket 列只显示 NaN。理想情况下,它应该显示 226.66、475 和 450。对那里出了什么问题有任何想法吗?谢谢!

回答

你要

temp_test['rev_per_basket'] = temp_test.revenue.divide(temp_test.basket_id)


以上是熊猫总和然后除以唯一计数的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>