计算Python中一列每行的汉字数
给定一个数据框,如下所示:
id name
0 1 ???
1 2 ??
2 3 ????????????
3 4 ??????????
4 5 ??·??????
5 6 ????????
如何计算每行列的汉字数name?
预期的结果将是这样的:
id name count
0 1 ??? 3
1 2 ?? 2
2 3 ???????????? 12
3 4 ?????????? 10
4 5 ???????? 8
5 6 ???????? 8
回答
您可以使用str.count正则表达式模式来执行此操作:
df['count'] = df['name'].str.count(pat='[u4e00-u9fff]')
结果:
id name count
0 1 ??? 3
1 2 ?? 2
2 3 ???????????? 12
3 4 ?????????? 10
4 5 ??·?????? 8
5 6 ???????? 8