计算Python中一列每行的汉字数

给定一个数据框,如下所示:

   id            name
0   1             ???
1   2              ??
2   3  ????????????
3   4    ??????????
4   5      ??·??????
5   6      ????????

如何计算每行列的汉字数name

预期的结果将是这样的:

   id            name           count
0   1             ???            3
1   2              ??             2
2   3    ????????????    12
3   4      ??????????      10
4   5        ????????        8
5   6        ????????        8

回答

您可以使用str.count正则表达式模式来执行此操作:

df['count'] = df['name'].str.count(pat='[u4e00-u9fff]')

结果:

   id                    name   count
0   1                   ???      3
1   2                    ??       2
2   3  ????????????      12
3   4      ??????????      10
4   5        ??·??????       8
5   6         ????????       8


以上是计算Python中一列每行的汉字数的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>