Python 正则表达式匹配我不想要的字符串

Python regex matching on strings I don't want

本问题已经有最佳答案,请猛点这里访问。

这是我第一次尝试将正则表达式与 Python 一起使用,或者根本没有,但它没有按预期工作。我想要一个正则表达式匹配任何字母字符或下划线作为第一个字符,然后是任意数量的字母数字字符或下划线。我使用的正则表达式是 '^[a-z_,AZ][a-z_A-Z0-9]*',它似乎在 pythex.org 上产生了我想要的东西,但在我的代码中它匹配的是我所做的字符串不想要。

我的代码如下:

1
2
isMatch = re.match('^[a-z_A-Z][a-z_A-Z0-9]*', someString)
return True if isMatch else False

两个我不想要的匹配字符串示例是:"qq-q"和"va[r"。我做错了什么?

相关讨论

  • 告诉我们 someString 是什么
  • 好吧,前两个字符完全符合预期,其中一个是 [a-z_A-Z] 匹配,然后是 [a-z_A-Z0-9] 匹配。这两个条件后面的 * 表示前面的语句可以重复零次或多次。该模式将字符串的开头部分匹配为有效,然后忽略其余部分,因为您缺少结尾 $ 或任何其他模式以表明您希望在那里结束搜索。
  • 如果你试图编写一个函数来检测一个字符串是否是一个有效的 Python 标识符,你可以在没有正则表达式的情况下做到这一点:试试 str.isidentifier() 方法。

我认为您只是忘记了正则表达式末尾的 $ 来指定字符串的结尾。

1
isMatch = re.match('^[a-z_A-Z][a-z_A-Z0-9]*$', someString)

否则,它将匹配字符串的开头而不是整个字符串,这就解释了为什么它在 "qq-q" ("qq" 是匹配项)和 "va[r" ("va" 是一个匹配项)上起作用。

相关讨论

  • 在 python 3.4 之后,您还可以使用 re.fullmatch 而不是添加 和 $ 锚点

以上是Python 正则表达式匹配我不想要的字符串的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>