Python正则表达式指南

  • A+
所属分类:python快速入门
摘要本文介绍了Python对于正则表达式的支持,包括正则表达式基础,主要是有一张图片上面讲了关于Python正则表达式的元字符和语法,很是实用,在这里记录一下。

前言

之前写过一篇关于Python正则表达式的文章,关于(python)正则表达式,其实主要是找里面的一个参考链接,里面给了一张关于正则表达式图,很好用,也是为了我方便去查找,我把图在这里也放一下。

我参考的文章的链接:Python正则表达式指南

指南

在线测试网站

在线正则表达式测试

正则表达式在线测试 - 菜鸟工具:这个在线网站可以通过点击生成代码来生成各种语言下的正则表达式。

正则表达式匹配中文标点

关于汉字和汉字标点的匹配,我大概说一下:

匹配中文标点符号

  1. String str="[\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]"

该表达式可以识别出: 。 ;  , : “ ”( ) 、 ? 《 》 这些标点符号。

关于上面的\u3002等,都是中文标点对应的unicode码,具体的对应关系,可以看这个链接:中文标点符号unicode码,我大概罗列在下面方便使用:

  1. String str="[\u3002\uFF1F\uFF01\uFF0C\u3001\uFF1B\uFF1A\u300C\u300D\u300E\u300F\u2018\u2019\u201C\u201D\uFF08\uFF09\u3014\u3015\u3010\u3011\u2014\u2026\u2013\uFF0E\u300A\u300B\u3008\u3009]"

匹配中文汉字

  1. String str="[\u4e00-\u9fa5]";

该表达式可以识别出任何汉字。

最后贴出参考的资料

中文字符及其中文标点符号正则表达式匹配

敏感词库

最近做东西需要进行敏感词的过滤,于是在网上寻找敏感词库,目前找到两个比较好用的,放在这里:

Sensitive-word:这个敏感词库是有分类的

年華社区所使用的敏感词汇名单:这是一份没有分类的敏感词库

正则表达式的元字符和语法图

下面就直接放一下图片(图片转在上面那个文章):

Python正则表达式指南

好了,主要放一张图片,之后有什么关于正则表达式的内容也会在这篇文章进行更新的。

  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
王 茂南

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: