​        Hello大家好,正则表达式在Python当中的应用非常广泛,比如我们最熟悉的网页爬虫,我们在爬虫当中用的最多的就是正则表达式的匹配。今天我想和大家分享一下在Python中使用正则表达式去进行文本内容匹配的方法。

        比如现在给定了我们一个字符串'a b c d e (f g) h i j k (l m n)',现在我们想删除每一对括号里面的内容,只保留括号外的内容。那么我们就可以通过使用正则表达式去进行文章内容的匹配:

        我们在导入 re 库的时候,我们还需要编写re正则表达式的规则,因为在上面介绍中我们说想去匹配括号内的内容并且将他们进行替换,那么我们的规则就可以写成:

re.findall(r"\(.*?\)",test_string)    

        其中. 表示匹配除换行符 \n 之外的任何单字符,*表示零次或多次。那么上面这个问题的解法如下,大家如果有什么不懂的可以随时给我留言!

import re
test_string = 'a b c d e (f g) h i j k (l m n)'
remove = re.findall(r" \(.*?\)",test_string)
for r in remove:
    test_string = test_string.replace(r,'')
print(test_string)

       另外再给大家推荐三个网站,第一个是菜鸟的正则表达式的教学文档,还有正则表达式的调试工具以及可视化网站。

菜鸟的正则表达式的教学文档:

正则表达式 – 教程 | 菜鸟教程

 正则表达式的调试工具:

RegExr: Learn, Build, & Test RegEx 

 可视化网站:

 Regulex:JavaScript Regular Expression Visualizer

 

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐