Python re模块findall用法详解
正则表达式的findall
用法,一直是文本数据时的利器。这份re 模块-findall
的 Python 内部培训课件,讲得蛮细的,例子也挺贴地气。不光展示了怎么用,还顺带提了些坑点,适合新手入门,也适合老手回顾。
findall 的用法在这里讲得挺实在:你想提取网页里的手机号、邮箱、链接?直接配个模式就能搞定,返回的还是列表格式,方便后续。
像下面这个场景就常见:
import re
text = "email: test@example.com"
result = re.findall(r"[\w.-]+@[\w.-]+", text)
print(result)
输出的是邮箱地址,响应也快,代码也简单。
嗯,课程还顺带提到compile
和模块拆分,你要是想再多了解点,可以去看看re 模块-compile那篇文章。配合起来看效果更佳。
再提醒一句,findall
默认是贪婪匹配,用的时候注意正则表达式别太模糊,容易抓到一堆奇怪的数据。
如果你经常写爬虫,或者在做日志、表单提取这些,真的可以把这份课件好好过一遍,会有不少收获。
5.17MB
文件大小:
评论区