如何用正则表达式匹配重复标签的第二个内容?
正则表达式捕捉重复标签的第二个问题
在爬取网页内容时,经常会遇到需要匹配重复标签的情况。然而,如果使用普通的正则表达式,往往会匹配到第一个标签。如何仅匹配第二个重复标签呢?
这种情况的解决办法是使用回溯引用。回溯引用是指在正则表达式中引用前面的匹配结果。具体到本例中,可以这样写:
title = extract_fields(r'<td style="color:#458c3f; font-size:14px; font-weight:bold; padding-top:15px; padding-bottom:8px;" align="center">(.*?)</td>g<1>', datas, re.S) # 匹配标题
其中,g表示引用第一个括号内的匹配结果,即第一个
以上就是如何用正则表达式匹配重复标签的第二个内容?的详细内容,更多请关注其它相关文章!