如何利用正则表达式反选引号外文本,获取给定字符串中带有引号的内容之外的文本?
正则表达式反选引号外文本
问题:
如何利用正则表达式反选给定字符串中带有引号的内容之外的文本,得到以下结果?
['1', '2', '5', '6', '9', '0']
答案:
方法 1:删除带有引号的文本,再以逗号分割
先使用正则表达式将带有引号的文本删除,然后用逗号分割字符串:
a = '"3,4",1,2,"3,4","3,4",5,6,"7,8",9,0,"3,4"' result = re.sub('(?:".*?",?|,".*?")', '', a).split(',') print(result)
方法 2:匹配不包含逗号和引号的文本
使用正则表达式匹配以逗号分割的文本,但排除包含逗号和引号的文本:
result = re.findall('(?<p><strong>方法 3:匹配引号之外的文本,再过滤掉未带引号的文本</strong></p><p>先使用正则表达式匹配包含引号的文本和不包含引号的文本,然后过滤掉未带引号的文本:</p>result = [m[1] for m in re.finditer('(?:".*?"|(.*?))(?:,|$)', a) if m[1]] print(result)
以上就是如何利用正则表达式反选引号外文本,获取给定字符串中带有引号的内容之外的文本?的详细内容,更多请关注其它相关文章!