如何利用正则表达式反选引号外文本,获取给定字符串中带有引号的内容之外的文本?

如何利用正则表达式反选引号外文本,获取给定字符串中带有引号的内容之外的文本?

正则表达式反选引号外文本

问题:

如何利用正则表达式反选给定字符串中带有引号的内容之外的文本,得到以下结果?

['1', '2', '5', '6', '9', '0']

答案:

方法 1:删除带有引号的文本,再以逗号分割

先使用正则表达式将带有引号的文本删除,然后用逗号分割字符串:

a = '"3,4",1,2,"3,4","3,4",5,6,"7,8",9,0,"3,4"'
result = re.sub('(?:".*?",?|,".*?")', '', a).split(',')
print(result)

方法 2:匹配不包含逗号和引号的文本

使用正则表达式匹配以逗号分割的文本,但排除包含逗号和引号的文本:

result = re.findall('(?<p><strong>方法 3:匹配引号之外的文本,再过滤掉未带引号的文本</strong></p><p>先使用正则表达式匹配包含引号的文本和不包含引号的文本,然后过滤掉未带引号的文本:</p>
result = [m[1] for m in re.finditer('(?:".*?"|(.*?))(?:,|$)', a) if m[1]]
print(result)

以上就是如何利用正则表达式反选引号外文本,获取给定字符串中带有引号的内容之外的文本?的详细内容,更多请关注www.sxiaw.com其它相关文章!