如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?
精准匹配脚本标签中间内容的正则表达式
给定这样的 php 文件:
<script src="static/js/jsencrypt.js?v=web_version"></script><script src="static/js/jquery.form.js?v=web_version"></script><script type="text/javascript"> var a = 1; var b = 2; </script>
我们希望通过正则表达式捕获到第三个 script 标签中间的内容:
var a = 1; var b = 2;
优化后的正则表达式
对于这种情况下,我们遇到一个困难:脚本标签属性中可能包含引号,导致匹配不正确。为了解决这个问题,我们使用一个优化过的正则表达式:
/(<script>]+|"[^"]*")*>)([\s\S]*?)(<\/script>)/g</script>
正则表达式详解
- (
]+|"[^"]*")*>): 与 - ([^"]+|"[^"]*"): 允许引号内的属性值,[^"]+ 表示没有引号的属性,"[^"]*" 表示引号内的属性。
- ([ss]*?): 捕获脚本标签中间的内容。[ss] 匹配任何字符,包括换行符和空格,*? 表示非贪婪匹配,得到最短匹配。
- (): 与 标签的结束部分匹配。
以上就是如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?的详细内容,更多请关注其它相关文章!