如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?

如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?

精准匹配脚本标签中间内容的正则表达式

给定这样的 php 文件:

<script src="static/js/jsencrypt.js?v=web_version"></script><script src="static/js/jquery.form.js?v=web_version"></script><script type="text/javascript">
    var a = 1;
    var b = 2;
</script>

我们希望通过正则表达式捕获到第三个 script 标签中间的内容:

    var a = 1;
    var b = 2;

优化后的正则表达式

对于这种情况下,我们遇到一个困难:脚本标签属性中可能包含引号,导致匹配不正确。为了解决这个问题,我们使用一个优化过的正则表达式:

/(<script>]+|"[^"]*")*>)([\s\S]*?)(<\/script>)/g</script>

正则表达式详解

  • (]+|"[^"]*")*>): 与
  • ([^"]+|"[^"]*"): 允许引号内的属性值,[^"]+ 表示没有引号的属性,"[^"]*" 表示引号内的属性。
  • ([ss]*?): 捕获脚本标签中间的内容。[ss] 匹配任何字符,包括换行符和空格,*? 表示非贪婪匹配,得到最短匹配。
  • (): 与 标签的结束部分匹配。

以上就是如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?的详细内容,更多请关注其它相关文章!