如何使用正则表达式解析HTML文本中的href地址?

如何使用正则表达式解析HTML文本中的href地址?

使用正则表达式解析html文本中的href地址

在解析HTML文本时,获取特定元素的href地址是常见需求。正则表达式可以实现匹配目标内容,但容易误配。建议使用HTML解析器,安全可靠。浏览器端可选择利用document.createElement + innerHTML、DOMParser或jQuery等工具。

以jQuery为例,解析示例HTML文本的href地址实现如下:

$(html).find('>li>a').map((_, a) => $(a).attr('href')) // jq
[...$(html).find('>li>a')].map(a => $(a).attr('href')) // Array
// jq 转 Array 可用 [...jq], jq.toArray(), Array.from(jq, mapfn)
// 如需完整 URL, $(a).attr('href') 改为 a.href

结果:

[
    "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=3",
    "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=4",
    "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=6",
    "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=9",
    "/eduadmin/DevelopActivity/SystemActivityManage/2/-1"
]

以上就是如何使用正则表达式解析HTML文本中的href地址?的详细内容,更多请关注其它相关文章!