如何使用正则表达式解析HTML文本中的href地址?
使用正则表达式解析html文本中的href地址
在解析HTML文本时,获取特定元素的href地址是常见需求。正则表达式可以实现匹配目标内容,但容易误配。建议使用HTML解析器,安全可靠。浏览器端可选择利用document.createElement + innerHTML、DOMParser或jQuery等工具。
以jQuery为例,解析示例HTML文本的href地址实现如下:
$(html).find('>li>a').map((_, a) => $(a).attr('href')) // jq [...$(html).find('>li>a')].map(a => $(a).attr('href')) // Array // jq 转 Array 可用 [...jq], jq.toArray(), Array.from(jq, mapfn) // 如需完整 URL, $(a).attr('href') 改为 a.href
结果:
[ "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=3", "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=4", "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=6", "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=9", "/eduadmin/DevelopActivity/SystemActivityManage/2/-1" ]
以上就是如何使用正则表达式解析HTML文本中的href地址?的详细内容,更多请关注其它相关文章!