如何使用正则表达式提取 URL 中斜杠之间的值?

如何使用正则表达式提取 url 中斜杠之间的值?

用正则提取 url 中斜杠之间的值

javascript 中,使用正则表达式提取 url 中斜杠之间的值需要考虑以下步骤:

1. 验证 url 符合模式

首先,需要判断给定的 url 是否符合定义的模式。可以根据模式中的占位符,编写正则表达式。例如,如果模式为 {note}/:pakid:/corrinsdetail/...,则正则表达式可以编写为:

const urlregex = new regexp(pattern.replace(/({|:)[w-]+(}|:)/g, "[\w-]+").replace(///g, "/"));

2. 清除 url 中的干扰项

在某些情况下,url 可能包含其他字符,例如参数 (?zz=23423) 或片段 (#abc),这会导致正则表达式匹配失败。因此,需要预处理 url,将其中的这些干扰项删除。

3. 提取斜杠之间的值

经过验证和清理之后,可以使用正则表达式匹配 url,并提取斜杠之间的值。例如,使用 exec() 函数:

const values = url.replace(/(?|#).*/, "").split("/");

const result = {};
keys.foreach((v, i) => {
  if (/({|:)w+(}|:)/.test(v)) {
    result[v.replace(/({|:|})/g, "")] = values[i];
  }
});

完整代码示例

function extractInfo(pattern, url) {
  const urlRegex = new RegExp(pattern.replace(/({|:)[w-]+(}|:)/g, "[\w-]+").replace(///g, "/"));
  if (!urlRegex.test(url)) {
    throw new Error("输入的 Url 不符合 Pattern");
  }
  const keys = pattern.split("/");
  const values = url.replace(/(?|#).*/, "").split("/");
  const result = {};
  keys.forEach((v, i) => {
    if (/({|:)w+(}|:)/.test(v)) {
      result[v.replace(/({|:|})/g, "")] = values[i];
    }
  });
  return result;
}

使用此函数,可以对给定的 url 进行匹配,并提取斜杠之间的值。

以上就是如何使用正则表达式提取 URL 中斜杠之间的值?的详细内容,更多请关注硕下网其它相关文章!