如何解析字符串层级结构问题:如何区分字符串中不同层级的分隔符?
如何解析字符串层级结构
问题:
如何区分字符串中不同层级的分隔符,以便按层级正确解析字符串?
回答:
确定分隔符层级
str = 'a [ b { c | d } | e ]'
- 第一个竖线 (|) 分隔 c 和 d;
- 第二个竖线 (|) 分隔 b 和 e。
为了让程序识别层级,可以使用以下方法:
# 定义字典,存放分隔符位置和层次 c = {} # 循环遍历字符串 n = 0 find = 1 while n < len(str): # 进入较高层级 if str[n] in ("[", "{"): find += 1 # 退出较低层级 if str[n] in ("]", "}"): find -= 1 # 记录当前分隔符的位置和层次 if str[n] == "|": c.setdefault(find, [n]) if n in c[find]: c[find].append(n) n += 1
输出结果:
{ 1: [1], 2: [4, 11], 3: [7, 8] }
- 键值表示层级。
- 值表示该层级中分隔符的位置。
解析字符串层级
了解分隔符层级后,即可逐层解析字符串:
# 初始化存储结果的列表 result = [str] # 逐层解析 for level in sorted(c.keys(), reverse=true): temp = [] for pos in c[level]: temp.extend(result.pop().split(str[pos])) result.append(temp)
输出结果:
['A', 'B { C | D } | E'] ['A', ['B { C | D }', 'E']] ['A', ['B', '[ C | D ]', 'E']] ['A', ['B', ['C', 'D'], 'E']]