不依赖Pandas,如何快速分组二维列表?

不依赖pandas,如何快速分组二维列表?

二维列表如何快速分组,不依赖 pandas

在不使用 pandas 的情况下,快速对二维列表进行分组是一个常见问题。现在让我们探讨一种有效的方法:

为了按照组名对列表进行分组并保持顺序,我们可以使用自定义函数:

def group_name_fun(lst):
    last = ''
    arr = []
    for ii in range(len(lst)):
        if not lst[ii][0] == last:
            arr.append(ii)
            last = lst[ii][0]
    arr.append(len(lst))
    lst = [lst[arr[ii - 1]:arr[ii]] for ii in range(1, len(arr))]
    return lst

对于大数组,出于效率考虑,建议采用另一种方法:

import itertools

def group_large_array(data):
    grouped_data = {}
    for key, group in itertools.groupby(data, lambda x: x[0]):
        grouped_data[key] = [item[1] for item in group]

    # 转换为列表形式
    result = [grouped_data[key] for key in grouped_data]
    return result

该方法使用 itertools.groupby 依次对数据进行分组,并通过列表推导式将每组提取出来,从而有效地减少了内存占用并提高了效率。

以上就是不依赖Pandas,如何快速分组二维列表?的详细内容,更多请关注硕下网其它相关文章!