如何用Python统计分类列数据在不同日期的出现次数?
如何统计转换列转数据
想要将转换后的列转换为统计数字,可以使用以下步骤:
1. 虚拟化转换列
使用 pd.get_dummies() 函数将转换列转换为虚拟列,每个类别创建一个布尔列,其中 1 表示存在,0 表示不存在:
df_dummies = pd.get_dummies(df, columns=['type'])
2. 分组和求和
使用 df.groupby() 根据日期对虚拟列进行分组,然后使用 sum() 求出每个日期每个类别出现的次数:
df_group = df_dummies.groupby("date").sum()
3. 输出结果
现在,df_group 将包含按日期统计的每个类别的数量:
print(df_dummies) print("-". * 60) print(df_group)
输出结果如下:
date type_1 type_2 type_3 type_4 type_5 0 2024-01-01 1 0 0 0 0 1 2024-01-01 0 1 0 0 0 2 2024-01-01 1 0 0 0 0 3 2024-01-02 0 0 1 0 0 4 2024-01-02 0 1 0 0 0 5 2024-01-02 0 0 1 0 0 6 2024-01-02 1 0 0 0 0 7 2024-01-02 1 0 0 0 0 8 2024-01-03 1 0 0 1 0 9 2024-01-03 0 0 0 1 0 10 2024-01-03 0 1 0 0 0 11 2024-01-03 0 0 0 0 1 ------------------------------------------------------------ type_1 type_2 type_3 type_4 type_5 date 2024-01-01 2 1 0 0 0 2024-01-02 2 1 2 0 0 2024-01-03 1 1 1 1 1
以上就是如何用Python统计分类列数据在不同日期的出现次数?的详细内容,更多请关注硕下网其它相关文章!