如何用Python统计分类列数据在不同日期的出现次数?

如何用python统计分类列数据在不同日期的出现次数?

如何统计转换列转数据

想要将转换后的列转换为统计数字,可以使用以下步骤:

1. 虚拟化转换列

使用 pd.get_dummies() 函数将转换列转换为虚拟列,每个类别创建一个布尔列,其中 1 表示存在,0 表示不存在:

df_dummies = pd.get_dummies(df, columns=['type'])

2. 分组和求和

使用 df.groupby() 根据日期对虚拟列进行分组,然后使用 sum() 求出每个日期每个类别出现的次数:

df_group = df_dummies.groupby("date").sum()

3. 输出结果

现在,df_group 将包含按日期统计的每个类别的数量:

print(df_dummies)
print("-". * 60)
print(df_group)

输出结果如下:

          date  type_1  type_2  type_3  type_4  type_5
0   2024-01-01       1       0       0       0       0
1   2024-01-01       0       1       0       0       0
2   2024-01-01       1       0       0       0       0
3   2024-01-02       0       0       1       0       0
4   2024-01-02       0       1       0       0       0
5   2024-01-02       0       0       1       0       0
6   2024-01-02       1       0       0       0       0
7   2024-01-02       1       0       0       0       0
8   2024-01-03       1       0       0       1       0
9   2024-01-03       0       0       0       1       0
10  2024-01-03       0       1       0       0       0
11  2024-01-03       0       0       0       0       1
------------------------------------------------------------
type_1  type_2  type_3  type_4  type_5          
date                                                        
2024-01-01       2       1       0       0       0          
2024-01-02       2       1       2       0       0          
2024-01-03       1       1       1       1       1

以上就是如何用Python统计分类列数据在不同日期的出现次数?的详细内容,更多请关注硕下网其它相关文章!