Pandas 如何实现 COUNTIF 函数统计每行大于指标值的列数?
在 pandas 中如何实现 countif 函数?
您想要统计每行中比指定指标值大的列的个数。此问题可以轻松使用 excel 中的 countif 函数解决。但是,在 pandas 中,您可能会遇到像您描述的困难。
问题
您的代码如下:
np.where(data[data.columns[1:]] > data['指标']).count(1) (data[data.columns[1:]] > data['指标']).sum()
但这些代码返回 0 的结果。这是因为:
- np.where 返回一个布尔掩码,而不是实际计数。
- sum() 仅计算布尔掩码中的 true 的数量,该数量始终为 0 或 1。
解决方案
要实现 countif 函数,您可以使用 apply() 方法逐行应用 lambda 函数。代码如下:
data['countif'] = data.apply(lambda x : sum(data['X1':'X4'] > data['指标']),axis =1)
- lambda x : sum(data['x1':'x4'] > data['指标']) 定义了一个 lambda 函数,该函数获取一行数据 x 并计算大于指标值的元素数量。
- apply() 逐行应用 lambda 函数,并将结果存储在名为 'countif' 的新列中。
现在,data['countif'] 列包含每行中大于指标值的列的个数。
以上就是Pandas 如何实现 COUNTIF 函数统计每行大于指标值的列数?的详细内容,更多请关注www.sxiaw.com其它相关文章!