怎么使用Python Pandas更新行和列

1. 创建 Pandas 数据集

为了创建数据框,pandas 提供了函数名称 pd.DataFrame,它可以帮助您从一些数据中创建数据框。 让我们看看它是如何工作的。

#创建一个字典

import pandas as pd

fruit_data = {"Fruit": ['Apple','Avacado','Banana','Strawberry','Grape'],"Color": ['Red','Green','Yellow','Pink','Green'],
"Price": [45, 90, 60, 37, 49]
}

fruit_data

在这里,我们建立了一个 Python 的字典,它包括一些数据项。 现在,我们被要求将这本字典变成Pandas数据集。

#Dataframe 

data = pd.DataFrame(fruit_data)
data

那很完美!使用 pandaspd.DataFrame 函数,我们可以轻松地将字典转换为 pandas 数据集。 我们的数据集现在已准备好执行未来的操作。

更新列

有时,要素的列或名称会不一致。 它可以是字母表的大小写等等。 拥有统一的设计有助于我们有效地使用这些功能。

因此,作为第一步,我们将了解如何更新/更改数据中的列或特征名称。

#update the column name

data.rename(columns = {'Fruit':'Fruit Name'})

如上图所示简单。 大家甚至可以一次更新多个列名。 为此,我们必须在大括号下添加以逗号分隔的其他列名。

#multile column update

data.rename(columns = {'Fruit':'Fruit Name','Colour':'Color','Price':'Cost'})

就像这样,我们可以同时更新所有列。

更新列名的大小写

在处理具有许多列的数据集时,我们可能会遇到列名不一致的情况。

在我们的数据中,大家可以观察到所有列名的首字母大写。 始终建议为所有列名使用通用大小写。

好吧,我们可以将它们转换为大写或小写。

#lower case

data.columns.str.lower()
data

现在,我们所有的列名都是小写的。

更新行

和更新列一样,更新行也很简单。 我们必须先找到行值,然后才能使用新值更新该行。

我们可以使用 pandas loc 函数来定位行。

#updating rows

data.loc[3]
Fruit    Strawberry
Color          Pink
Price            37
Name: 3, dtype: object

我们找到了第 3 行,其中包含水果草莓的详细信息。我们需要更新这一行,提供一个新的水果名称为Pineapple以及它的详细信息。

#update

data.loc[3] = ['PineApple','Yellow','48']
data

我希望大家也发现更新数据中行的值很容易。 现在,假设我们只需要更新行中的一些细节,而不是整个细节。 那么,您对此有何看法?

#更新特定值

data.loc[3, ['Price']]
Price    48
Name: 3, dtype: object

我们只需要更新位于第 3 行的水果的价格。 我们知道该水果的当前价格是 48。但是,我们必须将其更新为 65。让我们这样做。

#updating 

data.loc[3, ['Price']] = [65]
data

我们只用一行 python 代码将水果菠萝的价格更新为 65。 这就是它的工作原理。 简单的。

根据条件更新行和列

是的,我们现在将根据特定条件更新行值。 最后,我们想要一些有意义的值,这些值应该有助于我们的分析。

让我们定义我们的条件。

#Condition

updated = data['Price'] > 60
updated

我们在这里要做的是,将价格高于 60 的水果的价格更新为昂贵。

0    False
1     True
2    False
3     True
4    False
Name: Price, dtype: bool

根据输出,我们有 2 个价格超过 60 的水果。让我们在数据中将这些水果列为昂贵的。

#Updating

data.loc[updated, 'Price'] = 'Expensive'
data

以上就是怎么使用Python Pandas更新行和列的详细内容,更多请关注其它相关文章!