è¿ä»£ DataFrame è¡çææææ¹æ³æ¯ä»ä¹ï¼

å¦ä½å¨è¿ä»£æ¶ä¿®æ¹ DataFrame å¼ï¼

æ¨å¯ä»¥ä½¿ç¨ loc æè iloc å¨å¾ªç¯ä¸ç´æ¥ä¿®æ¹ DataFrame å¼ã

æä»ä¹åºå« iterrows() å itertuples()ï¼

æå¯ä»¥å¯¹ DataFrame è¡ä½¿ç¨åè¡¨æ¨å¯¼å¼åï¼

æ¯çï¼åè¡¨æ¨å¯¼å¼å¯ç¨äºæ´ç´§åãæ´é«æçæ°æ®è½¬æ¢ã

å¦ä½å¨è¿ä»£ä¹åè¿æ»¤è¡ï¼

ä½¿ç¨ query() æ¹æ³æå¸å°ç´¢å¼æ¥æ ¹æ®æ¡ä»¶è¿æ»¤è¡ã

æ¯å¦å¯ä»¥ä»è¿ä»£ç¹å®åï¼

å¦ä½å°å½æ°åºç¨äºæ¯ä¸è¡ï¼

ä½¿ç¨ apply() è½´åæ°è®¾ç½®ä¸º 1 çæ¹æ³ã

ä½¿ç¨å¯¹æ§è½æä½å½±å iterrows()ï¼

在 Python 中迭代 Pandas DataFrame 中的行

Louis Robert

2024年6月21日星期五下午10:01:14

了解 Pandas 中的行迭代

在 Python 中处理数据时，Pandas 库提供了强大的数据操作和分析工具。一项常见任务是迭代 DataFrame 的行以按列名称访问和处理各个元素。本指南将帮助您了解如何轻松完成此任务。

我们将探索 Pandas DataFrame 中行迭代的不同方法，包括实际示例和解释。最后，您将清楚地了解如何在自己的项目中有效地利用这些方法。

命令	描述
iterrows()	生成一个迭代器，生成 DataFrame 中每行的索引和行数据。
itertuples()	返回一个迭代器，生成 DataFrame 行的命名元组，从而提供更快的行迭代。
apply()	沿 DataFrame 的指定轴（行或列）应用函数。
axis	apply() 函数中的一个参数，用于指定轴，0 表示列，1 表示行。
enumerate()	向可迭代对象添加一个计数器，对于迭代时获取索引很有用。
f-string	Python 中的格式化语法，用于使用大括号 {} 将表达式嵌入到字符串文字中。

用 Pandas 迭代行：方法解释

提供的脚本演示了迭代 Pandas DataFrame 中的行的不同方法。第一种方法使用 iterrows() 函数，它生成一个迭代器，生成每行的索引和行数据。此方法允许您通过列名称访问行元素，从而可以轻松打印或操作特定值。第二种方法，使用 itertuples()，类似，但通过为每行返回命名元组来提供更好的性能。这种方法速度更快，因为它避免了为每行生成 Series 对象的开销，这对于大型数据集特别有利。

所示的另一种方法是 apply() 函数，它沿 DataFrame 的给定轴应用指定的函数。通过将 axis 参数设置为 1，该函数将应用于每一行。此方法用途广泛，允许您为逐行操作定义自定义函数。最后，使用 enumerate() 和 iterrows() 提供了一种在迭代期间跟踪行索引的方法。这对于需要行号的任务或者对于 DataFrame 中的位置很重要的更复杂的操作非常有用。这些方法共同提供了一系列用于迭代 DataFrame 行的选项，以满足基于性能和功能的不同需求。

使用 iterrows() 迭代 Pandas DataFrame 中的行

Python 与 Pandas 库

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using iterrows()
for index, row in df.iterrows():
    print(row['c1'], row['c2'])

# Output:
# 10 100
# 11 110
# 12 120

使用 itertuples() 迭代以获得更好的性能

Python 与 Pandas 库

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using itertuples()
for row in df.itertuples():
    print(row.c1, row.c2)

# Output:
# 10 100
# 11 110
# 12 120

使用 DataFrame apply() 方法访问行

Python 与 Pandas 库

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Define a function to apply to each row
def print_row(row):
    print(row['c1'], row['c2'])

# Apply the function to each row
df.apply(print_row, axis=1)

# Output:
# 10 100
# 11 110
# 12 120

使用 DataFrame.iterrows() 和枚举

Python 与 Pandas 库

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using iterrows() and enumerate()
for i, (index, row) in enumerate(df.iterrows()):
    print(f'Index: {index}, Row {i}: {row["c1"]}, {row["c2"]}')

# Output:
# Index: 0, Row 0: 10, 100
# Index: 1, Row 1: 11, 110
# Index: 2, Row 2: 12, 120

探索 Pandas 中行迭代的其他方法

除了常用的方法之外，例如 iterrows() 和 itertuples()，还有其他技术可用于迭代 Pandas 中的 DataFrame 行。其中一种方法是使用 iloc 索引器。这 iloc 索引器允许您通过基于整数位置的索引来访问行和列，使其成为强大的迭代工具。当您需要对特定行或列执行操作而不将它们转换为 Series 或命名元组时，此方法特别有用。通过结合使用循环 iloc，您可以有效地访问和操作行元素。

另一种方法涉及使用 DataFrame.query() 方法在迭代之前根据特定条件过滤行。此方法允许使用类似 SQL 的查询语法进行简洁且可读的数据过滤。过滤 DataFrame 后，您可以使用前面讨论的任何迭代方法来处理过滤后的行。此外，Python 中的列表推导式可以与 Pandas 操作相结合，以实现更复杂的数据转换和迭代。这些先进技术提供了更大的灵活性和效率，特别是在处理大型数据集或复杂的数据操作任务时。

有关在 Pandas 中迭代行的常见问题

迭代 DataFrame 行的最有效方法是什么？
这 itertuples() 方法通常对于迭代行最有效，因为它避免了为每行创建 Series 对象的开销。
如何在迭代时修改 DataFrame 值？
您可以使用 loc 或者 iloc 在循环中直接修改 DataFrame 值。
有什么区别 iterrows() 和 itertuples()？
iterrows() 将每一行作为一个系列返回，而 itertuples() 将每一行作为命名元组返回，这样速度更快，内存效率更高。
我可以对 DataFrame 行使用列表推导式吗？
是的，列表推导式可用于更紧凑、更高效的数据转换。
如何在迭代之前过滤行？
使用 query() 方法或布尔索引来根据条件过滤行。
是否可以仅迭代特定列？
是的，您可以通过使用以下方式访问特定列来迭代它们 19 号 在你的循环内。
如何将函数应用于每一行？
使用 apply() 轴参数设置为 1 的方法。
使用对性能有何影响 iterrows()？
iterrows() 相比之下较慢 itertuples() 当需要 Series 对象的可读性而不是性能时应该使用。

关于 DataFrame 行迭代的最终想法

掌握在 Pandas DataFrame 中迭代行的不同方法可以提高数据操作任务的灵活性和效率。无论你选择 iterrows() 为了可读性， itertuples() 为了性能，或者 apply() 自定义函数的方法，了解这些技术将增强您有效处理大型数据集的能力。尝试这些方法以确定哪种方法最适合您的特定要求和工作流程。