Pandas DataFrame에서 열 이름 바꾸기

Pandas DataFrame에서 열 이름 바꾸기
Pandas DataFrame에서 열 이름 바꾸기

Pandas의 열 이름 바꾸기 소개

Pandas에서 데이터를 작업할 때 DataFrame의 열 이름을 더 의미 있고 작업하기 쉽게 변경해야 하는 경우가 종종 있습니다. 이는 데이터 처리 및 분석 작업을 보다 직관적이고 효율적으로 만드는 데 도움이 될 수 있습니다.

이 기사에서는 Pandas DataFrame의 열 레이블을 ['$a', '$b', '$c', '$d', '$e']에서 ['a', 'b', 'c', 'd', 'e']. 이 간단하면서도 필수적인 작업은 데이터 조작 및 정리 작업 흐름의 일반적인 요구 사항입니다.

명령 설명
pd.DataFrame() 2차원이고 크기 변경이 가능하며 레이블이 지정된 축이 있는 이질적인 테이블 형식 데이터 구조인 DataFrame 개체를 만듭니다.
df.columns DataFrame의 열 레이블에 액세스합니다. 열 이름을 가져오거나 설정하는 데 사용할 수 있습니다.
df.rename() 이전 이름을 새 이름으로 매핑하여 DataFrame의 열 이름을 변경할 수 있습니다.
dict(zip()) 여기에서 원래 열 이름을 새 열 이름에 매핑하는 데 사용되는 두 목록을 함께 압축하여 사전을 만듭니다.
inplace=True 새 DataFrame을 반환하지 않고 DataFrame을 수정하는 rename 메서드의 인수입니다.
print(df) DataFrame을 콘솔에 표시하여 업데이트된 열 이름을 볼 수 있습니다.

스크립트에 대한 자세한 설명

위에 제공된 스크립트는 데이터 조작의 일반적인 작업인 Pandas DataFrame의 열 이름을 바꾸는 방법을 보여줍니다. 첫 번째 스크립트에서는 다음을 사용하여 Pandas 라이브러리를 가져오는 것으로 시작합니다. import pandas as pd. 다음으로 다음을 사용하여 DataFrame을 만듭니다. pd.DataFrame() 다음과 같이 라벨이 지정된 열이 있습니다. '$a', , '$c', '$d', 그리고 '$e'. 이 열의 이름을 바꾸려면 DataFrame의 columns 새 열 이름에 대한 속성 ['a', 'b', 'c', 'd', 'e']. 마지막으로 다음을 사용하여 업데이트된 DataFrame을 표시합니다. print(df), 새 열 이름을 표시합니다. 이 방법은 이전 이름을 새 이름에 명확하고 직접적으로 매핑한 경우 열 이름을 바꾸는 데 간단하고 효율적입니다.

두 번째 스크립트에서는 Pandas 라이브러리도 가져오고 두 개의 목록을 정의합니다. original_columns 그리고 new_columns, 각각 원래 열 이름과 새 열 이름을 보유합니다. 그런 다음 다음을 사용하여 DataFrame을 만듭니다. pd.DataFrame() 데이터와 원래 열 이름을 사용합니다. 열 이름을 바꾸려면 다음을 사용합니다. rename() DataFrame의 메서드입니다. 이 방법은 다음을 사용하여 생성된 이전 열 이름을 새 열 이름으로 매핑하는 사전을 사용합니다. dict(zip(original_columns, new_columns)). 그만큼 inplace=True 인수는 새 DataFrame을 반환하지 않고 DataFrame이 제자리에서 수정되도록 보장합니다. 마지막 단계는 업데이트된 DataFrame을 표시하는 것입니다. print(df). 이 방법은 프로그래밍 방식으로 열 이름을 바꿔야 하거나 직접 할당이 덜 실용적일 수 있는 대규모 DataFrame을 처리할 때 특히 유용합니다.

Pandas DataFrame에서 열 이름 변경

Pandas에서 Python 사용하기

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

Pandas에서 DataFrame 열 레이블 업데이트

Pandas 라이브러리를 활용한 Python 스크립트

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

DataFrame 열 이름 바꾸기를 위한 고급 기술

Pandas DataFrame의 기본 열 이름 변경 외에도 다양한 시나리오에서 매우 유용할 수 있는 고급 기술이 있습니다. 예를 들어 특정 패턴이나 조건에 따라 열 이름을 바꿔야 하는 경우가 있습니다. 그러한 경우에는 목록 이해 또는 map() 함수를 람다 함수와 결합하여 원하는 결과를 얻습니다. 이 접근 방식을 사용하면 보다 동적이고 유연한 열 이름 바꾸기가 가능합니다. 예를 들어 열 이름에서 특정 문자를 제거하거나 모든 이름을 소문자로 변환하는 등의 변환을 적용할 수 있습니다.

또 다른 고급 기술은 데이터 가져오기 프로세스 중에 열 이름을 바꾸는 것입니다. CSV 파일에서 데이터를 로드할 때 다음을 사용할 수 있습니다. names 매개변수 pd.read_csv() 새 열 이름을 지정합니다. 이는 헤더가 일관되지 않거나 누락된 데이터를 처리할 때 특히 유용할 수 있습니다. 또한 다음을 사용할 수 있습니다. header 매개변수를 사용하여 기존 헤더를 건너뛰고 자신만의 헤더를 할당하세요. 이러한 방법은 데이터 로드 단계에서 바로 열 이름 지정 문제를 해결하여 후속 데이터 조작을 더욱 효율적으로 만들어 데이터 정리 프로세스를 간소화합니다.

DataFrame 열 이름 바꾸기에 대한 일반적인 질문과 답변

  1. DataFrame에서 단일 열의 이름을 어떻게 바꿀 수 있나요?
  2. 사용 rename() 이전 열 이름과 새 열 이름을 지정하는 사전을 사용하는 메서드입니다.
  3. CSV 파일을 읽는 동안 열 이름을 바꿀 수 있나요?
  4. 예, 다음을 사용하세요. names 매개변수 pd.read_csv() 새 열 이름을 설정합니다.
  5. 모든 열 이름에서 특정 문자를 어떻게 제거합니까?
  6. 목록 이해 또는 map() 열 이름을 수정하려면 람다와 함수를 사용하세요.
  7. 위치에 따라 열 이름을 바꿀 수 있습니까?
  8. 예, DataFrame을 사용할 수 있습니다. columns 색인을 생성하고 새 이름을 할당하여 속성을 지정합니다.
  9. 조건에 따라 열 이름을 동적으로 바꿔야 하는 경우 어떻게 해야 합니까?
  10. 목록 이해 또는 람다 함수 내에서 조건부 논리를 사용하여 열 이름을 설정합니다.
  11. 변경 사항이 원본 DataFrame에 적용되었는지 어떻게 확인할 수 있나요?
  12. 사용 inplace=True 매개변수 rename() 방법.
  13. 공백을 제거하기 위해 열 이름을 바꿀 수 있나요?
  14. 예, 목록 이해를 사용하여 열 이름에서 공백을 제거합니다.
  15. DataFrame에서 현재 열 이름을 어떻게 확인합니까?
  16. 액세스 columns 열 이름을 보려면 DataFrame의 속성을 사용하세요.
  17. DataFrame을 필터링한 후 열 이름을 바꿀 수 있나요?
  18. 예, 필터링 이후를 포함하여 모든 단계에서 열 이름을 바꿀 수 있습니다.
  19. 다중 인덱스 DataFrame에서 열 이름을 어떻게 바꾸나요?
  20. 사용 rename() 다중 인덱스 열의 수준과 이름을 지정하는 사전을 사용하는 메서드입니다.

열 이름 변경에 대한 최종 생각

Pandas DataFrame에서 열 이름을 바꾸는 것은 데이터 전처리의 중요한 단계로, 데이터 세트의 명확성과 접근성을 높이는 데 도움이 됩니다. 직접 할당을 사용하든 rename() 메서드를 사용하든 두 접근 방식 모두 다양한 시나리오에 맞는 유연한 솔루션을 제공합니다. 이러한 기술을 익히면 데이터 조작이 더욱 직관적이 되어 더 나은 데이터 분석과 깔끔한 ​​코드가 가능해집니다. 고급 방법은 프로세스를 더욱 간소화하므로 모든 데이터 과학자 또는 분석가에게 필수적인 기술입니다.