Mengganti Nama Kolom di Pandas DataFrame

Mengganti Nama Kolom di Pandas DataFrame
Mengganti Nama Kolom di Pandas DataFrame

Pengantar Penggantian Nama Kolom di Pandas

Saat bekerja dengan data di Pandas, sering kali kolom DataFrame perlu diganti namanya agar lebih bermakna dan lebih mudah digunakan. Hal ini dapat membantu membuat tugas pemrosesan dan analisis data menjadi lebih intuitif dan efisien.

Pada artikel ini, kita akan mempelajari cara mengubah label kolom Pandas DataFrame dari ['$a', '$b', '$c', '$d', '$e'] menjadi ['a', 'b', 'c', 'd', 'e']. Tugas sederhana namun penting ini merupakan persyaratan umum dalam manipulasi data dan pembersihan alur kerja.

Memerintah Keterangan
pd.DataFrame() Membuat objek DataFrame, yang merupakan struktur data tabular dua dimensi, dapat diubah ukurannya, dan berpotensi heterogen dengan sumbu berlabel.
df.columns Mengakses label kolom DataFrame. Dapat digunakan untuk mendapatkan atau mengatur nama kolom.
df.rename() Memungkinkan Anda mengubah nama kolom DataFrame dengan menyediakan pemetaan nama lama ke nama baru.
dict(zip()) Membuat kamus dengan menggabungkan dua daftar, digunakan di sini untuk memetakan nama kolom asli ke nama kolom baru.
inplace=True Argumen dalam metode ganti nama yang mengubah DataFrame di tempatnya, tanpa mengembalikan DataFrame baru.
print(df) Menampilkan DataFrame ke konsol, memungkinkan Anda melihat nama kolom yang diperbarui.

Penjelasan Detail Naskah

Skrip yang disediakan di atas menunjukkan cara mengganti nama kolom di Pandas DataFrame, tugas umum dalam manipulasi data. Pada skrip pertama, kita mulai dengan mengimpor perpustakaan Pandas dengan import pandas as pd. Selanjutnya, kita membuat DataFrame menggunakan pd.DataFrame() dengan kolom berlabel sebagai '$a', '$b', '$c', '$d', Dan '$e'. Untuk mengganti nama kolom ini, kami langsung menyetel DataFrame columns atribut ke nama kolom baru ['a', 'b', 'c', 'd', 'e']. Terakhir, kami menampilkan DataFrame yang diperbarui menggunakan print(df), yang memperlihatkan nama kolom baru. Metode ini mudah dan efisien untuk mengganti nama kolom ketika Anda memiliki pemetaan yang jelas dan langsung dari nama lama ke nama baru.

Di skrip kedua, kami juga mengimpor perpustakaan Pandas dan menentukan dua daftar: original_columns Dan new_columns, yang masing-masing berisi nama kolom asli dan baru. Kami kemudian membuat DataFrame menggunakan pd.DataFrame() dengan data dan nama kolom asli. Untuk mengganti nama kolom, kami menggunakan rename() metode DataFrame. Metode ini mengambil kamus yang memetakan nama kolom lama ke nama kolom baru, yang dibuat menggunakan dict(zip(original_columns, new_columns)). Itu inplace=True argumen memastikan bahwa DataFrame diubah pada tempatnya tanpa mengembalikan DataFrame baru. Langkah terakhir adalah menampilkan DataFrame yang telah diupdate dengan print(df). Metode ini sangat berguna ketika Anda perlu mengganti nama kolom secara terprogram atau ketika berhadapan dengan DataFrames yang lebih besar dimana penugasan langsung mungkin kurang praktis.

Mengubah Nama Kolom di Pandas DataFrame

Menggunakan Python dengan Panda

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

Memperbarui Label Kolom DataFrame di Pandas

Skrip Python Memanfaatkan Perpustakaan Pandas

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

Teknik Tingkat Lanjut untuk Mengganti Nama Kolom DataFrame

Selain penggantian nama kolom dasar di Pandas DataFrame, ada teknik lanjutan yang bisa sangat berguna dalam berbagai skenario. Misalnya, terkadang Anda mungkin perlu mengganti nama kolom berdasarkan pola atau kondisi tertentu. Dalam kasus seperti itu, Anda dapat menggunakan pemahaman daftar atau map() fungsi dikombinasikan dengan fungsi lambda untuk mencapai hasil yang diinginkan. Pendekatan ini memungkinkan penggantian nama kolom yang lebih dinamis dan fleksibel. Misalnya, Anda dapat menghapus karakter tertentu dari nama kolom atau menerapkan transformasi seperti mengonversi semua nama menjadi huruf kecil.

Teknik lanjutan lainnya melibatkan penggantian nama kolom selama proses impor data. Saat memuat data dari file CSV, Anda dapat menggunakan names parameter di pd.read_csv() untuk menentukan nama kolom baru. Hal ini sangat berguna ketika menangani data yang memiliki header yang tidak konsisten atau hilang. Selain itu, Anda dapat menggunakan header parameter untuk melewati header yang ada dan menetapkan header Anda sendiri. Metode ini menyederhanakan proses pembersihan data dengan mengatasi masalah penamaan kolom langsung dari tahap pemuatan data, sehingga manipulasi data selanjutnya menjadi lebih efisien.

Pertanyaan dan Jawaban Umum tentang Mengganti Nama Kolom DataFrame

  1. Bagaimana cara mengganti nama satu kolom di DataFrame?
  2. Menggunakan rename() metode dengan kamus yang menentukan nama kolom lama dan baru.
  3. Bisakah saya mengganti nama kolom saat membaca file CSV?
  4. Ya, gunakan names parameter di pd.read_csv() untuk mengatur nama kolom baru.
  5. Bagaimana cara menghapus karakter tertentu dari semua nama kolom?
  6. Gunakan pemahaman daftar atau map() berfungsi dengan lambda untuk mengubah nama kolom.
  7. Apakah mungkin mengganti nama kolom berdasarkan posisinya?
  8. Ya, Anda dapat menggunakan DataFrame columns atribut dengan mengindeks dan menetapkan nama baru.
  9. Bagaimana jika saya perlu mengganti nama kolom secara dinamis berdasarkan kondisi?
  10. Gunakan logika kondisional dalam pemahaman daftar atau fungsi lambda untuk mengatur nama kolom.
  11. Bagaimana saya bisa memastikan perubahan saya diterapkan pada DataFrame asli?
  12. Menggunakan inplace=True parameter dengan rename() metode.
  13. Bisakah saya mengganti nama kolom untuk menghilangkan spasi?
  14. Ya, gunakan pemahaman daftar untuk menghapus spasi dari nama kolom.
  15. Bagaimana cara memeriksa nama kolom saat ini di DataFrame?
  16. Akses columns atribut DataFrame untuk melihat nama kolom.
  17. Bisakah saya mengganti nama kolom setelah memfilter DataFrame?
  18. Ya, penggantian nama kolom dapat dilakukan pada tahap apa pun, termasuk setelah pemfilteran.
  19. Bagaimana cara mengganti nama kolom di DataFrame multi-indeks?
  20. Menggunakan rename() metode dengan kamus yang menentukan level dan nama untuk kolom multi-indeks.

Pemikiran Akhir tentang Penggantian Nama Kolom

Mengganti nama kolom di Pandas DataFrame adalah langkah penting dalam prapemrosesan data, yang membantu kejelasan dan aksesibilitas kumpulan data. Baik menggunakan penugasan langsung atau metode rename(), kedua pendekatan ini menawarkan solusi fleksibel yang disesuaikan dengan skenario berbeda. Dengan menguasai teknik ini, manipulasi data menjadi lebih intuitif, memfasilitasi analisis data yang lebih baik dan kode yang lebih bersih. Metode tingkat lanjut semakin menyederhanakan proses, menjadikannya keterampilan penting bagi ilmuwan atau analis data mana pun.