Mengganti Nama Kolom di Pandas DataFrame

Python

Pengantar Penggantian Nama Kolom di Pandas

Saat bekerja dengan data di Pandas, sering kali kolom DataFrame perlu diganti namanya agar lebih bermakna dan lebih mudah digunakan. Hal ini dapat membantu membuat tugas pemrosesan dan analisis data menjadi lebih intuitif dan efisien.

Pada artikel ini, kita akan mempelajari cara mengubah label kolom Pandas DataFrame dari ['$a', '$b', '$c', '$d', '$e'] menjadi ['a', 'b', 'c', 'd', 'e']. Tugas sederhana namun penting ini merupakan persyaratan umum dalam manipulasi data dan pembersihan alur kerja.

Memerintah Keterangan
pd.DataFrame() Membuat objek DataFrame, yang merupakan struktur data tabular dua dimensi, dapat diubah ukurannya, dan berpotensi heterogen dengan sumbu berlabel.
df.columns Mengakses label kolom DataFrame. Dapat digunakan untuk mendapatkan atau mengatur nama kolom.
df.rename() Memungkinkan Anda mengubah nama kolom DataFrame dengan menyediakan pemetaan nama lama ke nama baru.
dict(zip()) Membuat kamus dengan menggabungkan dua daftar, digunakan di sini untuk memetakan nama kolom asli ke nama kolom baru.
inplace=True Argumen dalam metode ganti nama yang mengubah DataFrame di tempatnya, tanpa mengembalikan DataFrame baru.
print(df) Menampilkan DataFrame ke konsol, memungkinkan Anda melihat nama kolom yang diperbarui.

Penjelasan Detail Naskah

Skrip yang disediakan di atas menunjukkan cara mengganti nama kolom di Pandas DataFrame, tugas umum dalam manipulasi data. Pada skrip pertama, kita mulai dengan mengimpor perpustakaan Pandas dengan . Selanjutnya, kita membuat DataFrame menggunakan dengan kolom berlabel sebagai , '$b', , , Dan . Untuk mengganti nama kolom ini, kami langsung menyetel DataFrame columns atribut ke nama kolom baru . Terakhir, kami menampilkan DataFrame yang diperbarui menggunakan , yang memperlihatkan nama kolom baru. Metode ini mudah dan efisien untuk mengganti nama kolom ketika Anda memiliki pemetaan yang jelas dan langsung dari nama lama ke nama baru.

Di skrip kedua, kami juga mengimpor perpustakaan Pandas dan menentukan dua daftar: Dan , yang masing-masing berisi nama kolom asli dan baru. Kami kemudian membuat DataFrame menggunakan dengan data dan nama kolom asli. Untuk mengganti nama kolom, kami menggunakan rename() metode DataFrame. Metode ini mengambil kamus yang memetakan nama kolom lama ke nama kolom baru, yang dibuat menggunakan . Itu argumen memastikan bahwa DataFrame diubah pada tempatnya tanpa mengembalikan DataFrame baru. Langkah terakhir adalah menampilkan DataFrame yang telah diupdate dengan . Metode ini sangat berguna ketika Anda perlu mengganti nama kolom secara terprogram atau ketika berhadapan dengan DataFrames yang lebih besar dimana penugasan langsung mungkin kurang praktis.

Mengubah Nama Kolom di Pandas DataFrame

Menggunakan Python dengan Panda

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

Memperbarui Label Kolom DataFrame di Pandas

Skrip Python Memanfaatkan Perpustakaan Pandas

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

Teknik Tingkat Lanjut untuk Mengganti Nama Kolom DataFrame

Selain penggantian nama kolom dasar di Pandas DataFrame, ada teknik lanjutan yang bisa sangat berguna dalam berbagai skenario. Misalnya, terkadang Anda mungkin perlu mengganti nama kolom berdasarkan pola atau kondisi tertentu. Dalam kasus seperti itu, Anda dapat menggunakan pemahaman daftar atau fungsi dikombinasikan dengan fungsi lambda untuk mencapai hasil yang diinginkan. Pendekatan ini memungkinkan penggantian nama kolom yang lebih dinamis dan fleksibel. Misalnya, Anda dapat menghapus karakter tertentu dari nama kolom atau menerapkan transformasi seperti mengonversi semua nama menjadi huruf kecil.

Teknik lanjutan lainnya melibatkan penggantian nama kolom selama proses impor data. Saat memuat data dari file CSV, Anda dapat menggunakan parameter di untuk menentukan nama kolom baru. Hal ini sangat berguna ketika menangani data yang memiliki header yang tidak konsisten atau hilang. Selain itu, Anda dapat menggunakan parameter untuk melewati header yang ada dan menetapkan header Anda sendiri. Metode ini menyederhanakan proses pembersihan data dengan mengatasi masalah penamaan kolom langsung dari tahap pemuatan data, sehingga manipulasi data selanjutnya menjadi lebih efisien.

Pertanyaan dan Jawaban Umum tentang Mengganti Nama Kolom DataFrame

  1. Bagaimana cara mengganti nama satu kolom di DataFrame?
  2. Menggunakan metode dengan kamus yang menentukan nama kolom lama dan baru.
  3. Bisakah saya mengganti nama kolom saat membaca file CSV?
  4. Ya, gunakan parameter di untuk mengatur nama kolom baru.
  5. Bagaimana cara menghapus karakter tertentu dari semua nama kolom?
  6. Gunakan pemahaman daftar atau berfungsi dengan lambda untuk mengubah nama kolom.
  7. Apakah mungkin mengganti nama kolom berdasarkan posisinya?
  8. Ya, Anda dapat menggunakan DataFrame atribut dengan mengindeks dan menetapkan nama baru.
  9. Bagaimana jika saya perlu mengganti nama kolom secara dinamis berdasarkan kondisi?
  10. Gunakan logika kondisional dalam pemahaman daftar atau fungsi lambda untuk mengatur nama kolom.
  11. Bagaimana saya bisa memastikan perubahan saya diterapkan pada DataFrame asli?
  12. Menggunakan parameter dengan metode.
  13. Bisakah saya mengganti nama kolom untuk menghilangkan spasi?
  14. Ya, gunakan pemahaman daftar untuk menghapus spasi dari nama kolom.
  15. Bagaimana cara memeriksa nama kolom saat ini di DataFrame?
  16. Akses atribut DataFrame untuk melihat nama kolom.
  17. Bisakah saya mengganti nama kolom setelah memfilter DataFrame?
  18. Ya, penggantian nama kolom dapat dilakukan pada tahap apa pun, termasuk setelah pemfilteran.
  19. Bagaimana cara mengganti nama kolom di DataFrame multi-indeks?
  20. Menggunakan metode dengan kamus yang menentukan level dan nama untuk kolom multi-indeks.

Mengganti nama kolom di Pandas DataFrame adalah langkah penting dalam prapemrosesan data, yang membantu kejelasan dan aksesibilitas kumpulan data. Baik menggunakan penugasan langsung atau metode rename(), kedua pendekatan ini menawarkan solusi fleksibel yang disesuaikan dengan skenario berbeda. Dengan menguasai teknik ini, manipulasi data menjadi lebih intuitif, memfasilitasi analisis data yang lebih baik dan kode yang lebih bersih. Metode tingkat lanjut semakin menyederhanakan proses, menjadikannya keterampilan penting bagi ilmuwan atau analis data mana pun.