Kolonnu pārdēvēšana Pandas DataFrame

Python

Ievads kolonnu pārdēvēšanai pandās

Strādājot ar datiem programmā Pandas, bieži vien ir jāpārdēvē DataFrame kolonnas, lai tās būtu jēgpilnākas un ar tām būtu vieglāk strādāt. Tas var palīdzēt padarīt datu apstrādes un analīzes uzdevumus intuitīvākus un efektīvākus.

Šajā rakstā mēs izpētīsim, kā mainīt Pandas DataFrame kolonnu apzīmējumus no ['$a', '$b', '$c', '$d', '$e'] uz ['a', “b”, “c”, “d”, “e”]. Šis vienkāršais, taču būtiskais uzdevums ir izplatīta prasība datu apstrādes un tīrīšanas darbplūsmās.

Pavēli Apraksts
pd.DataFrame() Izveido DataFrame objektu, kas ir divdimensiju, izmēru mainīga un potenciāli neviendabīga tabulu datu struktūra ar marķētām asīm.
df.columns Piekļūst DataFrame kolonnu etiķetēm. Var izmantot, lai iegūtu vai iestatītu kolonnu nosaukumus.
df.rename() Ļauj mainīt DataFrame kolonnu nosaukumus, nodrošinot veco nosaukumu kartēšanu ar jauniem nosaukumiem.
dict(zip()) Izveido vārdnīcu, saspiežot kopā divus sarakstus, ko izmanto, lai kartētu sākotnējos kolonnu nosaukumus ar jauniem kolonnu nosaukumiem.
inplace=True Arguments pārdēvēšanas metodē, kas maina DataFrame vietā, neatgriežot jaunu DataFrame.
print(df) Konsole parāda DataFrame, ļaujot skatīt atjauninātos kolonnu nosaukumus.

Detalizēts skriptu skaidrojums

Iepriekš sniegtie skripti parāda, kā pārdēvēt kolonnas Pandas DataFrame, kas ir izplatīts datu apstrādes uzdevums. Pirmajā skriptā mēs sākam importēt Pandas bibliotēku ar . Tālāk mēs izveidojam DataFrame, izmantojot ar kolonnām, kas apzīmētas kā , '$b', , , un . Lai pārdēvētu šīs kolonnas, mēs tieši iestatām DataFrame columns atribūtu jaunajiem kolonnu nosaukumiem . Visbeidzot, mēs parādām atjaunināto DataFrame, izmantojot , kas parāda jauno kolonnu nosaukumus. Šī metode ir vienkārša un efektīva kolonnu pārdēvēšanai, ja jums ir skaidra un tieša veco nosaukumu kartēšana ar jauniem nosaukumiem.

Otrajā skriptā mēs arī importējam Pandas bibliotēku un definējam divus sarakstus: un , kas satur attiecīgi sākotnējo un jauno kolonnu nosaukumus. Pēc tam mēs izveidojam DataFrame, izmantojot ar datiem un oriģinālo kolonnu nosaukumiem. Lai pārdēvētu kolonnas, mēs izmantojam rename() DataFrame metode. Šī metode izmanto vārdnīcu, kas kartē vecos kolonnu nosaukumus ar jauniem kolonnu nosaukumiem, kas izveidoti, izmantojot . The arguments nodrošina, ka DataFrame tiek modificēts vietā, neatgriežot jaunu DataFrame. Pēdējais solis ir parādīt atjaunināto DataFrame ar . Šī metode ir īpaši noderīga, ja nepieciešams pārdēvēt kolonnas programmatiski vai strādājot ar lielākiem DataFrame, kur tieša piešķiršana var būt mazāk praktiska.

Kolonnu nosaukumu maiņa Pandas DataFrame

Python izmantošana ar Pandas

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

DataFrame kolonnu etiķešu atjaunināšana Pandas

Python skripts, kas izmanto Pandas bibliotēku

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

Uzlabotas metodes DataFrame kolonnu pārdēvēšanai

Papildus pamata kolonnu pārdēvēšanai Pandas DataFrame ir arī uzlabotas metodes, kas var būt ļoti noderīgas dažādos scenārijos. Piemēram, dažreiz jums var būt nepieciešams pārdēvēt kolonnas, pamatojoties uz konkrētu modeli vai nosacījumu. Šādos gadījumos varat izmantot saraksta izpratni vai funkcija apvienota ar lambda funkcijām, lai sasniegtu vēlamos rezultātus. Šī pieeja nodrošina dinamiskāku un elastīgāku kolonnu pārdēvēšanu. Piemēram, varat noņemt noteiktas rakstzīmes no kolonnu nosaukumiem vai lietot transformācijas, piemēram, pārvērst visus nosaukumus uz mazajiem burtiem.

Vēl viens uzlabots paņēmiens ietver kolonnu pārdēvēšanu datu importēšanas procesa laikā. Ielādējot datus no CSV failiem, varat izmantot parametrs iekšā lai norādītu jaunus kolonnu nosaukumus. Tas var būt īpaši noderīgi, strādājot ar datiem, kuriem ir nekonsekventas vai trūkstošās galvenes. Turklāt jūs varat izmantot parametru, lai izlaistu esošās galvenes un piešķirtu savas. Šīs metodes racionalizē datu tīrīšanas procesu, risinot kolonnu nosaukšanas problēmas jau datu ielādes posmā, padarot turpmāko datu manipulāciju efektīvāku.

Bieži uzdotie jautājumi un atbildes par DataFrame kolonnu pārdēvēšanu

  1. Kā es varu pārdēvēt vienu kolonnu DataFrame?
  2. Izmantojiet metodi ar vārdnīcu, norādot veco un jauno kolonnu nosaukumus.
  3. Vai es varu pārdēvēt kolonnas, lasot CSV failu?
  4. Jā, izmantojiet parametrs iekšā lai iestatītu jaunus kolonnu nosaukumus.
  5. Kā no visu kolonnu nosaukumiem noņemt noteiktas rakstzīmes?
  6. Izmantojiet saraksta izpratni vai funkcija ar lambda, lai mainītu kolonnu nosaukumus.
  7. Vai ir iespējams pārdēvēt kolonnas, pamatojoties uz to pozīcijām?
  8. Jā, jūs varat izmantot DataFrame atribūtu, indeksējot un piešķirot jaunus nosaukumus.
  9. Ko darīt, ja kolonnas ir jāpārdēvē dinamiski, pamatojoties uz nosacījumiem?
  10. Izmantojiet nosacījumu loģiku saraksta izpratnē vai lambda funkcijā, lai iestatītu kolonnu nosaukumus.
  11. Kā es varu nodrošināt, ka manas izmaiņas tiek piemērotas sākotnējam DataFrame?
  12. Izmantojiet parametrs ar metodi.
  13. Vai es varu pārdēvēt kolonnas, lai noņemtu atstarpes?
  14. Jā, izmantojiet saraksta izpratni, lai kolonnu nosaukumos noņemtu atstarpes.
  15. Kā pārbaudīt pašreizējos kolonnu nosaukumus DataFrame?
  16. Piekļūstiet DataFrame atribūts, lai skatītu kolonnu nosaukumus.
  17. Vai es varu pārdēvēt kolonnas pēc DataFrame filtrēšanas?
  18. Jā, kolonnu pārdēvēšanu var veikt jebkurā posmā, arī pēc filtrēšanas.
  19. Kā pārdēvēt kolonnas vairāku indeksu DataFrame?
  20. Izmantojiet metode ar vārdnīcu, kurā norādīts vairāku indeksu kolonnu līmenis un nosaukumi.

Kolonnu pārdēvēšana Pandas DataFrame ir būtisks datu pirmapstrādes solis, kas palīdz nodrošināt datu kopas skaidrību un pieejamību. Neatkarīgi no tā, vai tiek izmantota tiešā piešķiršana vai pārdēvēšanas() metode, abas pieejas piedāvā elastīgus risinājumus, kas pielāgoti dažādiem scenārijiem. Apgūstot šīs metodes, datu manipulācijas kļūst intuitīvākas, veicinot labāku datu analīzi un tīrāku kodu. Uzlabotās metodes vēl vairāk racionalizē procesu, padarot to par būtisku prasmi jebkuram datu zinātniekam vai analītiķim.