Kolonnu pārdēvēšana Pandas DataFrame

Kolonnu pārdēvēšana Pandas DataFrame
Kolonnu pārdēvēšana Pandas DataFrame

Ievads kolonnu pārdēvēšanai pandās

Strādājot ar datiem programmā Pandas, bieži vien ir jāpārdēvē DataFrame kolonnas, lai tās būtu jēgpilnākas un ar tām būtu vieglāk strādāt. Tas var palīdzēt padarīt datu apstrādes un analīzes uzdevumus intuitīvākus un efektīvākus.

Šajā rakstā mēs izpētīsim, kā mainīt Pandas DataFrame kolonnu apzīmējumus no ['$a', '$b', '$c', '$d', '$e'] uz ['a', “b”, “c”, “d”, “e”]. Šis vienkāršais, taču būtiskais uzdevums ir izplatīta prasība datu apstrādes un tīrīšanas darbplūsmās.

Pavēli Apraksts
pd.DataFrame() Izveido DataFrame objektu, kas ir divdimensiju, izmēru mainīga un potenciāli neviendabīga tabulu datu struktūra ar marķētām asīm.
df.columns Piekļūst DataFrame kolonnu etiķetēm. Var izmantot, lai iegūtu vai iestatītu kolonnu nosaukumus.
df.rename() Ļauj mainīt DataFrame kolonnu nosaukumus, nodrošinot veco nosaukumu kartēšanu ar jauniem nosaukumiem.
dict(zip()) Izveido vārdnīcu, saspiežot kopā divus sarakstus, ko izmanto, lai kartētu sākotnējos kolonnu nosaukumus ar jauniem kolonnu nosaukumiem.
inplace=True Arguments pārdēvēšanas metodē, kas maina DataFrame vietā, neatgriežot jaunu DataFrame.
print(df) Konsole parāda DataFrame, ļaujot skatīt atjauninātos kolonnu nosaukumus.

Detalizēts skriptu skaidrojums

Iepriekš sniegtie skripti parāda, kā pārdēvēt kolonnas Pandas DataFrame, kas ir izplatīts datu apstrādes uzdevums. Pirmajā skriptā mēs sākam importēt Pandas bibliotēku ar import pandas as pd. Tālāk mēs izveidojam DataFrame, izmantojot pd.DataFrame() ar kolonnām, kas apzīmētas kā '$a', '$b', '$c', '$d', un '$e'. Lai pārdēvētu šīs kolonnas, mēs tieši iestatām DataFrame columns atribūtu jaunajiem kolonnu nosaukumiem ['a', 'b', 'c', 'd', 'e']. Visbeidzot, mēs parādām atjaunināto DataFrame, izmantojot print(df), kas parāda jauno kolonnu nosaukumus. Šī metode ir vienkārša un efektīva kolonnu pārdēvēšanai, ja jums ir skaidra un tieša veco nosaukumu kartēšana ar jauniem nosaukumiem.

Otrajā skriptā mēs arī importējam Pandas bibliotēku un definējam divus sarakstus: original_columns un new_columns, kas satur attiecīgi sākotnējo un jauno kolonnu nosaukumus. Pēc tam mēs izveidojam DataFrame, izmantojot pd.DataFrame() ar datiem un oriģinālo kolonnu nosaukumiem. Lai pārdēvētu kolonnas, mēs izmantojam rename() DataFrame metode. Šī metode izmanto vārdnīcu, kas kartē vecos kolonnu nosaukumus ar jauniem kolonnu nosaukumiem, kas izveidoti, izmantojot dict(zip(original_columns, new_columns)). The inplace=True arguments nodrošina, ka DataFrame tiek modificēts vietā, neatgriežot jaunu DataFrame. Pēdējais solis ir parādīt atjaunināto DataFrame ar print(df). Šī metode ir īpaši noderīga, ja nepieciešams pārdēvēt kolonnas programmatiski vai strādājot ar lielākiem DataFrame, kur tieša piešķiršana var būt mazāk praktiska.

Kolonnu nosaukumu maiņa Pandas DataFrame

Python izmantošana ar Pandas

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

DataFrame kolonnu etiķešu atjaunināšana Pandas

Python skripts, kas izmanto Pandas bibliotēku

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

Uzlabotas metodes DataFrame kolonnu pārdēvēšanai

Papildus pamata kolonnu pārdēvēšanai Pandas DataFrame ir arī uzlabotas metodes, kas var būt ļoti noderīgas dažādos scenārijos. Piemēram, dažreiz jums var būt nepieciešams pārdēvēt kolonnas, pamatojoties uz konkrētu modeli vai nosacījumu. Šādos gadījumos varat izmantot saraksta izpratni vai map() funkcija apvienota ar lambda funkcijām, lai sasniegtu vēlamos rezultātus. Šī pieeja nodrošina dinamiskāku un elastīgāku kolonnu pārdēvēšanu. Piemēram, varat noņemt noteiktas rakstzīmes no kolonnu nosaukumiem vai lietot transformācijas, piemēram, pārvērst visus nosaukumus uz mazajiem burtiem.

Vēl viens uzlabots paņēmiens ietver kolonnu pārdēvēšanu datu importēšanas procesa laikā. Ielādējot datus no CSV failiem, varat izmantot names parametrs iekšā pd.read_csv() lai norādītu jaunus kolonnu nosaukumus. Tas var būt īpaši noderīgi, strādājot ar datiem, kuriem ir nekonsekventas vai trūkstošās galvenes. Turklāt jūs varat izmantot header parametru, lai izlaistu esošās galvenes un piešķirtu savas. Šīs metodes racionalizē datu tīrīšanas procesu, risinot kolonnu nosaukšanas problēmas jau datu ielādes posmā, padarot turpmāko datu manipulāciju efektīvāku.

Bieži uzdotie jautājumi un atbildes par DataFrame kolonnu pārdēvēšanu

  1. Kā es varu pārdēvēt vienu kolonnu DataFrame?
  2. Izmantojiet rename() metodi ar vārdnīcu, norādot veco un jauno kolonnu nosaukumus.
  3. Vai es varu pārdēvēt kolonnas, lasot CSV failu?
  4. Jā, izmantojiet names parametrs iekšā pd.read_csv() lai iestatītu jaunus kolonnu nosaukumus.
  5. Kā no visu kolonnu nosaukumiem noņemt noteiktas rakstzīmes?
  6. Izmantojiet saraksta izpratni vai map() funkcija ar lambda, lai mainītu kolonnu nosaukumus.
  7. Vai ir iespējams pārdēvēt kolonnas, pamatojoties uz to pozīcijām?
  8. Jā, jūs varat izmantot DataFrame columns atribūtu, indeksējot un piešķirot jaunus nosaukumus.
  9. Ko darīt, ja kolonnas ir jāpārdēvē dinamiski, pamatojoties uz nosacījumiem?
  10. Izmantojiet nosacījumu loģiku saraksta izpratnē vai lambda funkcijā, lai iestatītu kolonnu nosaukumus.
  11. Kā es varu nodrošināt, ka manas izmaiņas tiek piemērotas sākotnējam DataFrame?
  12. Izmantojiet inplace=True parametrs ar rename() metodi.
  13. Vai es varu pārdēvēt kolonnas, lai noņemtu atstarpes?
  14. Jā, izmantojiet saraksta izpratni, lai kolonnu nosaukumos noņemtu atstarpes.
  15. Kā pārbaudīt pašreizējos kolonnu nosaukumus DataFrame?
  16. Piekļūstiet columns DataFrame atribūts, lai skatītu kolonnu nosaukumus.
  17. Vai es varu pārdēvēt kolonnas pēc DataFrame filtrēšanas?
  18. Jā, kolonnu pārdēvēšanu var veikt jebkurā posmā, arī pēc filtrēšanas.
  19. Kā pārdēvēt kolonnas vairāku indeksu DataFrame?
  20. Izmantojiet rename() metode ar vārdnīcu, kurā norādīts vairāku indeksu kolonnu līmenis un nosaukumi.

Pēdējās domas par kolonnu pārdēvēšanu

Kolonnu pārdēvēšana Pandas DataFrame ir būtisks datu pirmapstrādes solis, kas palīdz nodrošināt datu kopas skaidrību un pieejamību. Neatkarīgi no tā, vai tiek izmantota tiešā piešķiršana vai pārdēvēšanas() metode, abas pieejas piedāvā elastīgus risinājumus, kas pielāgoti dažādiem scenārijiem. Apgūstot šīs metodes, datu manipulācijas kļūst intuitīvākas, veicinot labāku datu analīzi un tīrāku kodu. Uzlabotās metodes vēl vairāk racionalizē procesu, padarot to par būtisku prasmi jebkuram datu zinātniekam vai analītiķim.