ഒരു പാണ്ടാസ് ഡാറ്റാഫ്രെയിമിലെ നിരകളുടെ പേരുമാറ്റുന്നു

Python

പാണ്ടസിലെ കോളം പുനർനാമകരണത്തിൻ്റെ ആമുഖം

Pandas-ൽ ഡാറ്റയ്‌ക്കൊപ്പം പ്രവർത്തിക്കുമ്പോൾ, ഡാറ്റാഫ്രെയിമിൻ്റെ കോളങ്ങൾ കൂടുതൽ അർത്ഥവത്തായതും പ്രവർത്തിക്കാൻ എളുപ്പവുമാക്കുന്നതിന് അവയുടെ പേരുമാറ്റേണ്ടത് ആവശ്യമാണ്. ഡാറ്റ പ്രോസസ്സിംഗ്, വിശകലന ജോലികൾ കൂടുതൽ അവബോധജന്യവും കാര്യക്ഷമവുമാക്കാൻ ഇത് സഹായിക്കും.

ഈ ലേഖനത്തിൽ, ഒരു Pandas DataFrame-ൻ്റെ കോളം ലേബലുകൾ ['$a', '$b', '$c', '$d', '$e'] എന്നതിൽ നിന്ന് ['a' എന്നതിലേക്ക് മാറ്റുന്നത് എങ്ങനെയെന്ന് ഞങ്ങൾ അന്വേഷിക്കും. 'b', 'c', 'd', 'e']. ലളിതവും എന്നാൽ അത്യാവശ്യവുമായ ഈ ടാസ്‌ക് ഡാറ്റ കൃത്രിമത്വത്തിലും വർക്ക്ഫ്ലോകൾ വൃത്തിയാക്കുന്നതിലും ഒരു പൊതു ആവശ്യകതയാണ്.

കമാൻഡ് വിവരണം
pd.DataFrame() ഒരു DataFrame ഒബ്‌ജക്‌റ്റ് സൃഷ്‌ടിക്കുന്നു, അത് ദ്വിമാനവും വലുപ്പം മാറ്റാവുന്നതും ലേബൽ ചെയ്‌തിരിക്കുന്ന അക്ഷങ്ങളോടുകൂടിയതുമായ വൈവിധ്യമാർന്ന ടാബുലാർ ഡാറ്റ ഘടനയാണ്.
df.columns ഡാറ്റാഫ്രെയിമിൻ്റെ കോളം ലേബലുകൾ ആക്‌സസ് ചെയ്യുന്നു. കോളം പേരുകൾ ലഭിക്കാനോ സജ്ജീകരിക്കാനോ ഉപയോഗിക്കാം.
df.rename() പുതിയ പേരുകളിലേക്ക് പഴയ പേരുകളുടെ മാപ്പിംഗ് നൽകിക്കൊണ്ട് ഡാറ്റാഫ്രെയിമിൻ്റെ കോളം പേരുകൾ മാറ്റാൻ നിങ്ങളെ അനുവദിക്കുന്നു.
dict(zip()) രണ്ട് ലിസ്‌റ്റുകൾ ഒരുമിച്ച് സിപ്പ് ചെയ്‌ത് ഒരു നിഘണ്ടു സൃഷ്‌ടിക്കുന്നു, യഥാർത്ഥ കോളം പേരുകൾ പുതിയ കോളം പേരുകളിലേക്ക് മാപ്പ് ചെയ്യാൻ ഇവിടെ ഉപയോഗിക്കുന്നു.
inplace=True ഒരു പുതിയ ഡാറ്റാഫ്രെയിം തിരികെ നൽകാതെ, ഡാറ്റാഫ്രെയിമിനെ മാറ്റുന്ന റീനെയിം രീതിയിലുള്ള ഒരു വാദം.
print(df) അപ്ഡേറ്റ് ചെയ്ത കോളം പേരുകൾ കാണാൻ നിങ്ങളെ അനുവദിക്കുന്ന, കൺസോളിലേക്ക് ഡാറ്റഫ്രെയിം പ്രദർശിപ്പിക്കുന്നു.

സ്ക്രിപ്റ്റുകളുടെ വിശദമായ വിശദീകരണം

മുകളിൽ നൽകിയിരിക്കുന്ന സ്ക്രിപ്റ്റുകൾ, ഡാറ്റാ കൃത്രിമത്വത്തിലെ ഒരു പൊതു ജോലിയായ പാണ്ടാസ് ഡാറ്റാഫ്രെയിമിലെ കോളങ്ങളുടെ പേരുമാറ്റുന്നത് എങ്ങനെയെന്ന് കാണിക്കുന്നു. ആദ്യ സ്ക്രിപ്റ്റിൽ, ഞങ്ങൾ പാണ്ടാസ് ലൈബ്രറി ഇറക്കുമതി ചെയ്തുകൊണ്ട് ആരംഭിക്കുന്നു . അടുത്തതായി, ഞങ്ങൾ ഉപയോഗിച്ച് ഒരു ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കുന്നു എന്ന് ലേബൽ ചെയ്ത കോളങ്ങൾക്കൊപ്പം , '$b', , , ഒപ്പം . ഈ നിരകളുടെ പേരുമാറ്റാൻ, ഞങ്ങൾ നേരിട്ട് DataFrame's സജ്ജമാക്കുന്നു columns പുതിയ കോളം പേരുകൾക്ക് ആട്രിബ്യൂട്ട് . അവസാനമായി, ഞങ്ങൾ അപ്ഡേറ്റ് ചെയ്ത DataFrame ഉപയോഗിച്ച് പ്രദർശിപ്പിക്കുന്നു , ഇത് പുതിയ കോളം പേരുകൾ കാണിക്കുന്നു. പഴയ പേരുകൾ പുതിയ പേരുകളിലേക്ക് വ്യക്തവും നേരിട്ടുള്ളതുമായ മാപ്പിംഗ് ഉള്ളപ്പോൾ കോളങ്ങളുടെ പേരുമാറ്റാൻ ഈ രീതി ലളിതവും കാര്യക്ഷമവുമാണ്.

രണ്ടാമത്തെ സ്ക്രിപ്റ്റിൽ, ഞങ്ങൾ പാണ്ടാസ് ലൈബ്രറിയും ഇറക്കുമതി ചെയ്യുകയും രണ്ട് ലിസ്റ്റുകൾ നിർവ്വചിക്കുകയും ചെയ്യുന്നു: ഒപ്പം , യഥാക്രമം യഥാർത്ഥ, പുതിയ കോളം പേരുകൾ ഉൾക്കൊള്ളുന്നു. തുടർന്ന് ഞങ്ങൾ ഒരു ഡാറ്റാഫ്രെയിം ഉണ്ടാക്കുന്നു ഡാറ്റയും യഥാർത്ഥ കോളം പേരുകളും സഹിതം. നിരകളുടെ പേരുമാറ്റാൻ, ഞങ്ങൾ ഉപയോഗിക്കുന്നു rename() ഡാറ്റ ഫ്രെയിമിൻ്റെ രീതി. ഈ രീതി ഉപയോഗിച്ച് സൃഷ്ടിച്ച പഴയ കോളം പേരുകൾ പുതിയ കോളം പേരുകളിലേക്ക് മാപ്പ് ചെയ്യുന്ന ഒരു നിഘണ്ടു എടുക്കുന്നു . ദി ഒരു പുതിയ ഡാറ്റാഫ്രെയിം തിരികെ നൽകാതെ തന്നെ ഡാറ്റാഫ്രെയിം പരിഷ്കരിച്ചിട്ടുണ്ടെന്ന് ആർഗ്യുമെൻ്റ് ഉറപ്പാക്കുന്നു. അപ്‌ഡേറ്റ് ചെയ്‌ത ഡാറ്റാഫ്രെയിം പ്രദർശിപ്പിക്കുക എന്നതാണ് അവസാന ഘട്ടം . നിങ്ങൾക്ക് കോളങ്ങളുടെ പേരുമാറ്റേണ്ടിവരുമ്പോൾ അല്ലെങ്കിൽ നേരിട്ടുള്ള അസൈൻമെൻ്റ് പ്രായോഗികമല്ലാത്ത വലിയ ഡാറ്റാഫ്രെയിമുകൾ കൈകാര്യം ചെയ്യുമ്പോൾ ഈ രീതി പ്രത്യേകിച്ചും ഉപയോഗപ്രദമാണ്.

ഒരു Pandas DataFrame-ൽ കോളം പേരുകൾ മാറ്റുന്നു

പാണ്ടകൾക്കൊപ്പം പൈത്തൺ ഉപയോഗിക്കുന്നു

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

പാണ്ടസിലെ ഡാറ്റാഫ്രെയിം കോളം ലേബലുകൾ അപ്‌ഡേറ്റ് ചെയ്യുന്നു

പൈത്തൺ സ്ക്രിപ്റ്റ് പാണ്ടാസ് ലൈബ്രറി ഉപയോഗപ്പെടുത്തുന്നു

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

ഡാറ്റാഫ്രെയിം കോളങ്ങൾ പുനർനാമകരണം ചെയ്യുന്നതിനുള്ള വിപുലമായ സാങ്കേതിക വിദ്യകൾ

ഒരു Pandas DataFrame-ലെ കോളങ്ങളുടെ അടിസ്ഥാന പുനർനാമകരണത്തിനപ്പുറം, വ്യത്യസ്‌ത സാഹചര്യങ്ങളിൽ വളരെ ഉപയോഗപ്രദമാകുന്ന നൂതന സാങ്കേതിക വിദ്യകളുണ്ട്. ഉദാഹരണത്തിന്, ചിലപ്പോൾ നിങ്ങൾ ഒരു പ്രത്യേക പാറ്റേൺ അല്ലെങ്കിൽ വ്യവസ്ഥയെ അടിസ്ഥാനമാക്കി നിരകളുടെ പേരുമാറ്റേണ്ടി വന്നേക്കാം. അത്തരം സന്ദർഭങ്ങളിൽ, നിങ്ങൾക്ക് ലിസ്റ്റ് കോംപ്രിഹെൻഷനുകൾ ഉപയോഗിക്കാം ആവശ്യമുള്ള ഫലങ്ങൾ നേടുന്നതിന് ലാംഡ ഫംഗ്ഷനുകളുമായി സംയോജിപ്പിച്ച പ്രവർത്തനം. ഈ സമീപനം കൂടുതൽ ചലനാത്മകവും വഴക്കമുള്ളതുമായ കോളം പുനർനാമകരണം അനുവദിക്കുന്നു. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് കോളം പേരുകളിൽ നിന്ന് നിർദ്ദിഷ്ട പ്രതീകങ്ങൾ നീക്കംചെയ്യാം അല്ലെങ്കിൽ എല്ലാ പേരുകളും ചെറിയക്ഷരത്തിലേക്ക് പരിവർത്തനം ചെയ്യുന്നത് പോലുള്ള പരിവർത്തനങ്ങൾ പ്രയോഗിക്കാം.

ഡാറ്റ ഇറക്കുമതി ചെയ്യുന്ന സമയത്ത് കോളങ്ങളുടെ പേരുമാറ്റുന്നത് മറ്റൊരു വിപുലമായ സാങ്കേതികതയിൽ ഉൾപ്പെടുന്നു. CSV ഫയലുകളിൽ നിന്ന് ഡാറ്റ ലോഡ് ചെയ്യുമ്പോൾ, നിങ്ങൾക്ക് ഇത് ഉപയോഗിക്കാം പരാമീറ്റർ ഇൻ പുതിയ കോളം പേരുകൾ വ്യക്തമാക്കാൻ. പൊരുത്തമില്ലാത്തതോ നഷ്‌ടമായതോ ആയ തലക്കെട്ടുകളുള്ള ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ ഇത് പ്രത്യേകിച്ചും ഉപയോഗപ്രദമാകും. കൂടാതെ, നിങ്ങൾക്ക് ഉപയോഗിക്കാം നിലവിലുള്ള തലക്കെട്ടുകൾ ഒഴിവാക്കി നിങ്ങളുടേത് നിയോഗിക്കുന്നതിനുള്ള പരാമീറ്റർ. ഈ രീതികൾ ഡാറ്റാ ലോഡിംഗ് ഘട്ടം മുതൽ കോളം നാമകരണ പ്രശ്‌നങ്ങൾ പരിഹരിച്ചുകൊണ്ട് ഡാറ്റ ക്ലീനിംഗ് പ്രക്രിയയെ കാര്യക്ഷമമാക്കുന്നു, തുടർന്നുള്ള ഡാറ്റ കൃത്രിമത്വം കൂടുതൽ കാര്യക്ഷമമാക്കുന്നു.

ഡാറ്റാഫ്രെയിം കോളങ്ങളുടെ പേരുമാറ്റുന്നതിനെക്കുറിച്ചുള്ള പൊതുവായ ചോദ്യങ്ങളും ഉത്തരങ്ങളും

  1. ഒരു ഡാറ്റാഫ്രെയിമിലെ ഒരു കോളത്തിൻ്റെ പേരുമാറ്റുന്നത് എങ്ങനെ?
  2. ഉപയോഗിക്കുക പഴയതും പുതിയതുമായ നിരകളുടെ പേരുകൾ വ്യക്തമാക്കുന്ന ഒരു നിഘണ്ടുവോടുകൂടിയ രീതി.
  3. ഒരു CSV ഫയൽ വായിക്കുമ്പോൾ എനിക്ക് കോളങ്ങളുടെ പേരുമാറ്റാൻ കഴിയുമോ?
  4. അതെ, ഉപയോഗിക്കുക പരാമീറ്റർ ഇൻ പുതിയ കോളം പേരുകൾ സജ്ജമാക്കാൻ.
  5. എല്ലാ കോളം പേരുകളിൽ നിന്നും പ്രത്യേക പ്രതീകങ്ങൾ എങ്ങനെ നീക്കംചെയ്യാം?
  6. ഒരു ലിസ്റ്റ് കോംപ്രഹെൻഷൻ ഉപയോഗിക്കുക അല്ലെങ്കിൽ നിരയുടെ പേരുകൾ പരിഷ്കരിക്കുന്നതിന് ഒരു ലാംഡ ഉപയോഗിച്ച് പ്രവർത്തിക്കുക.
  7. കോളങ്ങളുടെ സ്ഥാനങ്ങൾ അനുസരിച്ച് പേരുമാറ്റാൻ കഴിയുമോ?
  8. അതെ, നിങ്ങൾക്ക് ഡാറ്റാഫ്രെയിമുകൾ ഉപയോഗിക്കാം ഇൻഡക്‌സ് ചെയ്‌ത് പുതിയ പേരുകൾ നൽകി ആട്രിബ്യൂട്ട് ചെയ്യുക.
  9. വ്യവസ്ഥകളെ അടിസ്ഥാനമാക്കി എനിക്ക് കോളങ്ങളുടെ പേര് മാറ്റണമെങ്കിൽ എന്തുചെയ്യും?
  10. നിരയുടെ പേരുകൾ സജ്ജീകരിക്കുന്നതിന് ഒരു ലിസ്റ്റ് കോംപ്രഹെൻഷനിലോ ലാംഡ ഫംഗ്ഷനിലോ സോപാധിക ലോജിക് ഉപയോഗിക്കുക.
  11. യഥാർത്ഥ ഡാറ്റാഫ്രെയിമിൽ എൻ്റെ മാറ്റങ്ങൾ ബാധകമാണെന്ന് എനിക്ക് എങ്ങനെ ഉറപ്പാക്കാനാകും?
  12. ഉപയോഗിക്കുക കൂടെ പരാമീറ്റർ രീതി.
  13. വൈറ്റ്‌സ്‌പേസ് നീക്കം ചെയ്യാൻ എനിക്ക് കോളങ്ങളുടെ പേരുമാറ്റാൻ കഴിയുമോ?
  14. അതെ, കോളത്തിൻ്റെ പേരുകളിൽ നിന്ന് വൈറ്റ്‌സ്‌പെയ്‌സ് നീക്കം ചെയ്യാൻ ഒരു ലിസ്റ്റ് കോംപ്രഹെൻഷൻ ഉപയോഗിക്കുക.
  15. ഒരു ഡാറ്റാഫ്രെയിമിലെ നിലവിലെ കോളം പേരുകൾ എങ്ങനെ പരിശോധിക്കാം?
  16. ആക്സസ് ചെയ്യുക കോളത്തിൻ്റെ പേരുകൾ കാണുന്നതിന് ഡാറ്റാഫ്രെയിമിൻ്റെ ആട്രിബ്യൂട്ട്.
  17. DataFrame ഫിൽട്ടർ ചെയ്ത ശേഷം എനിക്ക് കോളങ്ങളുടെ പേരുമാറ്റാൻ കഴിയുമോ?
  18. അതെ, ഫിൽട്ടർ ചെയ്തതിന് ശേഷവും കോളങ്ങളുടെ പേരുമാറ്റം ഏത് ഘട്ടത്തിലും ചെയ്യാവുന്നതാണ്.
  19. ഒരു മൾട്ടി-ഇൻഡക്സ് ഡാറ്റാഫ്രെയിമിലെ കോളങ്ങളുടെ പേരുമാറ്റുന്നത് എങ്ങനെ?
  20. ഉപയോഗിക്കുക മൾട്ടി-ഇൻഡക്സ് നിരകൾക്കുള്ള ലെവലും പേരുകളും വ്യക്തമാക്കുന്ന ഒരു നിഘണ്ടുവോടുകൂടിയ രീതി.

ഒരു Pandas DataFrame-ലെ കോളങ്ങളുടെ പേരുമാറ്റുന്നത് ഡാറ്റ പ്രീപ്രോസസിംഗിലെ ഒരു നിർണായക ഘട്ടമാണ്, ഇത് ഡാറ്റാസെറ്റിൻ്റെ വ്യക്തതയിലും പ്രവേശനക്ഷമതയിലും സഹായിക്കുന്നു. നേരിട്ടുള്ള അസൈൻമെൻ്റോ പുനർനാമകരണം() രീതിയോ ഉപയോഗിച്ചാലും, രണ്ട് സമീപനങ്ങളും വ്യത്യസ്ത സാഹചര്യങ്ങൾക്ക് അനുയോജ്യമായ വഴക്കമുള്ള പരിഹാരങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു. ഈ സാങ്കേതികതകളിൽ പ്രാവീണ്യം നേടുന്നതിലൂടെ, ഡാറ്റ കൃത്രിമത്വം കൂടുതൽ അവബോധജന്യമായിത്തീരുന്നു, മെച്ചപ്പെട്ട ഡാറ്റാ വിശകലനവും ക്ലീനർ കോഡും സുഗമമാക്കുന്നു. നൂതനമായ രീതികൾ പ്രക്രിയയെ കൂടുതൽ കാര്യക്ഷമമാക്കുന്നു, ഇത് ഏതൊരു ഡാറ്റാ സയൻ്റിസ്റ്റിനും അനലിസ്റ്റിനും അത്യന്താപേക്ഷിതമായ ഒരു നൈപുണ്യമാക്കി മാറ്റുന്നു.