ഒരു പാണ്ടാസ് ഡാറ്റാഫ്രെയിമിലെ നിരകളുടെ പേരുമാറ്റുന്നു

ഒരു പാണ്ടാസ് ഡാറ്റാഫ്രെയിമിലെ നിരകളുടെ പേരുമാറ്റുന്നു
ഒരു പാണ്ടാസ് ഡാറ്റാഫ്രെയിമിലെ നിരകളുടെ പേരുമാറ്റുന്നു

പാണ്ടസിലെ കോളം പുനർനാമകരണത്തിൻ്റെ ആമുഖം

Pandas-ൽ ഡാറ്റയ്‌ക്കൊപ്പം പ്രവർത്തിക്കുമ്പോൾ, ഡാറ്റാഫ്രെയിമിൻ്റെ കോളങ്ങൾ കൂടുതൽ അർത്ഥവത്തായതും പ്രവർത്തിക്കാൻ എളുപ്പവുമാക്കുന്നതിന് അവയുടെ പേരുമാറ്റേണ്ടത് ആവശ്യമാണ്. ഡാറ്റ പ്രോസസ്സിംഗ്, വിശകലന ജോലികൾ കൂടുതൽ അവബോധജന്യവും കാര്യക്ഷമവുമാക്കാൻ ഇത് സഹായിക്കും.

ഈ ലേഖനത്തിൽ, ഒരു Pandas DataFrame-ൻ്റെ കോളം ലേബലുകൾ ['$a', '$b', '$c', '$d', '$e'] എന്നതിൽ നിന്ന് ['a' എന്നതിലേക്ക് മാറ്റുന്നത് എങ്ങനെയെന്ന് ഞങ്ങൾ അന്വേഷിക്കും. 'b', 'c', 'd', 'e']. ലളിതവും എന്നാൽ അത്യാവശ്യവുമായ ഈ ടാസ്‌ക് ഡാറ്റ കൃത്രിമത്വത്തിലും വർക്ക്ഫ്ലോകൾ വൃത്തിയാക്കുന്നതിലും ഒരു പൊതു ആവശ്യകതയാണ്.

കമാൻഡ് വിവരണം
pd.DataFrame() ഒരു DataFrame ഒബ്‌ജക്‌റ്റ് സൃഷ്‌ടിക്കുന്നു, അത് ദ്വിമാനവും വലുപ്പം മാറ്റാവുന്നതും ലേബൽ ചെയ്‌തിരിക്കുന്ന അക്ഷങ്ങളോടുകൂടിയതുമായ വൈവിധ്യമാർന്ന ടാബുലാർ ഡാറ്റ ഘടനയാണ്.
df.columns ഡാറ്റാഫ്രെയിമിൻ്റെ കോളം ലേബലുകൾ ആക്‌സസ് ചെയ്യുന്നു. കോളം പേരുകൾ ലഭിക്കാനോ സജ്ജീകരിക്കാനോ ഉപയോഗിക്കാം.
df.rename() പുതിയ പേരുകളിലേക്ക് പഴയ പേരുകളുടെ മാപ്പിംഗ് നൽകിക്കൊണ്ട് ഡാറ്റാഫ്രെയിമിൻ്റെ കോളം പേരുകൾ മാറ്റാൻ നിങ്ങളെ അനുവദിക്കുന്നു.
dict(zip()) രണ്ട് ലിസ്‌റ്റുകൾ ഒരുമിച്ച് സിപ്പ് ചെയ്‌ത് ഒരു നിഘണ്ടു സൃഷ്‌ടിക്കുന്നു, യഥാർത്ഥ കോളം പേരുകൾ പുതിയ കോളം പേരുകളിലേക്ക് മാപ്പ് ചെയ്യാൻ ഇവിടെ ഉപയോഗിക്കുന്നു.
inplace=True ഒരു പുതിയ ഡാറ്റാഫ്രെയിം തിരികെ നൽകാതെ, ഡാറ്റാഫ്രെയിമിനെ മാറ്റുന്ന റീനെയിം രീതിയിലുള്ള ഒരു വാദം.
print(df) അപ്ഡേറ്റ് ചെയ്ത കോളം പേരുകൾ കാണാൻ നിങ്ങളെ അനുവദിക്കുന്ന, കൺസോളിലേക്ക് ഡാറ്റഫ്രെയിം പ്രദർശിപ്പിക്കുന്നു.

സ്ക്രിപ്റ്റുകളുടെ വിശദമായ വിശദീകരണം

മുകളിൽ നൽകിയിരിക്കുന്ന സ്ക്രിപ്റ്റുകൾ, ഡാറ്റാ കൃത്രിമത്വത്തിലെ ഒരു പൊതു ജോലിയായ പാണ്ടാസ് ഡാറ്റാഫ്രെയിമിലെ കോളങ്ങളുടെ പേരുമാറ്റുന്നത് എങ്ങനെയെന്ന് കാണിക്കുന്നു. ആദ്യ സ്ക്രിപ്റ്റിൽ, ഞങ്ങൾ പാണ്ടാസ് ലൈബ്രറി ഇറക്കുമതി ചെയ്തുകൊണ്ട് ആരംഭിക്കുന്നു import pandas as pd. അടുത്തതായി, ഞങ്ങൾ ഉപയോഗിച്ച് ഒരു ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കുന്നു pd.DataFrame() എന്ന് ലേബൽ ചെയ്ത കോളങ്ങൾക്കൊപ്പം '$a', '$b', '$c', '$d', ഒപ്പം '$e'. ഈ നിരകളുടെ പേരുമാറ്റാൻ, ഞങ്ങൾ നേരിട്ട് DataFrame's സജ്ജമാക്കുന്നു columns പുതിയ കോളം പേരുകൾക്ക് ആട്രിബ്യൂട്ട് ['a', 'b', 'c', 'd', 'e']. അവസാനമായി, ഞങ്ങൾ അപ്ഡേറ്റ് ചെയ്ത DataFrame ഉപയോഗിച്ച് പ്രദർശിപ്പിക്കുന്നു print(df), ഇത് പുതിയ കോളം പേരുകൾ കാണിക്കുന്നു. പഴയ പേരുകൾ പുതിയ പേരുകളിലേക്ക് വ്യക്തവും നേരിട്ടുള്ളതുമായ മാപ്പിംഗ് ഉള്ളപ്പോൾ കോളങ്ങളുടെ പേരുമാറ്റാൻ ഈ രീതി ലളിതവും കാര്യക്ഷമവുമാണ്.

രണ്ടാമത്തെ സ്ക്രിപ്റ്റിൽ, ഞങ്ങൾ പാണ്ടാസ് ലൈബ്രറിയും ഇറക്കുമതി ചെയ്യുകയും രണ്ട് ലിസ്റ്റുകൾ നിർവ്വചിക്കുകയും ചെയ്യുന്നു: original_columns ഒപ്പം new_columns, യഥാക്രമം യഥാർത്ഥ, പുതിയ കോളം പേരുകൾ ഉൾക്കൊള്ളുന്നു. തുടർന്ന് ഞങ്ങൾ ഒരു ഡാറ്റാഫ്രെയിം ഉണ്ടാക്കുന്നു pd.DataFrame() ഡാറ്റയും യഥാർത്ഥ കോളം പേരുകളും സഹിതം. നിരകളുടെ പേരുമാറ്റാൻ, ഞങ്ങൾ ഉപയോഗിക്കുന്നു rename() ഡാറ്റ ഫ്രെയിമിൻ്റെ രീതി. ഈ രീതി ഉപയോഗിച്ച് സൃഷ്ടിച്ച പഴയ കോളം പേരുകൾ പുതിയ കോളം പേരുകളിലേക്ക് മാപ്പ് ചെയ്യുന്ന ഒരു നിഘണ്ടു എടുക്കുന്നു dict(zip(original_columns, new_columns)). ദി inplace=True ഒരു പുതിയ ഡാറ്റാഫ്രെയിം തിരികെ നൽകാതെ തന്നെ ഡാറ്റാഫ്രെയിം പരിഷ്കരിച്ചിട്ടുണ്ടെന്ന് ആർഗ്യുമെൻ്റ് ഉറപ്പാക്കുന്നു. അപ്‌ഡേറ്റ് ചെയ്‌ത ഡാറ്റാഫ്രെയിം പ്രദർശിപ്പിക്കുക എന്നതാണ് അവസാന ഘട്ടം print(df). നിങ്ങൾക്ക് കോളങ്ങളുടെ പേരുമാറ്റേണ്ടിവരുമ്പോൾ അല്ലെങ്കിൽ നേരിട്ടുള്ള അസൈൻമെൻ്റ് പ്രായോഗികമല്ലാത്ത വലിയ ഡാറ്റാഫ്രെയിമുകൾ കൈകാര്യം ചെയ്യുമ്പോൾ ഈ രീതി പ്രത്യേകിച്ചും ഉപയോഗപ്രദമാണ്.

ഒരു Pandas DataFrame-ൽ കോളം പേരുകൾ മാറ്റുന്നു

പാണ്ടകൾക്കൊപ്പം പൈത്തൺ ഉപയോഗിക്കുന്നു

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

പാണ്ടസിലെ ഡാറ്റാഫ്രെയിം കോളം ലേബലുകൾ അപ്‌ഡേറ്റ് ചെയ്യുന്നു

പൈത്തൺ സ്ക്രിപ്റ്റ് പാണ്ടാസ് ലൈബ്രറി ഉപയോഗപ്പെടുത്തുന്നു

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

ഡാറ്റാഫ്രെയിം കോളങ്ങൾ പുനർനാമകരണം ചെയ്യുന്നതിനുള്ള വിപുലമായ സാങ്കേതിക വിദ്യകൾ

ഒരു Pandas DataFrame-ലെ കോളങ്ങളുടെ അടിസ്ഥാന പുനർനാമകരണത്തിനപ്പുറം, വ്യത്യസ്‌ത സാഹചര്യങ്ങളിൽ വളരെ ഉപയോഗപ്രദമാകുന്ന നൂതന സാങ്കേതിക വിദ്യകളുണ്ട്. ഉദാഹരണത്തിന്, ചിലപ്പോൾ നിങ്ങൾ ഒരു പ്രത്യേക പാറ്റേൺ അല്ലെങ്കിൽ വ്യവസ്ഥയെ അടിസ്ഥാനമാക്കി നിരകളുടെ പേരുമാറ്റേണ്ടി വന്നേക്കാം. അത്തരം സന്ദർഭങ്ങളിൽ, നിങ്ങൾക്ക് ലിസ്റ്റ് കോംപ്രിഹെൻഷനുകൾ ഉപയോഗിക്കാം map() ആവശ്യമുള്ള ഫലങ്ങൾ നേടുന്നതിന് ലാംഡ ഫംഗ്ഷനുകളുമായി സംയോജിപ്പിച്ച പ്രവർത്തനം. ഈ സമീപനം കൂടുതൽ ചലനാത്മകവും വഴക്കമുള്ളതുമായ കോളം പുനർനാമകരണം അനുവദിക്കുന്നു. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് കോളം പേരുകളിൽ നിന്ന് നിർദ്ദിഷ്ട പ്രതീകങ്ങൾ നീക്കംചെയ്യാം അല്ലെങ്കിൽ എല്ലാ പേരുകളും ചെറിയക്ഷരത്തിലേക്ക് പരിവർത്തനം ചെയ്യുന്നത് പോലുള്ള പരിവർത്തനങ്ങൾ പ്രയോഗിക്കാം.

ഡാറ്റ ഇറക്കുമതി ചെയ്യുന്ന സമയത്ത് കോളങ്ങളുടെ പേരുമാറ്റുന്നത് മറ്റൊരു വിപുലമായ സാങ്കേതികതയിൽ ഉൾപ്പെടുന്നു. CSV ഫയലുകളിൽ നിന്ന് ഡാറ്റ ലോഡ് ചെയ്യുമ്പോൾ, നിങ്ങൾക്ക് ഇത് ഉപയോഗിക്കാം names പരാമീറ്റർ ഇൻ pd.read_csv() പുതിയ കോളം പേരുകൾ വ്യക്തമാക്കാൻ. പൊരുത്തമില്ലാത്തതോ നഷ്‌ടമായതോ ആയ തലക്കെട്ടുകളുള്ള ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ ഇത് പ്രത്യേകിച്ചും ഉപയോഗപ്രദമാകും. കൂടാതെ, നിങ്ങൾക്ക് ഉപയോഗിക്കാം header നിലവിലുള്ള തലക്കെട്ടുകൾ ഒഴിവാക്കി നിങ്ങളുടേത് നിയോഗിക്കുന്നതിനുള്ള പരാമീറ്റർ. ഈ രീതികൾ ഡാറ്റാ ലോഡിംഗ് ഘട്ടം മുതൽ കോളം നാമകരണ പ്രശ്‌നങ്ങൾ പരിഹരിച്ചുകൊണ്ട് ഡാറ്റ ക്ലീനിംഗ് പ്രക്രിയയെ കാര്യക്ഷമമാക്കുന്നു, തുടർന്നുള്ള ഡാറ്റ കൃത്രിമത്വം കൂടുതൽ കാര്യക്ഷമമാക്കുന്നു.

ഡാറ്റാഫ്രെയിം കോളങ്ങളുടെ പേരുമാറ്റുന്നതിനെക്കുറിച്ചുള്ള പൊതുവായ ചോദ്യങ്ങളും ഉത്തരങ്ങളും

  1. ഒരു ഡാറ്റാഫ്രെയിമിലെ ഒരു കോളത്തിൻ്റെ പേരുമാറ്റുന്നത് എങ്ങനെ?
  2. ഉപയോഗിക്കുക rename() പഴയതും പുതിയതുമായ നിരകളുടെ പേരുകൾ വ്യക്തമാക്കുന്ന ഒരു നിഘണ്ടുവോടുകൂടിയ രീതി.
  3. ഒരു CSV ഫയൽ വായിക്കുമ്പോൾ എനിക്ക് കോളങ്ങളുടെ പേരുമാറ്റാൻ കഴിയുമോ?
  4. അതെ, ഉപയോഗിക്കുക names പരാമീറ്റർ ഇൻ pd.read_csv() പുതിയ കോളം പേരുകൾ സജ്ജമാക്കാൻ.
  5. എല്ലാ കോളം പേരുകളിൽ നിന്നും പ്രത്യേക പ്രതീകങ്ങൾ എങ്ങനെ നീക്കംചെയ്യാം?
  6. ഒരു ലിസ്റ്റ് കോംപ്രഹെൻഷൻ ഉപയോഗിക്കുക അല്ലെങ്കിൽ map() നിരയുടെ പേരുകൾ പരിഷ്കരിക്കുന്നതിന് ഒരു ലാംഡ ഉപയോഗിച്ച് പ്രവർത്തിക്കുക.
  7. കോളങ്ങളുടെ സ്ഥാനങ്ങൾ അനുസരിച്ച് പേരുമാറ്റാൻ കഴിയുമോ?
  8. അതെ, നിങ്ങൾക്ക് ഡാറ്റാഫ്രെയിമുകൾ ഉപയോഗിക്കാം columns ഇൻഡക്‌സ് ചെയ്‌ത് പുതിയ പേരുകൾ നൽകി ആട്രിബ്യൂട്ട് ചെയ്യുക.
  9. വ്യവസ്ഥകളെ അടിസ്ഥാനമാക്കി എനിക്ക് കോളങ്ങളുടെ പേര് മാറ്റണമെങ്കിൽ എന്തുചെയ്യും?
  10. നിരയുടെ പേരുകൾ സജ്ജീകരിക്കുന്നതിന് ഒരു ലിസ്റ്റ് കോംപ്രഹെൻഷനിലോ ലാംഡ ഫംഗ്ഷനിലോ സോപാധിക ലോജിക് ഉപയോഗിക്കുക.
  11. യഥാർത്ഥ ഡാറ്റാഫ്രെയിമിൽ എൻ്റെ മാറ്റങ്ങൾ ബാധകമാണെന്ന് എനിക്ക് എങ്ങനെ ഉറപ്പാക്കാനാകും?
  12. ഉപയോഗിക്കുക inplace=True കൂടെ പരാമീറ്റർ rename() രീതി.
  13. വൈറ്റ്‌സ്‌പേസ് നീക്കം ചെയ്യാൻ എനിക്ക് കോളങ്ങളുടെ പേരുമാറ്റാൻ കഴിയുമോ?
  14. അതെ, കോളത്തിൻ്റെ പേരുകളിൽ നിന്ന് വൈറ്റ്‌സ്‌പെയ്‌സ് നീക്കം ചെയ്യാൻ ഒരു ലിസ്റ്റ് കോംപ്രഹെൻഷൻ ഉപയോഗിക്കുക.
  15. ഒരു ഡാറ്റാഫ്രെയിമിലെ നിലവിലെ കോളം പേരുകൾ എങ്ങനെ പരിശോധിക്കാം?
  16. ആക്സസ് ചെയ്യുക columns കോളത്തിൻ്റെ പേരുകൾ കാണുന്നതിന് ഡാറ്റാഫ്രെയിമിൻ്റെ ആട്രിബ്യൂട്ട്.
  17. DataFrame ഫിൽട്ടർ ചെയ്ത ശേഷം എനിക്ക് കോളങ്ങളുടെ പേരുമാറ്റാൻ കഴിയുമോ?
  18. അതെ, ഫിൽട്ടർ ചെയ്തതിന് ശേഷവും കോളങ്ങളുടെ പേരുമാറ്റം ഏത് ഘട്ടത്തിലും ചെയ്യാവുന്നതാണ്.
  19. ഒരു മൾട്ടി-ഇൻഡക്സ് ഡാറ്റാഫ്രെയിമിലെ കോളങ്ങളുടെ പേരുമാറ്റുന്നത് എങ്ങനെ?
  20. ഉപയോഗിക്കുക rename() മൾട്ടി-ഇൻഡക്സ് നിരകൾക്കുള്ള ലെവലും പേരുകളും വ്യക്തമാക്കുന്ന ഒരു നിഘണ്ടുവോടുകൂടിയ രീതി.

കോളം പുനർനാമകരണത്തെക്കുറിച്ചുള്ള അന്തിമ ചിന്തകൾ

ഒരു Pandas DataFrame-ലെ കോളങ്ങളുടെ പേരുമാറ്റുന്നത് ഡാറ്റ പ്രീപ്രോസസിംഗിലെ ഒരു നിർണായക ഘട്ടമാണ്, ഇത് ഡാറ്റാസെറ്റിൻ്റെ വ്യക്തതയിലും പ്രവേശനക്ഷമതയിലും സഹായിക്കുന്നു. നേരിട്ടുള്ള അസൈൻമെൻ്റോ പുനർനാമകരണം() രീതിയോ ഉപയോഗിച്ചാലും, രണ്ട് സമീപനങ്ങളും വ്യത്യസ്ത സാഹചര്യങ്ങൾക്ക് അനുയോജ്യമായ വഴക്കമുള്ള പരിഹാരങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു. ഈ സാങ്കേതികതകളിൽ പ്രാവീണ്യം നേടുന്നതിലൂടെ, ഡാറ്റ കൃത്രിമത്വം കൂടുതൽ അവബോധജന്യമായിത്തീരുന്നു, മെച്ചപ്പെട്ട ഡാറ്റാ വിശകലനവും ക്ലീനർ കോഡും സുഗമമാക്കുന്നു. നൂതനമായ രീതികൾ പ്രക്രിയയെ കൂടുതൽ കാര്യക്ഷമമാക്കുന്നു, ഇത് ഏതൊരു ഡാറ്റാ സയൻ്റിസ്റ്റിനും അനലിസ്റ്റിനും അത്യന്താപേക്ഷിതമായ ഒരു നൈപുണ്യമാക്കി മാറ്റുന്നു.