Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுதல்

Python

பாண்டாஸில் நெடுவரிசை மறுபெயரிடுதலுக்கான அறிமுகம்

Pandas இல் டேட்டாவுடன் பணிபுரியும் போது, ​​DataFrame இன் நெடுவரிசைகளை மிகவும் அர்த்தமுள்ளதாகவும் எளிதாகவும் வேலை செய்ய மறுபெயரிடுவது அவசியம். தரவு செயலாக்கம் மற்றும் பகுப்பாய்வு பணிகளை மிகவும் உள்ளுணர்வு மற்றும் திறமையானதாக மாற்ற இது உதவும்.

இந்தக் கட்டுரையில், Pandas DataFrame இன் நெடுவரிசை லேபிள்களை ['$a', '$b', '$c', '$d', '$e'] இலிருந்து ['a' ஆக மாற்றுவது எப்படி என்பதை ஆராய்வோம். 'b', 'c', 'd', 'e']. தரவு கையாளுதல் மற்றும் சுத்தப்படுத்தும் பணிப்பாய்வுகளில் இந்த எளிய மற்றும் அத்தியாவசிய பணி ஒரு பொதுவான தேவையாகும்.

கட்டளை விளக்கம்
pd.DataFrame() டேட்டாஃப்ரேம் பொருளை உருவாக்குகிறது, இது இரு பரிமாண, அளவு-மாற்றக்கூடிய மற்றும் பெயரிடப்பட்ட அச்சுகளுடன் கூடிய பன்முக அட்டவணை தரவு கட்டமைப்பாகும்.
df.columns DataFrame இன் நெடுவரிசை லேபிள்களை அணுகுகிறது. நெடுவரிசைப் பெயர்களைப் பெற அல்லது அமைக்கப் பயன்படுத்தலாம்.
df.rename() பழைய பெயர்களின் மேப்பிங்கை புதிய பெயர்களுக்கு வழங்குவதன் மூலம் DataFrame இன் நெடுவரிசைப் பெயர்களை மாற்ற உங்களை அனுமதிக்கிறது.
dict(zip()) இரண்டு பட்டியல்களை ஒன்றாக இணைப்பதன் மூலம் அகராதியை உருவாக்குகிறது, அசல் நெடுவரிசைப் பெயர்களை புதிய நெடுவரிசைப் பெயர்களுக்கு வரைபடமாக்க இங்கே பயன்படுத்தப்படுகிறது.
inplace=True மறுபெயரிடும் முறையில் ஒரு வாதம், புதிய டேட்டாஃப்ரேமைத் தராமல், டேட்டாஃப்ரேமை மாற்றியமைக்கிறது.
print(df) கன்சோலில் டேட்டாஃப்ரேமைக் காண்பிக்கும், புதுப்பிக்கப்பட்ட நெடுவரிசைப் பெயர்களைக் காண உங்களை அனுமதிக்கிறது.

ஸ்கிரிப்ட்களின் விரிவான விளக்கம்

மேலே கொடுக்கப்பட்டுள்ள ஸ்கிரிப்டுகள், தரவு கையாளுதலில் பொதுவான பணியான Pandas DataFrame இல் நெடுவரிசைகளை எவ்வாறு மறுபெயரிடுவது என்பதை விளக்குகிறது. முதல் ஸ்கிரிப்ட்டில், பாண்டாஸ் நூலகத்தை இறக்குமதி செய்வதன் மூலம் தொடங்குகிறோம் . அடுத்து, ஒரு DataFrame ஐப் பயன்படுத்தி உருவாக்குகிறோம் என பெயரிடப்பட்ட நெடுவரிசைகளுடன் , '$b', , , மற்றும் . இந்த நெடுவரிசைகளை மறுபெயரிட, நாங்கள் நேரடியாக டேட்டாஃப்ரேம்களை அமைக்கிறோம் columns புதிய நெடுவரிசைப் பெயர்களுக்கான பண்பு . இறுதியாக, புதுப்பிக்கப்பட்ட DataFrame ஐப் பயன்படுத்தி காண்பிக்கிறோம் , இது புதிய நெடுவரிசைப் பெயர்களைக் காட்டுகிறது. பழைய பெயர்களை புதிய பெயர்களுக்கு தெளிவான மற்றும் நேரடி மேப்பிங் செய்யும் போது, ​​நெடுவரிசைகளை மறுபெயரிடுவதற்கு இந்த முறை நேரடியானது மற்றும் திறமையானது.

இரண்டாவது ஸ்கிரிப்ட்டில், நாங்கள் பாண்டாஸ் நூலகத்தையும் இறக்குமதி செய்து இரண்டு பட்டியல்களை வரையறுக்கிறோம்: மற்றும் , இது முறையே அசல் மற்றும் புதிய நெடுவரிசைப் பெயர்களைக் கொண்டுள்ளது. நாம் பயன்படுத்தி DataFrame ஐ உருவாக்குகிறோம் தரவு மற்றும் அசல் நெடுவரிசை பெயர்களுடன். நெடுவரிசைகளை மறுபெயரிட, நாங்கள் பயன்படுத்துகிறோம் rename() DataFrame முறை. இந்த முறை பழைய நெடுவரிசைப் பெயர்களை புதிய நெடுவரிசைப் பெயர்களுக்கு வரைபடமாக்கும் அகராதியை எடுக்கிறது . தி ஒரு புதிய DataFrame ஐத் தராமல், DataFrame மாற்றியமைக்கப்படுவதை வாதம் உறுதி செய்கிறது. புதுப்பிக்கப்பட்ட டேட்டாஃப்ரேமைக் காண்பிப்பதே இறுதிப் படியாகும் . நிரல் ரீதியாக நெடுவரிசைகளை மறுபெயரிட வேண்டியிருக்கும் போது அல்லது பெரிய டேட்டாஃப்ரேம்களைக் கையாளும் போது இந்த முறை மிகவும் பயனுள்ளதாக இருக்கும்.

Pandas DataFrame இல் நெடுவரிசைப் பெயர்களை மாற்றுதல்

பாண்டாக்களுடன் பைத்தானைப் பயன்படுத்துதல்

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

பாண்டாஸில் டேட்டாஃப்ரேம் நெடுவரிசை லேபிள்களைப் புதுப்பிக்கிறது

பாண்டாஸ் நூலகத்தைப் பயன்படுத்தும் பைதான் ஸ்கிரிப்ட்

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

டேட்டாஃப்ரேம் நெடுவரிசைகளை மறுபெயரிடுவதற்கான மேம்பட்ட நுட்பங்கள்

Pandas DataFrame இல் உள்ள நெடுவரிசைகளின் அடிப்படை மறுபெயரிடலுக்கு அப்பால், பல்வேறு சூழ்நிலைகளில் மிகவும் பயனுள்ளதாக இருக்கும் மேம்பட்ட நுட்பங்கள் உள்ளன. உதாரணமாக, சில நேரங்களில் நீங்கள் ஒரு குறிப்பிட்ட முறை அல்லது நிபந்தனையின் அடிப்படையில் நெடுவரிசைகளை மறுபெயரிட வேண்டியிருக்கும். இதுபோன்ற சந்தர்ப்பங்களில், நீங்கள் பட்டியல் புரிதல்கள் அல்லது தி விரும்பிய முடிவுகளை அடைய லாம்ப்டா செயல்பாடுகளுடன் இணைந்த செயல்பாடு. இந்த அணுகுமுறை அதிக ஆற்றல்மிக்க மற்றும் நெகிழ்வான நெடுவரிசையை மறுபெயரிட அனுமதிக்கிறது. எடுத்துக்காட்டாக, நெடுவரிசைப் பெயர்களில் இருந்து குறிப்பிட்ட எழுத்துக்களை நீக்கலாம் அல்லது எல்லாப் பெயர்களையும் சிற்றெழுத்துக்கு மாற்றுவது போன்ற மாற்றங்களைப் பயன்படுத்தலாம்.

மற்றொரு மேம்பட்ட நுட்பம் தரவை இறக்குமதி செய்யும் போது நெடுவரிசைகளை மறுபெயரிடுவதை உள்ளடக்கியது. CSV கோப்புகளிலிருந்து தரவை ஏற்றும்போது, ​​நீங்கள் இதைப் பயன்படுத்தலாம் அளவுரு உள்ள புதிய நெடுவரிசைப் பெயர்களைக் குறிப்பிட. சீரற்ற அல்லது விடுபட்ட தலைப்புகளைக் கொண்ட தரவைக் கையாளும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். கூடுதலாக, நீங்கள் பயன்படுத்தலாம் ஏற்கனவே உள்ள தலைப்புகளைத் தவிர்த்து உங்களுக்கானதை ஒதுக்குவதற்கான அளவுரு. இந்த முறைகள் தரவு ஏற்றுதல் நிலையிலிருந்து நெடுவரிசைப் பெயரிடும் சிக்கல்களைத் தீர்ப்பதன் மூலம் தரவுச் சுத்திகரிப்பு செயல்முறையை நெறிப்படுத்துகின்றன, மேலும் அடுத்தடுத்த தரவு கையாளுதலை மிகவும் திறமையானதாக்குகிறது.

DataFrame நெடுவரிசைகளை மறுபெயரிடுவதற்கான பொதுவான கேள்விகள் மற்றும் பதில்கள்

  1. டேட்டாஃப்ரேமில் ஒரு நெடுவரிசையை எவ்வாறு மறுபெயரிடுவது?
  2. பயன்படுத்த பழைய மற்றும் புதிய நெடுவரிசைப் பெயர்களைக் குறிப்பிடும் அகராதியுடன் கூடிய முறை.
  3. CSV கோப்பைப் படிக்கும்போது நெடுவரிசைகளை மறுபெயரிடலாமா?
  4. ஆம், பயன்படுத்தவும் அளவுரு உள்ள புதிய நெடுவரிசைப் பெயர்களை அமைக்க.
  5. அனைத்து நெடுவரிசைப் பெயர்களிலிருந்தும் குறிப்பிட்ட எழுத்துக்களை எவ்வாறு அகற்றுவது?
  6. ஒரு பட்டியல் புரிதலைப் பயன்படுத்தவும் அல்லது நெடுவரிசைப் பெயர்களை மாற்ற லாம்ப்டாவுடன் செயல்படும்.
  7. நெடுவரிசைகளை அவற்றின் நிலைகளின் அடிப்படையில் மறுபெயரிட முடியுமா?
  8. ஆம், நீங்கள் DataFrame ஐப் பயன்படுத்தலாம் புதிய பெயர்களை அட்டவணைப்படுத்தி ஒதுக்குவதன் மூலம் பண்பு.
  9. நிபந்தனைகளின் அடிப்படையில் நான் நெடுவரிசைகளை மாறும் வகையில் மறுபெயரிட வேண்டுமானால் என்ன செய்வது?
  10. நெடுவரிசைப் பெயர்களை அமைக்க பட்டியல் புரிதல் அல்லது லாம்ப்டா செயல்பாட்டிற்குள் நிபந்தனை தர்க்கத்தைப் பயன்படுத்தவும்.
  11. எனது மாற்றங்கள் அசல் DataFrame இல் பயன்படுத்தப்படுவதை நான் எவ்வாறு உறுதிப்படுத்துவது?
  12. பயன்படுத்த உடன் அளவுரு முறை.
  13. இடைவெளியை அகற்ற நெடுவரிசைகளின் பெயரை மாற்றலாமா?
  14. ஆம், நெடுவரிசைப் பெயர்களிலிருந்து இடைவெளியை அகற்ற பட்டியல் புரிதலைப் பயன்படுத்தவும்.
  15. DataFrame இல் தற்போதைய நெடுவரிசைப் பெயர்களை எவ்வாறு சரிபார்க்கலாம்?
  16. அணுகவும் நெடுவரிசைப் பெயர்களைக் காண DataFrame இன் பண்புக்கூறு.
  17. DataFrame ஐ வடிகட்டிய பிறகு நான் நெடுவரிசைகளை மறுபெயரிடலாமா?
  18. ஆம், வடிகட்டுதல் உட்பட எந்த நிலையிலும் நெடுவரிசைகளை மறுபெயரிடலாம்.
  19. மல்டி-இன்டெக்ஸ் டேட்டாஃப்ரேமில் நெடுவரிசைகளை எவ்வாறு மறுபெயரிடுவது?
  20. பயன்படுத்த பல குறியீட்டு நெடுவரிசைகளுக்கான நிலை மற்றும் பெயர்களைக் குறிப்பிடும் அகராதியுடன் கூடிய முறை.

Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுவது, தரவு முன் செயலாக்கத்தில் ஒரு முக்கியமான படியாகும், இது தரவுத்தொகுப்பின் தெளிவு மற்றும் அணுகலுக்கு உதவுகிறது. நேரடி ஒதுக்கீட்டைப் பயன்படுத்தினாலும் அல்லது மறுபெயரிடுதல்() முறையைப் பயன்படுத்தினாலும், இரண்டு அணுகுமுறைகளும் வெவ்வேறு சூழ்நிலைகளுக்கு ஏற்ப நெகிழ்வான தீர்வுகளை வழங்குகின்றன. இந்த நுட்பங்களை மாஸ்டர் செய்வதன் மூலம், தரவு கையாளுதல் மிகவும் உள்ளுணர்வுடன், சிறந்த தரவு பகுப்பாய்வு மற்றும் தூய்மையான குறியீட்டை எளிதாக்குகிறது. மேம்பட்ட முறைகள் செயல்முறையை மேலும் நெறிப்படுத்துகிறது, இது எந்தவொரு தரவு விஞ்ஞானி அல்லது ஆய்வாளருக்கும் இன்றியமையாத திறமையாக அமைகிறது.