Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுதல்

Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுதல்
Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுதல்

பாண்டாஸில் நெடுவரிசை மறுபெயரிடுதலுக்கான அறிமுகம்

Pandas இல் டேட்டாவுடன் பணிபுரியும் போது, ​​DataFrame இன் நெடுவரிசைகளை மிகவும் அர்த்தமுள்ளதாகவும் எளிதாகவும் வேலை செய்ய மறுபெயரிடுவது அவசியம். தரவு செயலாக்கம் மற்றும் பகுப்பாய்வு பணிகளை மிகவும் உள்ளுணர்வு மற்றும் திறமையானதாக மாற்ற இது உதவும்.

இந்தக் கட்டுரையில், Pandas DataFrame இன் நெடுவரிசை லேபிள்களை ['$a', '$b', '$c', '$d', '$e'] இலிருந்து ['a' ஆக மாற்றுவது எப்படி என்பதை ஆராய்வோம். 'b', 'c', 'd', 'e']. தரவு கையாளுதல் மற்றும் சுத்தப்படுத்தும் பணிப்பாய்வுகளில் இந்த எளிய மற்றும் அத்தியாவசிய பணி ஒரு பொதுவான தேவையாகும்.

கட்டளை விளக்கம்
pd.DataFrame() டேட்டாஃப்ரேம் பொருளை உருவாக்குகிறது, இது இரு பரிமாண, அளவு-மாற்றக்கூடிய மற்றும் பெயரிடப்பட்ட அச்சுகளுடன் கூடிய பன்முக அட்டவணை தரவு கட்டமைப்பாகும்.
df.columns DataFrame இன் நெடுவரிசை லேபிள்களை அணுகுகிறது. நெடுவரிசைப் பெயர்களைப் பெற அல்லது அமைக்கப் பயன்படுத்தலாம்.
df.rename() பழைய பெயர்களின் மேப்பிங்கை புதிய பெயர்களுக்கு வழங்குவதன் மூலம் DataFrame இன் நெடுவரிசைப் பெயர்களை மாற்ற உங்களை அனுமதிக்கிறது.
dict(zip()) இரண்டு பட்டியல்களை ஒன்றாக இணைப்பதன் மூலம் அகராதியை உருவாக்குகிறது, அசல் நெடுவரிசைப் பெயர்களை புதிய நெடுவரிசைப் பெயர்களுக்கு வரைபடமாக்க இங்கே பயன்படுத்தப்படுகிறது.
inplace=True மறுபெயரிடும் முறையில் ஒரு வாதம், புதிய டேட்டாஃப்ரேமைத் தராமல், டேட்டாஃப்ரேமை மாற்றியமைக்கிறது.
print(df) கன்சோலில் டேட்டாஃப்ரேமைக் காண்பிக்கும், புதுப்பிக்கப்பட்ட நெடுவரிசைப் பெயர்களைக் காண உங்களை அனுமதிக்கிறது.

ஸ்கிரிப்ட்களின் விரிவான விளக்கம்

மேலே கொடுக்கப்பட்டுள்ள ஸ்கிரிப்டுகள், தரவு கையாளுதலில் பொதுவான பணியான Pandas DataFrame இல் நெடுவரிசைகளை எவ்வாறு மறுபெயரிடுவது என்பதை விளக்குகிறது. முதல் ஸ்கிரிப்ட்டில், பாண்டாஸ் நூலகத்தை இறக்குமதி செய்வதன் மூலம் தொடங்குகிறோம் import pandas as pd. அடுத்து, ஒரு DataFrame ஐப் பயன்படுத்தி உருவாக்குகிறோம் pd.DataFrame() என பெயரிடப்பட்ட நெடுவரிசைகளுடன் '$a', '$b', '$c', '$d', மற்றும் '$e'. இந்த நெடுவரிசைகளை மறுபெயரிட, நாங்கள் நேரடியாக டேட்டாஃப்ரேம்களை அமைக்கிறோம் columns புதிய நெடுவரிசைப் பெயர்களுக்கான பண்பு ['a', 'b', 'c', 'd', 'e']. இறுதியாக, புதுப்பிக்கப்பட்ட DataFrame ஐப் பயன்படுத்தி காண்பிக்கிறோம் print(df), இது புதிய நெடுவரிசைப் பெயர்களைக் காட்டுகிறது. பழைய பெயர்களை புதிய பெயர்களுக்கு தெளிவான மற்றும் நேரடி மேப்பிங் செய்யும் போது, ​​நெடுவரிசைகளை மறுபெயரிடுவதற்கு இந்த முறை நேரடியானது மற்றும் திறமையானது.

இரண்டாவது ஸ்கிரிப்ட்டில், நாங்கள் பாண்டாஸ் நூலகத்தையும் இறக்குமதி செய்து இரண்டு பட்டியல்களை வரையறுக்கிறோம்: original_columns மற்றும் new_columns, இது முறையே அசல் மற்றும் புதிய நெடுவரிசைப் பெயர்களைக் கொண்டுள்ளது. நாம் பயன்படுத்தி DataFrame ஐ உருவாக்குகிறோம் pd.DataFrame() தரவு மற்றும் அசல் நெடுவரிசை பெயர்களுடன். நெடுவரிசைகளை மறுபெயரிட, நாங்கள் பயன்படுத்துகிறோம் rename() DataFrame முறை. இந்த முறை பழைய நெடுவரிசைப் பெயர்களை புதிய நெடுவரிசைப் பெயர்களுக்கு வரைபடமாக்கும் அகராதியை எடுக்கிறது dict(zip(original_columns, new_columns)). தி inplace=True ஒரு புதிய DataFrame ஐத் தராமல், DataFrame மாற்றியமைக்கப்படுவதை வாதம் உறுதி செய்கிறது. புதுப்பிக்கப்பட்ட டேட்டாஃப்ரேமைக் காண்பிப்பதே இறுதிப் படியாகும் print(df). நிரல் ரீதியாக நெடுவரிசைகளை மறுபெயரிட வேண்டியிருக்கும் போது அல்லது பெரிய டேட்டாஃப்ரேம்களைக் கையாளும் போது இந்த முறை மிகவும் பயனுள்ளதாக இருக்கும்.

Pandas DataFrame இல் நெடுவரிசைப் பெயர்களை மாற்றுதல்

பாண்டாக்களுடன் பைத்தானைப் பயன்படுத்துதல்

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({
    '$a': [1, 2, 3],
    '$b': [4, 5, 6],
    '$c': [7, 8, 9],
    '$d': [10, 11, 12],
    '$e': [13, 14, 15]
})
# Rename the columns
df.columns = ['a', 'b', 'c', 'd', 'e']
# Display the DataFrame
print(df)

பாண்டாஸில் டேட்டாஃப்ரேம் நெடுவரிசை லேபிள்களைப் புதுப்பிக்கிறது

பாண்டாஸ் நூலகத்தைப் பயன்படுத்தும் பைதான் ஸ்கிரிப்ட்

import pandas as pd
# Define the original column names
original_columns = ['$a', '$b', '$c', '$d', '$e']
# Define the new column names
new_columns = ['a', 'b', 'c', 'd', 'e']
# Create a DataFrame with the original columns
data = [[1, 4, 7, 10, 13],
        [2, 5, 8, 11, 14],
        [3, 6, 9, 12, 15]]
df = pd.DataFrame(data, columns=original_columns)
# Rename the columns using a dictionary
df.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)
# Show the updated DataFrame
print(df)

டேட்டாஃப்ரேம் நெடுவரிசைகளை மறுபெயரிடுவதற்கான மேம்பட்ட நுட்பங்கள்

Pandas DataFrame இல் உள்ள நெடுவரிசைகளின் அடிப்படை மறுபெயரிடலுக்கு அப்பால், பல்வேறு சூழ்நிலைகளில் மிகவும் பயனுள்ளதாக இருக்கும் மேம்பட்ட நுட்பங்கள் உள்ளன. உதாரணமாக, சில நேரங்களில் நீங்கள் ஒரு குறிப்பிட்ட முறை அல்லது நிபந்தனையின் அடிப்படையில் நெடுவரிசைகளை மறுபெயரிட வேண்டியிருக்கும். இதுபோன்ற சந்தர்ப்பங்களில், நீங்கள் பட்டியல் புரிதல்கள் அல்லது தி map() விரும்பிய முடிவுகளை அடைய லாம்ப்டா செயல்பாடுகளுடன் இணைந்த செயல்பாடு. இந்த அணுகுமுறை அதிக ஆற்றல்மிக்க மற்றும் நெகிழ்வான நெடுவரிசையை மறுபெயரிட அனுமதிக்கிறது. எடுத்துக்காட்டாக, நெடுவரிசைப் பெயர்களில் இருந்து குறிப்பிட்ட எழுத்துக்களை நீக்கலாம் அல்லது எல்லாப் பெயர்களையும் சிற்றெழுத்துக்கு மாற்றுவது போன்ற மாற்றங்களைப் பயன்படுத்தலாம்.

மற்றொரு மேம்பட்ட நுட்பம் தரவை இறக்குமதி செய்யும் போது நெடுவரிசைகளை மறுபெயரிடுவதை உள்ளடக்கியது. CSV கோப்புகளிலிருந்து தரவை ஏற்றும்போது, ​​நீங்கள் இதைப் பயன்படுத்தலாம் names அளவுரு உள்ள pd.read_csv() புதிய நெடுவரிசைப் பெயர்களைக் குறிப்பிட. சீரற்ற அல்லது விடுபட்ட தலைப்புகளைக் கொண்ட தரவைக் கையாளும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். கூடுதலாக, நீங்கள் பயன்படுத்தலாம் header ஏற்கனவே உள்ள தலைப்புகளைத் தவிர்த்து உங்களுக்கானதை ஒதுக்குவதற்கான அளவுரு. இந்த முறைகள் தரவு ஏற்றுதல் நிலையிலிருந்து நெடுவரிசைப் பெயரிடும் சிக்கல்களைத் தீர்ப்பதன் மூலம் தரவுச் சுத்திகரிப்பு செயல்முறையை நெறிப்படுத்துகின்றன, மேலும் அடுத்தடுத்த தரவு கையாளுதலை மிகவும் திறமையானதாக்குகிறது.

DataFrame நெடுவரிசைகளை மறுபெயரிடுவதற்கான பொதுவான கேள்விகள் மற்றும் பதில்கள்

  1. டேட்டாஃப்ரேமில் ஒரு நெடுவரிசையை எவ்வாறு மறுபெயரிடுவது?
  2. பயன்படுத்த rename() பழைய மற்றும் புதிய நெடுவரிசைப் பெயர்களைக் குறிப்பிடும் அகராதியுடன் கூடிய முறை.
  3. CSV கோப்பைப் படிக்கும்போது நெடுவரிசைகளை மறுபெயரிடலாமா?
  4. ஆம், பயன்படுத்தவும் names அளவுரு உள்ள pd.read_csv() புதிய நெடுவரிசைப் பெயர்களை அமைக்க.
  5. அனைத்து நெடுவரிசைப் பெயர்களிலிருந்தும் குறிப்பிட்ட எழுத்துக்களை எவ்வாறு அகற்றுவது?
  6. ஒரு பட்டியல் புரிதலைப் பயன்படுத்தவும் அல்லது map() நெடுவரிசைப் பெயர்களை மாற்ற லாம்ப்டாவுடன் செயல்படும்.
  7. நெடுவரிசைகளை அவற்றின் நிலைகளின் அடிப்படையில் மறுபெயரிட முடியுமா?
  8. ஆம், நீங்கள் DataFrame ஐப் பயன்படுத்தலாம் columns புதிய பெயர்களை அட்டவணைப்படுத்தி ஒதுக்குவதன் மூலம் பண்பு.
  9. நிபந்தனைகளின் அடிப்படையில் நான் நெடுவரிசைகளை மாறும் வகையில் மறுபெயரிட வேண்டுமானால் என்ன செய்வது?
  10. நெடுவரிசைப் பெயர்களை அமைக்க பட்டியல் புரிதல் அல்லது லாம்ப்டா செயல்பாட்டிற்குள் நிபந்தனை தர்க்கத்தைப் பயன்படுத்தவும்.
  11. எனது மாற்றங்கள் அசல் DataFrame இல் பயன்படுத்தப்படுவதை நான் எவ்வாறு உறுதிப்படுத்துவது?
  12. பயன்படுத்த inplace=True உடன் அளவுரு rename() முறை.
  13. இடைவெளியை அகற்ற நெடுவரிசைகளின் பெயரை மாற்றலாமா?
  14. ஆம், நெடுவரிசைப் பெயர்களிலிருந்து இடைவெளியை அகற்ற பட்டியல் புரிதலைப் பயன்படுத்தவும்.
  15. DataFrame இல் தற்போதைய நெடுவரிசைப் பெயர்களை எவ்வாறு சரிபார்க்கலாம்?
  16. அணுகவும் columns நெடுவரிசைப் பெயர்களைக் காண DataFrame இன் பண்புக்கூறு.
  17. DataFrame ஐ வடிகட்டிய பிறகு நான் நெடுவரிசைகளை மறுபெயரிடலாமா?
  18. ஆம், வடிகட்டுதல் உட்பட எந்த நிலையிலும் நெடுவரிசைகளை மறுபெயரிடலாம்.
  19. மல்டி-இன்டெக்ஸ் டேட்டாஃப்ரேமில் நெடுவரிசைகளை எவ்வாறு மறுபெயரிடுவது?
  20. பயன்படுத்த rename() பல குறியீட்டு நெடுவரிசைகளுக்கான நிலை மற்றும் பெயர்களைக் குறிப்பிடும் அகராதியுடன் கூடிய முறை.

நெடுவரிசையின் மறுபெயரிடுதல் பற்றிய இறுதி எண்ணங்கள்

Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுவது, தரவு முன் செயலாக்கத்தில் ஒரு முக்கியமான படியாகும், இது தரவுத்தொகுப்பின் தெளிவு மற்றும் அணுகலுக்கு உதவுகிறது. நேரடி ஒதுக்கீட்டைப் பயன்படுத்தினாலும் அல்லது மறுபெயரிடுதல்() முறையைப் பயன்படுத்தினாலும், இரண்டு அணுகுமுறைகளும் வெவ்வேறு சூழ்நிலைகளுக்கு ஏற்ப நெகிழ்வான தீர்வுகளை வழங்குகின்றன. இந்த நுட்பங்களை மாஸ்டர் செய்வதன் மூலம், தரவு கையாளுதல் மிகவும் உள்ளுணர்வுடன், சிறந்த தரவு பகுப்பாய்வு மற்றும் தூய்மையான குறியீட்டை எளிதாக்குகிறது. மேம்பட்ட முறைகள் செயல்முறையை மேலும் நெறிப்படுத்துகிறது, இது எந்தவொரு தரவு விஞ்ஞானி அல்லது ஆய்வாளருக்கும் இன்றியமையாத திறமையாக அமைகிறது.