పాండాస్లో వరుస పునరావృత్తిని అర్థం చేసుకోవడం
పైథాన్లో డేటాతో పని చేస్తున్నప్పుడు, పాండాస్ లైబ్రరీ డేటా మానిప్యులేషన్ మరియు విశ్లేషణ కోసం శక్తివంతమైన సాధనాలను అందిస్తుంది. కాలమ్ పేర్ల ద్వారా వ్యక్తిగత ఎలిమెంట్లను యాక్సెస్ చేయడానికి మరియు ప్రాసెస్ చేయడానికి డేటాఫ్రేమ్ యొక్క అడ్డు వరుసలపై మళ్ళించడం ఒక సాధారణ పని. దీన్ని సులభంగా ఎలా సాధించాలో అర్థం చేసుకోవడానికి ఈ గైడ్ మీకు సహాయం చేస్తుంది.
మేము Pandas DataFrameలో వరుస పునరావృతం కోసం ఆచరణాత్మక ఉదాహరణలు మరియు వివరణలతో సహా వివిధ పద్ధతులను అన్వేషిస్తాము. చివరికి, మీ స్వంత ప్రాజెక్ట్లలో ఈ పద్ధతులను ఎలా సమర్థవంతంగా ఉపయోగించుకోవాలో మీకు స్పష్టమైన అవగాహన ఉంటుంది.
ఆదేశం | వివరణ |
---|---|
iterrows() | డేటాఫ్రేమ్లోని ప్రతి అడ్డు వరుసకు సూచిక మరియు అడ్డు వరుస డేటాను అందించే ఇటరేటర్ను రూపొందిస్తుంది. |
itertuples() | వేగవంతమైన అడ్డు వరుస పునరావృతాన్ని అందించడం ద్వారా డేటాఫ్రేమ్ అడ్డు వరుసల నేమ్టుపుల్లను అందించే ఇటరేటర్ను అందిస్తుంది. |
apply() | డేటాఫ్రేమ్ యొక్క పేర్కొన్న అక్షం (అడ్డు వరుసలు లేదా నిలువు వరుసలు) వెంట ఒక ఫంక్షన్ను వర్తింపజేస్తుంది. |
axis | నిలువు వరుసలకు 0 మరియు అడ్డు వరుసల కోసం 1తో అక్షాన్ని పేర్కొనడానికి apply() ఫంక్షన్లోని పరామితి. |
enumerate() | మళ్ళించేటటువంటి కౌంటర్ను జోడిస్తుంది, పునరావృతం చేస్తున్నప్పుడు సూచికను పొందడానికి ఉపయోగపడుతుంది. |
f-string | కర్లీ బ్రేస్లను {} ఉపయోగించి స్ట్రింగ్ లిటరల్స్ లోపల ఎక్స్ప్రెషన్లను పొందుపరచడానికి పైథాన్లో ఫార్మాటింగ్ సింటాక్స్. |
పాండాలతో వరుసల మీద మళ్ళించడం: పద్ధతులు వివరించబడ్డాయి
అందించిన స్క్రిప్ట్లు పాండాస్ డేటాఫ్రేమ్లో వరుసలపై మళ్లించడానికి వివిధ పద్ధతులను ప్రదర్శిస్తాయి. మొదటి పద్ధతిని ఉపయోగిస్తుంది iterrows() ఫంక్షన్, ఇది ప్రతి అడ్డు వరుసకు సూచిక మరియు వరుస డేటాను అందించే ఇటరేటర్ను ఉత్పత్తి చేస్తుంది. ఈ పద్ధతి వరుస మూలకాలను వాటి కాలమ్ పేర్లతో యాక్సెస్ చేయడానికి మిమ్మల్ని అనుమతిస్తుంది, ఇది నిర్దిష్ట విలువలను ప్రింట్ చేయడం లేదా మార్చడాన్ని సూటిగా చేస్తుంది. రెండవ పద్ధతి, ఉపయోగించడం itertuples(), సారూప్యంగా ఉంటుంది కానీ ప్రతి అడ్డు వరుసకు నేమ్టుపుల్లను తిరిగి ఇవ్వడం ద్వారా మెరుగైన పనితీరును అందిస్తుంది. ఈ విధానం వేగవంతమైనది ఎందుకంటే ఇది ప్రతి అడ్డు వరుస కోసం సిరీస్ ఆబ్జెక్ట్ను రూపొందించే ఓవర్హెడ్ను నివారిస్తుంది, ఇది పెద్ద డేటాసెట్లకు ప్రత్యేకంగా ప్రయోజనకరంగా ఉంటుంది.
చూపిన మరొక పద్ధతి apply() ఫంక్షన్, ఇది డేటాఫ్రేమ్ యొక్క ఇచ్చిన అక్షం వెంట పేర్కొన్న ఫంక్షన్ను వర్తింపజేస్తుంది. అక్షం పరామితిని 1కి సెట్ చేయడం ద్వారా, ప్రతి అడ్డు వరుసకు ఫంక్షన్ వర్తించబడుతుంది. ఈ పద్ధతి బహుముఖమైనది, ఇది వరుసల వారీగా ఆపరేషన్ల కోసం అనుకూల ఫంక్షన్లను నిర్వచించడానికి మిమ్మల్ని అనుమతిస్తుంది. చివరగా, ఉపయోగం enumerate() తో iterrows() పునరావృతం సమయంలో వరుస సూచికను ట్రాక్ చేయడానికి ఒక మార్గాన్ని అందిస్తుంది. అడ్డు వరుస సంఖ్య అవసరమయ్యే టాస్క్లకు లేదా డేటాఫ్రేమ్లోని స్థానం ముఖ్యమైన చోట మరింత క్లిష్టమైన కార్యకలాపాలకు ఇది ఉపయోగపడుతుంది. మొత్తంగా, ఈ పద్ధతులు డేటాఫ్రేమ్ వరుసల ద్వారా పునరావృతం చేయడానికి అనేక రకాల ఎంపికలను అందిస్తాయి, పనితీరు మరియు కార్యాచరణ ఆధారంగా విభిన్న అవసరాలను అందిస్తాయి.
పాండాస్ డేటాఫ్రేమ్లో అడ్డు వరుసల మీద మళ్లించడానికి ఐటెరోస్()ని ఉపయోగించడం
పాండాస్ లైబ్రరీతో పైథాన్
import pandas as pd
# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)
# Iterate over rows using iterrows()
for index, row in df.iterrows():
print(row['c1'], row['c2'])
# Output:
# 10 100
# 11 110
# 12 120
మెరుగైన పనితీరు కోసం itertuples()తో పునరావృతం
పాండాస్ లైబ్రరీతో పైథాన్
import pandas as pd
# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)
# Iterate over rows using itertuples()
for row in df.itertuples():
print(row.c1, row.c2)
# Output:
# 10 100
# 11 110
# 12 120
డేటాఫ్రేమ్ దరఖాస్తు() పద్ధతితో అడ్డు వరుసలను యాక్సెస్ చేయడం
పాండాస్ లైబ్రరీతో పైథాన్
import pandas as pd
# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)
# Define a function to apply to each row
def print_row(row):
print(row['c1'], row['c2'])
# Apply the function to each row
df.apply(print_row, axis=1)
# Output:
# 10 100
# 11 110
# 12 120
DataFrame.iterrows() మరియు ఎన్యూమరేట్ ఉపయోగించడం
పాండాస్ లైబ్రరీతో పైథాన్
import pandas as pd
# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)
# Iterate over rows using iterrows() and enumerate()
for i, (index, row) in enumerate(df.iterrows()):
print(f'Index: {index}, Row {i}: {row["c1"]}, {row["c2"]}')
# Output:
# Index: 0, Row 0: 10, 100
# Index: 1, Row 1: 11, 110
# Index: 2, Row 2: 12, 120
పాండాస్లో వరుస పునరావృతం కోసం అదనపు పద్ధతులను అన్వేషించడం
వంటి సాధారణంగా ఉపయోగించే పద్ధతులకు మించి iterrows() మరియు itertuples(), పాండాస్లో డేటాఫ్రేమ్ అడ్డు వరుసలపై మళ్లించడానికి ఇతర పద్ధతులు అందుబాటులో ఉన్నాయి. అటువంటి పద్ధతిని ఉపయోగించడం iloc సూచిక. ది iloc ఇండెక్సర్ అడ్డు వరుసలు మరియు నిలువు వరుసలను వాటి పూర్ణాంకం-స్థాన ఆధారిత ఇండెక్సింగ్ ద్వారా యాక్సెస్ చేయడానికి మిమ్మల్ని అనుమతిస్తుంది, ఇది పునరావృతం చేయడానికి శక్తివంతమైన సాధనంగా మారుతుంది. మీరు నిర్దిష్ట అడ్డు వరుసలు లేదా నిలువు వరుసలను సిరీస్లుగా లేదా నేమ్టుపుల్లుగా మార్చకుండా వాటిపై ఆపరేషన్లు చేయవలసి వచ్చినప్పుడు ఈ పద్ధతి చాలా ఉపయోగకరంగా ఉంటుంది. కలిపి ఒక లూప్ ఉపయోగించడం ద్వారా iloc, మీరు అడ్డు వరుస మూలకాలను సమర్థవంతంగా యాక్సెస్ చేయవచ్చు మరియు మార్చవచ్చు.
మరొక పద్ధతిని ఉపయోగించడం DataFrame.query() పునరావృతానికి ముందు నిర్దిష్ట పరిస్థితుల ఆధారంగా అడ్డు వరుసలను ఫిల్టర్ చేసే పద్ధతి. ఈ పద్ధతి SQL-వంటి క్వెరీ సింటాక్స్ని ఉపయోగించి సంక్షిప్త మరియు చదవగలిగే డేటా ఫిల్టరింగ్ను అనుమతిస్తుంది. DataFrameని ఫిల్టర్ చేసిన తర్వాత, మీరు ఫిల్టర్ చేసిన అడ్డు వరుసలను ప్రాసెస్ చేయడానికి ముందుగా చర్చించిన ఏదైనా పునరావృత పద్ధతులను ఉపయోగించవచ్చు. అదనంగా, మరింత సంక్లిష్టమైన డేటా పరివర్తనలు మరియు పునరావృతాల కోసం పైథాన్లోని జాబితా కాంప్రహెన్షన్లను పాండాస్ ఆపరేషన్లతో కలపవచ్చు. ఈ అధునాతన పద్ధతులు ఎక్కువ సౌలభ్యం మరియు సామర్థ్యాన్ని అందిస్తాయి, ప్రత్యేకించి పెద్ద డేటాసెట్లు లేదా సంక్లిష్ట డేటా మానిప్యులేషన్ టాస్క్లతో వ్యవహరించేటప్పుడు.
పాండాస్లో వరుసలపై పునరావృతం చేయడం గురించి సాధారణ ప్రశ్నలు
- DataFrame అడ్డు వరుసలలో మళ్ళించడానికి అత్యంత ప్రభావవంతమైన మార్గం ఏమిటి?
- ది itertuples() ఈ పద్ధతి సాధారణంగా అడ్డు వరుసల మీద పునరావృతం చేయడానికి అత్యంత ప్రభావవంతంగా ఉంటుంది, ఎందుకంటే ఇది ప్రతి అడ్డు వరుస కోసం సిరీస్ వస్తువులను సృష్టించే ఓవర్హెడ్ను నివారిస్తుంది.
- మళ్ళిస్తున్నప్పుడు నేను డేటాఫ్రేమ్ విలువలను ఎలా సవరించగలను?
- మీరు ఉపయోగించవచ్చు loc లేదా iloc DataFrame విలువలను నేరుగా సవరించడానికి మీ లూప్లో.
- రెండింటిలో తేడా ఏంటి iterrows() మరియు itertuples()?
- iterrows() ప్రతి అడ్డు వరుసను ఒక శ్రేణి వలె అందిస్తుంది itertuples() ప్రతి అడ్డు వరుసను నేమ్టుపుల్గా అందిస్తుంది, ఇది వేగంగా మరియు మరింత మెమరీ-సమర్థవంతంగా ఉంటుంది.
- నేను డేటాఫ్రేమ్ అడ్డు వరుసలతో జాబితా గ్రహణాలను ఉపయోగించవచ్చా?
- అవును, మరింత కాంపాక్ట్ మరియు సమర్థవంతమైన డేటా పరివర్తనల కోసం జాబితా గ్రహణాలను ఉపయోగించవచ్చు.
- పునరావృతానికి ముందు నేను అడ్డు వరుసలను ఎలా ఫిల్టర్ చేయాలి?
- ఉపయోగించడానికి query() షరతుల ఆధారంగా వరుసలను ఫిల్టర్ చేయడానికి పద్ధతి లేదా బూలియన్ ఇండెక్సింగ్.
- నిర్దిష్ట నిలువు వరుసలపై మాత్రమే పునరావృతం చేయడం సాధ్యమేనా?
- అవును, మీరు నిర్దిష్ట నిలువు వరుసలను ఉపయోగించి వాటిని యాక్సెస్ చేయడం ద్వారా వాటిని మళ్లీ మళ్లీ చెప్పవచ్చు df[column_name] మీ లూప్ లోపల.
- నేను ప్రతి అడ్డు వరుసకు ఒక ఫంక్షన్ను ఎలా వర్తింపజేయగలను?
- ఉపయోగించడానికి apply() అక్షం పరామితితో పద్ధతి 1కి సెట్ చేయబడింది.
- ఉపయోగం యొక్క పనితీరు చిక్కులు ఏమిటి iterrows()?
- iterrows() తో పోలిస్తే నెమ్మదిగా ఉంటుంది itertuples() మరియు పనితీరుపై సిరీస్ వస్తువుల రీడబిలిటీ అవసరమైనప్పుడు ఉపయోగించాలి.
డేటాఫ్రేమ్ వరుస పునరావృతంపై తుది ఆలోచనలు
పాండాస్ డేటాఫ్రేమ్లో అడ్డు వరుసల మీద మళ్లించే వివిధ పద్ధతులపై పట్టు సాధించడం వల్ల డేటా మానిప్యులేషన్ టాస్క్లలో ఎక్కువ సౌలభ్యం మరియు సామర్థ్యాన్ని అనుమతిస్తుంది. మీరు ఎంచుకున్నా iterrows() చదవడానికి, itertuples() పనితీరు కోసం, లేదా apply() కస్టమ్ ఫంక్షన్ల కోసం పద్ధతి, ఈ పద్ధతులను అర్థం చేసుకోవడం పెద్ద డేటాసెట్లను సమర్థవంతంగా నిర్వహించగల మీ సామర్థ్యాన్ని మెరుగుపరుస్తుంది. మీ నిర్దిష్ట అవసరాలు మరియు వర్క్ఫ్లోలకు ఏది బాగా సరిపోతుందో తెలుసుకోవడానికి ఈ పద్ధతులతో ప్రయోగం చేయండి.