पायथनमधील पांडा

Louis Robert

शुक्रवार, २१ जून, २०२४ रोजी १०:४५:१० म.उ.

पांडामधील पंक्ती पुनरावृत्ती समजून घेणे

Python मध्ये डेटासह काम करताना, Pandas लायब्ररी डेटा हाताळणी आणि विश्लेषणासाठी शक्तिशाली साधने ऑफर करते. कॉलम नावांद्वारे वैयक्तिक घटकांमध्ये प्रवेश आणि प्रक्रिया करण्यासाठी डेटाफ्रेमच्या पंक्तींवर पुनरावृत्ती करणे हे एक सामान्य कार्य आहे. हे मार्गदर्शक आपल्याला हे सहजतेने कसे पूर्ण करावे हे समजून घेण्यास मदत करेल.

व्यावहारिक उदाहरणे आणि स्पष्टीकरणांसह, आम्ही पांडा डेटाफ्रेममध्ये पंक्ती पुनरावृत्तीसाठी विविध पद्धती शोधू. शेवटी, तुमच्या स्वतःच्या प्रकल्पांमध्ये या पद्धतींचा प्रभावीपणे वापर कसा करायचा हे तुम्हाला स्पष्टपणे समजेल.

आज्ञा	वर्णन
iterrows()	डेटाफ्रेममधील प्रत्येक पंक्तीसाठी अनुक्रमणिका आणि पंक्ती डेटा मिळवून देणारा एक पुनरावृत्तीकर्ता व्युत्पन्न करतो.
itertuples()	डेटाफ्रेम पंक्तींचे ट्युपल्स नावाचे पुनरावृत्ती देणारे परत करते, जलद पंक्ती पुनरावृत्ती प्रदान करते.
apply()	डेटाफ्रेमच्या निर्दिष्ट अक्षावर (पंक्ती किंवा स्तंभ) फंक्शन लागू करते.
axis	अक्ष निर्दिष्ट करण्यासाठी लागू() फंक्शनमधील पॅरामीटर, स्तंभांसाठी 0 आणि पंक्तींसाठी 1.
enumerate()	पुनरावृत्ती करता येण्याजोगे काउंटर जोडते, पुनरावृत्ती करताना निर्देशांक मिळविण्यासाठी उपयुक्त.
f-string	कुरळे ब्रेसेस {} वापरून स्ट्रिंग लिटरलमध्ये एक्सप्रेशन्स एम्बेड करण्यासाठी पायथनमध्ये फॉरमॅटिंग सिंटॅक्स.

पांडांसह पंक्तींवर पुनरावृत्ती करणे: पद्धती स्पष्ट केल्या

प्रदान केलेल्या स्क्रिप्ट्स पांडा डेटाफ्रेममधील पंक्तींवर पुनरावृत्ती करण्याच्या विविध पद्धती दर्शवतात. पहिली पद्धत वापरते iterrows() फंक्शन, जे प्रत्येक पंक्तीसाठी अनुक्रमणिका आणि पंक्ती डेटा मिळवून देणारा एक इटरेटर व्युत्पन्न करते. ही पद्धत तुम्हाला पंक्ती घटकांना त्यांच्या स्तंभ नावांनुसार प्रवेश करण्याची परवानगी देते, ज्यामुळे विशिष्ट मूल्ये मुद्रित करणे किंवा हाताळणे सोपे होते. दुसरी पद्धत, वापरून १, समान आहे परंतु प्रत्येक पंक्तीसाठी नामित ट्युपल्स परत करून चांगले कार्यप्रदर्शन देते. हा दृष्टीकोन जलद आहे कारण तो प्रत्येक पंक्तीसाठी मालिका ऑब्जेक्ट तयार करण्याचे ओव्हरहेड टाळतो, जे विशेषतः मोठ्या डेटासेटसाठी फायदेशीर आहे.

दर्शविलेली दुसरी पद्धत आहे apply() फंक्शन, जे डेटाफ्रेमच्या दिलेल्या अक्षावर निर्दिष्ट फंक्शन लागू करते. अक्ष पॅरामीटर 1 वर सेट करून, फंक्शन प्रत्येक पंक्तीवर लागू केले जाते. ही पद्धत बहुमुखी आहे, जी तुम्हाला पंक्तीनुसार ऑपरेशन्ससाठी कस्टम फंक्शन्स परिभाषित करण्यास अनुमती देते. शेवटी, चा वापर enumerate() सह iterrows() पुनरावृत्ती दरम्यान पंक्ती निर्देशांकाचा मागोवा ठेवण्याचा मार्ग प्रदान करते. पंक्ती क्रमांक आवश्यक असलेल्या कार्यांसाठी किंवा डेटाफ्रेममधील स्थान महत्त्वाच्या असलेल्या अधिक जटिल ऑपरेशनसाठी हे उपयुक्त ठरू शकते. एकत्रितपणे, या पद्धती डेटाफ्रेम पंक्तींवर पुनरावृत्ती करण्यासाठी, कार्यप्रदर्शन आणि कार्यक्षमतेवर आधारित विविध गरजा पूर्ण करण्यासाठी अनेक पर्याय ऑफर करतात.

पांडा डेटाफ्रेममध्ये पंक्तींवर पुनरावृत्ती करण्यासाठी iterrows() वापरणे

पांडा लायब्ररीसह पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using iterrows()
for index, row in df.iterrows():
    print(row['c1'], row['c2'])

# Output:
# 10 100
# 11 110
# 12 120

उत्तम कामगिरीसाठी itertuples() सह पुनरावृत्ती

पांडा लायब्ररीसह पायथन

१

डेटाफ्रेम लागू() पद्धतीसह पंक्तींमध्ये प्रवेश करणे

पांडा लायब्ररीसह पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Define a function to apply to each row
def print_row(row):
    print(row['c1'], row['c2'])

# Apply the function to each row
df.apply(print_row, axis=1)

# Output:
# 10 100
# 11 110
# 12 120

DataFrame.iterrows() आणि एन्युमरेट वापरणे

पांडा लायब्ररीसह पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using iterrows() and enumerate()
for i, (index, row) in enumerate(df.iterrows()):
    print(f'Index: {index}, Row {i}: {row["c1"]}, {row["c2"]}')

# Output:
# Index: 0, Row 0: 10, 100
# Index: 1, Row 1: 11, 110
# Index: 2, Row 2: 12, 120

पांडांमध्ये पंक्ती पुनरावृत्तीसाठी अतिरिक्त पद्धतींचा शोध घेणे

सारख्या सामान्यतः वापरल्या जाणार्या पद्धतींच्या पलीकडे iterrows() आणि १, Pandas मध्ये DataFrame पंक्तींवर पुनरावृत्ती करण्यासाठी इतर तंत्रे उपलब्ध आहेत. अशी एक पद्धत वापरत आहे ७ इंडेक्सर द ७ इंडेक्सर तुम्हाला त्यांच्या पूर्णांक-स्थान आधारित अनुक्रमणिकेद्वारे पंक्ती आणि स्तंभांमध्ये प्रवेश करण्याची परवानगी देतो, ज्यामुळे ते पुनरावृत्तीसाठी एक शक्तिशाली साधन बनते. ही पद्धत विशेषतः उपयोगी आहे जेव्हा तुम्हाला विशिष्ट पंक्ती किंवा स्तंभांवर ऑपरेशन्स कराव्या लागतात त्यांना मालिका किंवा नावाच्या टुपल्समध्ये रूपांतरित न करता. सह संयोजनात लूप वापरून ७, तुम्ही पंक्ती घटकांमध्ये प्रवेश करू शकता आणि कुशलतेने हाताळू शकता.

दुसर्या दृष्टिकोनात वापरणे समाविष्ट आहे DataFrame.query() पुनरावृत्तीपूर्वी विशिष्ट परिस्थितींवर आधारित पंक्ती फिल्टर करण्याची पद्धत. ही पद्धत SQL सारखी क्वेरी सिंटॅक्स वापरून संक्षिप्त आणि वाचनीय डेटा फिल्टरिंगसाठी परवानगी देते. डेटाफ्रेम फिल्टर केल्यानंतर, तुम्ही फिल्टर केलेल्या पंक्तींवर प्रक्रिया करण्यासाठी आधी चर्चा केलेल्या कोणत्याही पुनरावृत्ती पद्धती वापरू शकता. याव्यतिरिक्त, अधिक जटिल डेटा ट्रान्सफॉर्मेशन आणि पुनरावृत्तीसाठी Python मधील सूची आकलनांना Pandas ऑपरेशन्ससह एकत्र केले जाऊ शकते. ही प्रगत तंत्रे अधिक लवचिकता आणि कार्यक्षमता देतात, विशेषत: मोठ्या डेटासेट किंवा जटिल डेटा हाताळणी कार्ये हाताळताना.

पांडामधील पंक्तींवर पुनरावृत्ती करण्याबद्दल सामान्य प्रश्न

डेटाफ्रेम पंक्तींवर पुनरावृत्ती करण्याचा सर्वात प्रभावी मार्ग कोणता आहे?
द १ पंक्तींवर पुनरावृत्ती करण्यासाठी पद्धत सामान्यतः सर्वात कार्यक्षम असते कारण ती प्रत्येक पंक्तीसाठी मालिका ऑब्जेक्ट्स तयार करण्याचे ओव्हरहेड टाळते.
पुनरावृत्ती करताना मी डेटाफ्रेम मूल्ये कशी सुधारू शकतो?
तुम्ही वापरू शकता loc किंवा ७ थेट डेटाफ्रेम मूल्ये सुधारण्यासाठी तुमच्या लूपमध्ये.
यांच्यात काय फरक आहे iterrows() आणि १?
iterrows() प्रत्येक पंक्ती मालिका म्हणून परत करते, तर १ प्रत्येक पंक्ती nametuple म्हणून परत करते, जे जलद आणि अधिक मेमरी-कार्यक्षम आहे.
मी डेटाफ्रेम पंक्तीसह सूची आकलन वापरू शकतो?
होय, सूची आकलन अधिक संक्षिप्त आणि कार्यक्षम डेटा परिवर्तनासाठी वापरले जाऊ शकते.
पुनरावृत्तीपूर्वी मी पंक्ती कशा फिल्टर करू?
वापरा १८ अटींवर आधारित पंक्ती फिल्टर करण्यासाठी पद्धत किंवा बुलियन अनुक्रमणिका.
केवळ विशिष्ट स्तंभांवर पुनरावृत्ती करणे शक्य आहे का?
होय, तुम्ही विशिष्ट स्तंभ वापरून त्यांचा वापर करून पुनरावृत्ती करू शकता df[column_name] तुमच्या लूपमध्ये.
मी प्रत्येक पंक्तीवर फंक्शन कसे लागू करू?
वापरा apply() अक्ष पॅरामीटर 1 वर सेट केलेली पद्धत.
वापरण्याचे कार्यप्रदर्शन परिणाम काय आहेत iterrows()?
iterrows() च्या तुलनेत हळू आहे १ आणि जेव्हा कार्यप्रदर्शनापेक्षा मालिका ऑब्जेक्ट्सची वाचनीयता आवश्यक असेल तेव्हा वापरली जावी.

डेटाफ्रेम पंक्ती पुनरावृत्तीवर अंतिम विचार

Pandas DataFrame मधील पंक्तींवर पुनरावृत्ती करण्याच्या विविध पद्धतींवर प्रभुत्व मिळवणे डेटा हाताळणीच्या कार्यांमध्ये अधिक लवचिकता आणि कार्यक्षमतेसाठी अनुमती देते. आपण निवडले की नाही iterrows() वाचनीयतेसाठी, १ कामगिरीसाठी, किंवा apply() सानुकूल फंक्शन्ससाठी पद्धत, ही तंत्रे समजून घेतल्याने मोठे डेटासेट प्रभावीपणे हाताळण्याची तुमची क्षमता वाढेल. तुमच्या विशिष्ट आवश्यकता आणि वर्कफ्लो कोणते सर्वात योग्य आहे हे निर्धारित करण्यासाठी या पद्धतींचा प्रयोग करा.

पायथनमधील पांडा डेटाफ्रेममध्ये पंक्तींवर पुनरावृत्ती करणे

पांडामधील पंक्ती पुनरावृत्ती समजून घेणे

पांडांसह पंक्तींवर पुनरावृत्ती करणे: पद्धती स्पष्ट केल्या

पांडा डेटाफ्रेममध्ये पंक्तींवर पुनरावृत्ती करण्यासाठी iterrows() वापरणे

उत्तम कामगिरीसाठी itertuples() सह पुनरावृत्ती

डेटाफ्रेम लागू() पद्धतीसह पंक्तींमध्ये प्रवेश करणे

DataFrame.iterrows() आणि एन्युमरेट वापरणे

पांडांमध्ये पंक्ती पुनरावृत्तीसाठी अतिरिक्त पद्धतींचा शोध घेणे

पांडामधील पंक्तींवर पुनरावृत्ती करण्याबद्दल सामान्य प्रश्न

डेटाफ्रेम पंक्ती पुनरावृत्तीवर अंतिम विचार