à¤à¥ à¤¬à¥à¤ à¤à¥à¤¯à¤¾ à¤à¤à¤¤à¤° à¤¹à¥ iterrows() à¤à¤° itertuples()?

पायथन में पांडास

Louis Robert

शुक्रवार, 21 जून 2024 को 10:21:52 pm

पंडों में पंक्ति पुनरावृत्ति को समझना

पायथन में डेटा के साथ काम करते समय, पांडा लाइब्रेरी डेटा हेरफेर और विश्लेषण के लिए शक्तिशाली उपकरण प्रदान करती है। एक सामान्य कार्य कॉलम नामों द्वारा अलग-अलग तत्वों तक पहुंचने और संसाधित करने के लिए डेटाफ़्रेम की पंक्तियों पर पुनरावृत्ति करना है। यह मार्गदर्शिका आपको यह समझने में मदद करेगी कि इसे आसानी से कैसे पूरा किया जाए।

हम व्यावहारिक उदाहरणों और स्पष्टीकरणों सहित पांडास डेटाफ़्रेम में पंक्ति पुनरावृत्ति के लिए विभिन्न तरीकों का पता लगाएंगे। अंत तक, आपको अपनी परियोजनाओं में इन विधियों का प्रभावी ढंग से उपयोग करने की स्पष्ट समझ होगी।

आज्ञा	विवरण
iterrows()	एक पुनरावर्तक उत्पन्न करता है जो डेटाफ़्रेम में प्रत्येक पंक्ति के लिए सूचकांक और पंक्ति डेटा उत्पन्न करता है।
itertuples()	डेटाफ़्रेम पंक्तियों के नेमटुपल्स उत्पन्न करने वाला एक पुनरावर्तक लौटाता है, जो तेज़ पंक्ति पुनरावृत्ति प्रदान करता है।
apply()	डेटाफ़्रेम के निर्दिष्ट अक्ष (पंक्तियों या स्तंभों) के साथ एक फ़ंक्शन लागू करता है।
axis	अक्ष को निर्दिष्ट करने के लिए लागू() फ़ंक्शन में एक पैरामीटर, कॉलम के लिए 0 और पंक्तियों के लिए 1।
enumerate()	पुनरावृत्त होने पर सूचकांक प्राप्त करने के लिए उपयोगी, पुनरावृत्त में एक काउंटर जोड़ता है।
f-string	घुंघराले ब्रेसिज़ {} का उपयोग करके स्ट्रिंग अक्षर के अंदर अभिव्यक्तियों को एम्बेड करने के लिए पायथन में एक फ़ॉर्मेटिंग सिंटैक्स।

पांडा के साथ पंक्तियों को दोहराना: विधियों की व्याख्या

प्रदान की गई स्क्रिप्ट पांडा डेटाफ़्रेम में पंक्तियों को पुनरावृत्त करने के लिए विभिन्न तरीकों को प्रदर्शित करती है। पहली विधि का उपयोग करता है iterrows() फ़ंक्शन, जो एक पुनरावर्तक उत्पन्न करता है जो प्रत्येक पंक्ति के लिए सूचकांक और पंक्ति डेटा उत्पन्न करता है। यह विधि आपको पंक्ति तत्वों को उनके कॉलम नामों से एक्सेस करने की अनुमति देती है, जिससे विशिष्ट मानों को प्रिंट करना या उनमें हेरफेर करना आसान हो जाता है। दूसरी विधि, का उपयोग कर itertuples(), समान है लेकिन प्रत्येक पंक्ति के लिए नेमटुपल्स लौटाकर बेहतर प्रदर्शन प्रदान करता है। यह दृष्टिकोण तेज़ है क्योंकि यह प्रत्येक पंक्ति के लिए एक श्रृंखला ऑब्जेक्ट उत्पन्न करने के ओवरहेड से बचाता है, जो विशेष रूप से बड़े डेटासेट के लिए फायदेमंद है।

एक और तरीका दिखाया गया है apply() फ़ंक्शन, जो डेटाफ़्रेम के दिए गए अक्ष के साथ एक निर्दिष्ट फ़ंक्शन लागू करता है। अक्ष पैरामीटर को 1 पर सेट करके, फ़ंक्शन प्रत्येक पंक्ति पर लागू किया जाता है। यह विधि बहुमुखी है, जो आपको पंक्ति-वार संचालन के लिए कस्टम फ़ंक्शन को परिभाषित करने की अनुमति देती है। अंत में, का उपयोग enumerate() साथ iterrows() पुनरावृत्ति के दौरान पंक्ति सूचकांक का ट्रैक रखने का एक तरीका प्रदान करता है। यह उन कार्यों के लिए उपयोगी हो सकता है जिनके लिए पंक्ति संख्या की आवश्यकता होती है या अधिक जटिल संचालन के लिए जहां डेटाफ़्रेम में स्थिति मायने रखती है। साथ में, ये विधियाँ प्रदर्शन और कार्यक्षमता के आधार पर विभिन्न आवश्यकताओं को पूरा करते हुए, डेटाफ़्रेम पंक्तियों पर पुनरावृत्ति के लिए विकल्पों की एक श्रृंखला प्रदान करती हैं।

पांडास डेटाफ़्रेम में पंक्तियों को पुनरावृत्त करने के लिए iterrows() का उपयोग करना

पंडों की लाइब्रेरी के साथ पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using iterrows()
for index, row in df.iterrows():
    print(row['c1'], row['c2'])

# Output:
# 10 100
# 11 110
# 12 120

बेहतर प्रदर्शन के लिए itertuples() के साथ पुनरावृत्ति

पंडों की लाइब्रेरी के साथ पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using itertuples()
for row in df.itertuples():
    print(row.c1, row.c2)

# Output:
# 10 100
# 11 110
# 12 120

डेटाफ़्रेम अप्लाई() विधि से पंक्तियों तक पहुँचना

पंडों की लाइब्रेरी के साथ पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Define a function to apply to each row
def print_row(row):
    print(row['c1'], row['c2'])

# Apply the function to each row
df.apply(print_row, axis=1)

# Output:
# 10 100
# 11 110
# 12 120

DataFrame.iterrows() और Enumerate का उपयोग करना

पंडों की लाइब्रेरी के साथ पायथन

import pandas as pd

# Create a sample DataFrame
data = {'c1': [10, 11, 12], 'c2': [100, 110, 120]}
df = pd.DataFrame(data)

# Iterate over rows using iterrows() and enumerate()
for i, (index, row) in enumerate(df.iterrows()):
    print(f'Index: {index}, Row {i}: {row["c1"]}, {row["c2"]}')

# Output:
# Index: 0, Row 0: 10, 100
# Index: 1, Row 1: 11, 110
# Index: 2, Row 2: 12, 120

पांडा में पंक्ति पुनरावृत्ति के लिए अतिरिक्त तरीकों की खोज

जैसे आम तौर पर इस्तेमाल किये जाने वाले तरीकों से परे iterrows() और itertuples(), पांडा में डेटाफ़्रेम पंक्तियों पर पुनरावृत्ति के लिए अन्य तकनीकें उपलब्ध हैं। ऐसी ही एक विधि का उपयोग किया जा रहा है iloc अनुक्रमणिका. iloc इंडेक्सर आपको पूर्णांक-स्थान आधारित अनुक्रमण द्वारा पंक्तियों और स्तंभों तक पहुंचने की अनुमति देता है, जिससे यह पुनरावृत्ति के लिए एक शक्तिशाली उपकरण बन जाता है। यह विधि विशेष रूप से तब उपयोगी होती है जब आपको विशिष्ट पंक्तियों या स्तंभों को श्रृंखला या नेमटुपल्स में परिवर्तित किए बिना संचालन करने की आवश्यकता होती है। के साथ संयोजन में एक लूप का उपयोग करके iloc, आप पंक्ति तत्वों तक कुशलतापूर्वक पहुंच और हेरफेर कर सकते हैं।

एक अन्य दृष्टिकोण में का उपयोग करना शामिल है DataFrame.query() पुनरावृत्ति से पहले विशिष्ट स्थितियों के आधार पर पंक्तियों को फ़िल्टर करने की विधि। यह विधि SQL-जैसी क्वेरी सिंटैक्स का उपयोग करके संक्षिप्त और पठनीय डेटा फ़िल्टरिंग की अनुमति देती है। डेटाफ़्रेम को फ़िल्टर करने के बाद, आप फ़िल्टर की गई पंक्तियों को संसाधित करने के लिए पहले चर्चा की गई किसी भी पुनरावृत्ति विधि का उपयोग कर सकते हैं। इसके अतिरिक्त, अधिक जटिल डेटा परिवर्तनों और पुनरावृत्तियों के लिए पायथन में सूची समझ को पांडा संचालन के साथ जोड़ा जा सकता है। ये उन्नत तकनीकें अधिक लचीलापन और दक्षता प्रदान करती हैं, खासकर जब बड़े डेटासेट या जटिल डेटा हेरफेर कार्यों से निपटते हैं।

पंडों में पंक्तियों की पुनरावृत्ति के बारे में सामान्य प्रश्न

डेटाफ़्रेम पंक्तियों पर पुनरावृति करने का सबसे प्रभावी तरीका क्या है?
itertuples() विधि आम तौर पर पंक्तियों को दोहराने के लिए सबसे अधिक कुशल होती है क्योंकि यह प्रत्येक पंक्ति के लिए श्रृंखला ऑब्जेक्ट बनाने के ओवरहेड से बचाती है।
पुनरावृति करते समय मैं डेटाफ़्रेम मानों को कैसे संशोधित कर सकता हूँ?
आप उपयोग कर सकते हैं loc या iloc डेटाफ़्रेम मानों को सीधे संशोधित करने के लिए अपने लूप के भीतर।
के बीच क्या अंतर है iterrows() और itertuples()?
iterrows() जबकि, प्रत्येक पंक्ति को एक श्रृंखला के रूप में लौटाता है itertuples() प्रत्येक पंक्ति को नामांकितटुपल के रूप में लौटाता है, जो तेज़ और अधिक मेमोरी-कुशल है।
क्या मैं डेटाफ़्रेम पंक्तियों के साथ सूची समझ का उपयोग कर सकता हूँ?
हाँ, सूची समझ का उपयोग अधिक संक्षिप्त और कुशल डेटा परिवर्तनों के लिए किया जा सकता है।
मैं पुनरावृत्ति से पहले पंक्तियों को कैसे फ़िल्टर करूँ?
उपयोग query() शर्तों के आधार पर पंक्तियों को फ़िल्टर करने की विधि या बूलियन अनुक्रमण।
क्या केवल विशिष्ट स्तंभों पर ही पुनरावृत्ति करना संभव है?
हां, आप विशिष्ट कॉलमों तक पहुंच कर उन पर पुनरावृति कर सकते हैं df[column_name] आपके पाश के भीतर.
मैं प्रत्येक पंक्ति में एक फ़ंक्शन कैसे लागू करूं?
उपयोग apply() अक्ष पैरामीटर के साथ विधि 1 पर सेट है।
उपयोग करने के प्रदर्शन संबंधी निहितार्थ क्या हैं? iterrows()?
iterrows() की तुलना में धीमी है itertuples() और इसका उपयोग तब किया जाना चाहिए जब प्रदर्शन पर श्रृंखला वस्तुओं की पठनीयता की आवश्यकता हो।

डेटाफ़्रेम पंक्ति पुनरावृत्ति पर अंतिम विचार

पांडास डेटाफ़्रेम में पंक्तियों को पुनरावृत्त करने के विभिन्न तरीकों में महारत हासिल करने से डेटा हेरफेर कार्यों में अधिक लचीलापन और दक्षता प्राप्त होती है। चाहे आप चुनें iterrows() पठनीयता के लिए, itertuples() प्रदर्शन के लिए, या apply() कस्टम फ़ंक्शंस के लिए विधि, इन तकनीकों को समझने से बड़े डेटासेट को प्रभावी ढंग से संभालने की आपकी क्षमता में वृद्धि होगी। यह निर्धारित करने के लिए इन तरीकों का प्रयोग करें कि आपकी विशिष्ट आवश्यकताओं और वर्कफ़्लो के लिए कौन सा सबसे उपयुक्त है।

पायथन में पांडास डेटाफ़्रेम में पंक्तियों पर पुनरावृत्ति

पंडों में पंक्ति पुनरावृत्ति को समझना

पांडा के साथ पंक्तियों को दोहराना: विधियों की व्याख्या

पांडास डेटाफ़्रेम में पंक्तियों को पुनरावृत्त करने के लिए iterrows() का उपयोग करना

बेहतर प्रदर्शन के लिए itertuples() के साथ पुनरावृत्ति

डेटाफ़्रेम अप्लाई() विधि से पंक्तियों तक पहुँचना

DataFrame.iterrows() और Enumerate का उपयोग करना

पांडा में पंक्ति पुनरावृत्ति के लिए अतिरिक्त तरीकों की खोज

पंडों में पंक्तियों की पुनरावृत्ति के बारे में सामान्य प्रश्न

डेटाफ़्रेम पंक्ति पुनरावृत्ति पर अंतिम विचार