à¤¹à¤¾à¤, à¤à¤ªà¤¯à¥à¤ à¤à¤°à¥à¤ isin() à¤¸à¤®à¤¾à¤°à¥à¤¹à¥¤ à¤à¤¦à¤¾à¤¹à¤°à¤£ à¤à¥ à¤²à¤¿à¤, df[df['City'].isin(['Chicago', 'New York'])].

à¤à¤ª à¤à¤ªà¤¯à¥à¤ à¤à¤° à¤¸à¤à¤¤à¥ à¤¹à¥à¤ loc. à¤à¤¦à¤¾à¤¹à¤°à¤£ à¤à¥ à¤²à¤¿à¤, df.loc[df['Age'] > 25, ['Name', 'City']].

कॉलम मानों के आधार पर

Mia Chevalier

मंगलवार, 25 जून 2024 को 2:58:57 pm

पांडा डेटाफ़्रेम में पंक्तियों को फ़िल्टर करना

पांडास डेटा हेरफेर और विश्लेषण के लिए पायथन में एक शक्तिशाली पुस्तकालय है। एक सामान्य कार्य कॉलम मानों के आधार पर डेटाफ़्रेम से पंक्तियों का चयन करना है, SQL के SELECT * FROM Table WHERE column_name = some_value के समान।

यह मार्गदर्शिका आपको पांडा में इसे प्राप्त करने के विभिन्न तरीकों के बारे में बताएगी, जिससे आपके डेटा को कुशलतापूर्वक फ़िल्टर करना आसान हो जाएगा। चाहे आप शुरुआती हों या अनुभवी उपयोगकर्ता, ये युक्तियाँ आपके डेटा प्रबंधन कौशल को बढ़ाएंगी।

आज्ञा	विवरण
pd.DataFrame(data)	डेटा के शब्दकोश से डेटाफ़्रेम बनाता है।
df[column_name]	डेटाफ़्रेम में किसी कॉलम को नाम से एक्सेस करता है।
df[condition]	किसी कॉलम पर लागू शर्त के आधार पर डेटाफ़्रेम को फ़िल्टर करता है।
print(selected_rows)	डेटाफ़्रेम या उसके उपसमूह को कंसोल पर प्रिंट करता है।
df[df['Age'] >df[df['Age'] > 25]	उन पंक्तियों का चयन करता है जहां 'आयु' कॉलम मान 25 से अधिक हैं।
df[df['City'] == 'Chicago']	उन पंक्तियों का चयन करता है जहां 'शहर' कॉलम मान 'शिकागो' के बराबर हैं।

पंडों में डेटाफ़्रेम पंक्ति चयन को समझना

प्रदान की गई स्क्रिप्ट दर्शाती है कि पायथन में पांडा लाइब्रेरी का उपयोग करके कॉलम मानों के आधार पर डेटाफ़्रेम से पंक्तियों का चयन कैसे किया जाए। पहली स्क्रिप्ट पंडों की लाइब्रेरी को आयात करने से शुरू होती है import pandas as pd आज्ञा। इसके बाद यह डेटा के शब्दकोश का उपयोग करके एक नमूना डेटाफ़्रेम बनाता है, जिसे डेटाफ़्रेम में परिवर्तित किया जाता है pd.DataFrame(data) आज्ञा। फिर स्क्रिप्ट पंक्ति चयन के लिए दो तरीकों को दर्शाती है: उन पंक्तियों का चयन करना जहां 'आयु' कॉलम का मान 25 से अधिक है df[df['Age'] > 25], और उन पंक्तियों का चयन करना जहां 'शहर' कॉलम मान 'शिकागो' का उपयोग कर रहा है df[df['City'] == 'Chicago']. ये फ़िल्टर किए गए डेटाफ़्रेम का उपयोग करके मुद्रित किए जाते हैं print() चयनित पंक्तियों को प्रदर्शित करने का कार्य।

दूसरी स्क्रिप्ट एक समान संरचना का अनुसरण करती है लेकिन विभिन्न डेटा और चयन मानदंडों का उपयोग करती है। यह 'उत्पाद', 'मूल्य' और 'स्टॉक' कॉलम सहित उत्पाद जानकारी के साथ एक डेटाफ़्रेम बनाता है। पंक्तियों का चयन वहां किया जाता है जहां 'मूल्य' 200 से कम या उसके बराबर है df[df['Price'] <= 200], और जहां 'स्टॉक' का उपयोग 40 से अधिक है df[df['Stock'] > 40]. इन स्क्रिप्ट्स का उद्देश्य यह दिखाना है कि विशिष्ट स्थितियों के आधार पर डेटाफ़्रेम पंक्तियों को कैसे फ़िल्टर किया जाए, ठीक उसी तरह जैसे आप किसी कॉलम मान के आधार पर किसी तालिका से पंक्तियों का चयन करने के लिए SQL क्वेरी का उपयोग करेंगे। इन आदेशों को समझकर और लागू करके, आप अपने डेटाफ़्रेम में डेटा का कुशलतापूर्वक हेरफेर और विश्लेषण कर सकते हैं।

पांडा में कॉलम मानों का उपयोग करके डेटाफ़्रेम में पंक्तियों का चयन करना

पांडास लाइब्रेरी के साथ पायथन

# Importing the necessary library
import pandas as pd

# Creating a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}
df = pd.DataFrame(data)

# Selecting rows where Age is greater than 25
selected_rows = df[df['Age'] > 25]
print(selected_rows)

# Selecting rows where City is 'Chicago'
chicago_rows = df[df['City'] == 'Chicago']
print(chicago_rows)

कॉलम मानदंड के आधार पर डेटाफ़्रेम में डेटा फ़िल्टर करना

पांडास लाइब्रेरी के साथ पायथन

# Importing pandas library
import pandas as pd

# Creating a sample DataFrame
data = {'Product': ['A', 'B', 'C', 'D', 'E'],
        'Price': [100, 150, 200, 250, 300],
        'Stock': [30, 60, 90, 20, 50]}
df = pd.DataFrame(data)

# Selecting rows where Price is less than or equal to 200
affordable_products = df[df['Price'] <= 200]
print(affordable_products)

# Selecting rows where Stock is more than 40
in_stock = df[df['Stock'] > 40]
print(in_stock)

पांडा में डेटाफ़्रेम पंक्तियों के चयन के लिए उन्नत तकनीकें

बूलियन इंडेक्सिंग का उपयोग करके बुनियादी फ़िल्टरिंग के अलावा, पांडा कॉलम मानों के आधार पर पंक्तियों का चयन करने के लिए उन्नत तकनीक प्रदान करता है। एक शक्तिशाली विधि का उपयोग कर रहा है query() फ़ंक्शन, जो आपको क्वेरी अभिव्यक्ति के साथ पंक्तियों को फ़िल्टर करने की अनुमति देता है, जिससे सिंटैक्स क्लीनर और अक्सर अधिक सहज हो जाता है। उदाहरण के लिए, उपयोग करने के बजाय df[df['Age'] > 25], आप लिख सकते हो df.query('Age > 25'). यह विधि विशेष रूप से तब उपयोगी होती है जब अधिक जटिल परिस्थितियों से निपटते समय या जब स्तंभ नामों में रिक्त स्थान होते हैं। इसके अतिरिक्त, isin() जब आप मानों की सूची के आधार पर पंक्तियों को फ़िल्टर करना चाहते हैं तो फ़ंक्शन फायदेमंद होता है। उदाहरण के लिए, उन पंक्तियों का चयन करने के लिए जहां 'शहर' कॉलम मान या तो 'शिकागो' या 'न्यूयॉर्क' है, आप इसका उपयोग कर सकते हैं df[df['City'].isin(['Chicago', 'New York'])].

एक अन्य तकनीक में शामिल है loc और iloc अनुक्रमणिका. loc इंडेक्सर लेबल-आधारित है, जो आपको पंक्ति लेबल और कॉलम नामों के आधार पर पंक्तियों का चयन करने की अनुमति देता है iloc पूर्णांक-स्थान-आधारित है, जो पंक्ति और स्तंभ संख्याओं द्वारा चयन को सक्षम बनाता है। यह लचीलापन किसी भिन्न कॉलम पर लागू शर्त के आधार पर पंक्तियों का चयन करने के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, df.loc[df['Age'] > 25, 'Name'] 25 वर्ष से अधिक उम्र के व्यक्तियों के नाम वापस कर देगा। ये विधियां पांडा में डेटा को कुशलतापूर्वक संभालने और विश्लेषण करने के लिए आपके टूलकिट का विस्तार करती हैं, और अधिक पठनीय और रखरखाव योग्य कोड प्रदान करती हैं।

डेटाफ़्रेम पंक्तियों के चयन के बारे में सामान्य प्रश्न और उत्तर

मैं अनेक स्थितियों के आधार पर पंक्तियों का चयन कैसे कर सकता हूँ?
आप इसका उपयोग कर सकते हैं query() जैसे तार्किक ऑपरेटरों के साथ कार्य करना या शर्तों को संयोजित करना & और |. उदाहरण के लिए, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
क्या मैं मानों की सूची के आधार पर पंक्तियों को फ़िल्टर कर सकता हूँ?
हाँ, उपयोग करें isin() समारोह। उदाहरण के लिए, df[df['City'].isin(['Chicago', 'New York'])].
के बीच क्या अंतर है loc और iloc?
loc जबकि, लेबल-आधारित है iloc पूर्णांक-स्थान-आधारित है। उपयोग loc पंक्ति/स्तंभ लेबल के साथ और iloc पंक्ति/स्तंभ सूचकांकों के साथ।
पंक्तियों को फ़िल्टर करते समय मैं विशिष्ट कॉलम कैसे चुन सकता हूँ?
आप उपयोग कर सकते हैं loc. उदाहरण के लिए, df.loc[df['Age'] > 25, ['Name', 'City']].
पंक्तियों का चयन करते समय मैं लुप्त मानों को कैसे संभालूँ?
उपयोग dropna() लुप्त मानों वाली पंक्तियों को हटाने का कार्य, या fillna() उन्हें एक निर्दिष्ट मान से बदलने के लिए।
क्या मैं पंक्तियों को फ़िल्टर करने के लिए रेगुलर एक्सप्रेशन का उपयोग कर सकता हूँ?
हां str.contains() के साथ कार्य करें regex=True पैरामीटर आपको रेगेक्स पैटर्न के आधार पर पंक्तियों को फ़िल्टर करने की अनुमति देता है। उदाहरण के लिए, df[df['Name'].str.contains('^A', regex=True)].
मैं अनुक्रमणिका के आधार पर पंक्तियों को कैसे फ़िल्टर करूं?
आप उपयोग कर सकते हैं loc सूचकांक नाम के साथ. उदाहरण के लिए, df.loc[df.index == 'some_index'].
यदि मेरे कॉलम नामों में रिक्त स्थान या विशेष वर्ण हों तो क्या होगा?
उपयोग query() फ़ंक्शन जो ऐसे कॉलम नामों को बैकटिक्स के साथ संभाल सकता है। उदाहरण के लिए, df.query('`column name` == value').

डेटाफ़्रेम पंक्ति चयन तकनीकों पर अंतिम विचार

पांडा में कॉलम मानों के आधार पर डेटाफ़्रेम से पंक्तियों का चयन करना डेटा हेरफेर के लिए एक महत्वपूर्ण कौशल है। बूलियन इंडेक्सिंग सहित विभिन्न तरीकों पर चर्चा की गई, query(), isin(), और लेबल-आधारित और पूर्णांक-स्थान-आधारित अनुक्रमण loc और iloc, डेटा को कुशलतापूर्वक फ़िल्टर करने के लिए शक्तिशाली उपकरण प्रदान करें। इन तकनीकों की महारत बेहतर डेटा विश्लेषण और स्वच्छ, अधिक रखरखाव योग्य कोड को सक्षम बनाती है।

कॉलम मानों के आधार पर पांडा डेटाफ़्रेम में पंक्तियों को कैसे फ़िल्टर करें