पायथनमधील स्तंभ मूल्यांवर आधारित डेटाफ्रेम पंक्ती निवडणे

पायथनमधील स्तंभ मूल्यांवर आधारित डेटाफ्रेम पंक्ती निवडणे
Python

स्तंभ मूल्यांनुसार डेटाफ्रेम फिल्टर करण्यासाठी पांडा वापरणे

Python मध्ये डेटासह काम करताना, Pandas लायब्ररी डेटा हाताळणी आणि विश्लेषणासाठी शक्तिशाली साधने ऑफर करते. विशिष्ट स्तंभातील मूल्यांवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे एक सामान्य कार्य आहे. हे ऑपरेशन SQL क्वेरी सारखे आहे: SELECT * FROM टेबल WHERE column_name = some_value.

या लेखात, आम्ही विविध पद्धती वापरून पांडांमध्ये हे कसे मिळवायचे ते शोधू. तुम्ही एकल मूल्य किंवा अनेक निकषांनुसार फिल्टर करत असाल तरीही, Pandas अशा ऑपरेशन्स हाताळण्यासाठी अंतर्ज्ञानी आणि कार्यक्षम मार्ग प्रदान करते. चला तपशीलात जाऊया.

आज्ञा वर्णन
pd.DataFrame() शब्दकोश किंवा इतर डेटा स्ट्रक्चर्समधून डेटाफ्रेम ऑब्जेक्ट तयार करते.
df[condition] डेटाफ्रेम पंक्ती एका अटीवर आधारित फिल्टर करते, जे फक्त निकष पूर्ण करतात ते परत करतात.
print() कन्सोलवर निर्दिष्ट संदेश किंवा डेटाफ्रेम आउटपुट करते.
df['column'] == value पंक्ती फिल्टर करण्यासाठी वापरलेली बुलियन मालिका तयार करते जेथे स्तंभ निर्दिष्ट मूल्याशी जुळतो.
df['column'] >df['column'] > value पंक्ती फिल्टर करण्यासाठी वापरलेली बुलियन मालिका तयार करते जेथे स्तंभ मूल्ये निर्दिष्ट मूल्यापेक्षा जास्त आहेत.
# Comment कोडमध्ये स्पष्टीकरण किंवा नोट्स जोडण्यासाठी वापरले जाते, जे स्क्रिप्टचा भाग म्हणून कार्यान्वित केले जात नाहीत.

पांडामध्ये डेटाफ्रेम पंक्ती निवड लागू करणे

प्रदान केलेल्या स्क्रिप्ट्समध्ये, मुख्य कार्य म्हणजे विशिष्ट स्तंभ मूल्यांवर आधारित डेटाफ्रेममधून पंक्ती फिल्टर करणे, डेटा विश्लेषणामध्ये एक सामान्य आवश्यकता आहे. पहिली स्क्रिप्ट पांडा लायब्ररी आयात करून सुरू होते import pandas as pd. हे अत्यावश्यक आहे कारण पायथनमधील पांडस एक शक्तिशाली डेटा मॅनिप्युलेशन लायब्ररी आहे. पुढे, आम्ही वापरून नमुना डेटाफ्रेम तयार करतो नावे, वयोगट आणि शहरांसाठी डेटा असलेल्या शब्दकोशासह. ही रचना आम्हाला टॅब्युलर डेटा सहजपणे दृश्यमान आणि हाताळण्यास अनुमती देते. स्क्रिप्टचा महत्त्वाचा भाग म्हणजे जिथे आपण वापरून पंक्ती फिल्टर करतो df[df['city'] == 'New York']. हा आदेश सर्व पंक्ती निवडतो जेथे शहर स्तंभाचे मूल्य 'न्यूयॉर्क' आहे. परिणाम व्हेरिएबलमध्ये संग्रहित केला जातो ny_rows, जे नंतर फिल्टर केलेले डेटाफ्रेम प्रदर्शित करण्यासाठी मुद्रित केले जाते.

दुसरी स्क्रिप्ट सारख्याच संरचनेचे अनुसरण करते परंतु अंकीय स्थितीवर आधारित पंक्ती फिल्टर करण्यावर लक्ष केंद्रित करते. पांडा आयात केल्यानंतर आणि उत्पादन, किंमत आणि प्रमाण स्तंभांसह डेटाफ्रेम तयार केल्यानंतर, स्क्रिप्ट वापरते df[df['price'] > 150] पंक्ती फिल्टर करण्यासाठी जिथे किंमत 150 पेक्षा जास्त आहे. ही कमांड मूळ डेटाफ्रेमचा एक उपसंच तयार करते ज्यामध्ये फक्त निर्दिष्ट अटी पूर्ण करणाऱ्या पंक्ती असतात. परिणाम मध्ये संग्रहित आहे आणि पडताळणीसाठी मुद्रित केले. दोन्ही स्क्रिप्ट डेटा हाताळण्यासाठी पांडाची शक्ती आणि साधेपणा दर्शवतात. बुलियन इंडेक्सिंगचा वापर करून, एक पद्धत जिथे आम्ही डेटा फिल्टर करण्यासाठी सत्य/असत्य मूल्यांची मालिका पास करतो, आम्ही विविध परिस्थितींवर आधारित डेटाचे उपसंच कार्यक्षमतेने निवडू शकतो, ज्यामुळे ते डेटा विश्लेषक आणि शास्त्रज्ञांसाठी एक अमूल्य साधन बनते.

स्तंभ मूल्यांवर आधारित डेटाफ्रेममध्ये पंक्ती फिल्टर करणे

पायथन - डेटाफ्रेम ऑपरेशन्ससाठी पांडा वापरणे

import pandas as pd
# Create a sample DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'age': [24, 27, 22, 32, 29],
    'city': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)

# Select rows where city is New York
ny_rows = df[df['city'] == 'New York']
print(ny_rows)

# Output:
#       name  age      city
# 0    Alice   24  New York
# 2  Charlie   22  New York

स्तंभ मूल्यांवर आधारित डेटाफ्रेम पंक्तींची क्वेरी करत आहे

पायथन - पांडांसह प्रगत फिल्टरिंग

डेटाफ्रेम पंक्ती निवडण्यासाठी प्रगत तंत्रे

बुलियन इंडेक्सिंगसह मूलभूत फिल्टरिंग व्यतिरिक्त, पांडा स्तंभ मूल्यांवर आधारित पंक्ती निवडण्यासाठी अधिक प्रगत तंत्र ऑफर करते. अशी एक पद्धत आहे query() फंक्शन, जे तुम्हाला डेटाफ्रेम पंक्ती फिल्टर करण्यासाठी SQL सारखी वाक्यरचना वापरण्याची परवानगी देते. उदाहरणार्थ, आपण वापरू शकता पंक्ती निवडण्यासाठी जेथे वय 25 पेक्षा जास्त आहे आणि शहर न्यूयॉर्क आहे. ही पद्धत तुमचा कोड अधिक वाचनीय बनवू शकते, विशेषतः जटिल परिस्थितींसाठी. याव्यतिरिक्त, पांडा प्रदान करते loc[] आणि अधिक अचूक पंक्ती निवडीसाठी ऍक्सेसर्स. द loc[] ऍक्सेसर हे लेबल-आधारित आहे, म्हणजे तुम्ही पंक्ती त्यांच्या लेबले किंवा बुलियन ॲरेद्वारे फिल्टर करू शकता. याउलट, द ॲक्सेसर पूर्णांक स्थिती-आधारित आहे, ज्यामुळे तुम्हाला पंक्ती त्यांच्या अनुक्रमणिका स्थानांनुसार फिल्टर करता येतात.

Pandas मधील आणखी एक शक्तिशाली वैशिष्ट्य म्हणजे डेटाफ्रेम पंक्ती वापरून फिल्टर करण्याची क्षमता isin() पद्धत जेव्हा आपल्याला मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करण्याची आवश्यकता असेल तेव्हा ही पद्धत उपयुक्त आहे. उदाहरणार्थ, df[df['city'].isin(['New York', 'Los Angeles'])] पंक्ती निवडते जेथे शहर स्तंभ मूल्य एकतर न्यूयॉर्क किंवा लॉस एंजेलिस आहे. शिवाय, तुम्ही वापरून अनेक अटी साखळी करू शकता & आणि १५ अधिक जटिल फिल्टर तयार करण्यासाठी ऑपरेटर. उदाहरणार्थ, df[(df['age'] > 25) & (df['city'] == 'New York')] पंक्ती फिल्टर करते जेथे वय 25 पेक्षा जास्त आहे आणि शहर न्यूयॉर्क आहे. ही प्रगत तंत्रे डेटा फिल्टरिंगसाठी एक मजबूत फ्रेमवर्क प्रदान करतात, ज्यामुळे पांडा डेटा विश्लेषण आणि हाताळणीसाठी एक बहुमुखी साधन बनते.

पांडामध्ये डेटाफ्रेम पंक्ती निवडण्याबद्दल सामान्य प्रश्न

  1. मी एकाधिक स्तंभ मूल्यांवर आधारित डेटाफ्रेममधील पंक्ती कशा फिल्टर करू?
  2. तुम्ही बूलियन इंडेक्सिंगचा वापर करून अनेक अटी एकत्र करून वापरू शकता & आणि १५. उदाहरणार्थ: df[(df['age'] > 25) & (df['city'] == 'New York')].
  3. यांच्यात काय फरक आहे loc[] आणि ?
  4. loc[] लेबल-आधारित आहे, तर पूर्णांक स्थिती-आधारित आहे. वापरा loc[] लेबलांद्वारे फिल्टर करण्यासाठी आणि इंडेक्स पोझिशन्सनुसार फिल्टरिंगसाठी.
  5. मी कसे वापरू शकतो query() डेटाफ्रेम पंक्ती फिल्टर करण्यासाठी कार्य?
  6. query() फंक्शन तुम्हाला SQL सारखी वाक्यरचना वापरण्याची परवानगी देते. उदाहरणार्थ: .
  7. मी मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करू शकतो?
  8. होय, आपण वापरू शकता isin() पद्धत उदाहरणार्थ: df[df['city'].isin(['New York', 'Los Angeles'])].
  9. स्ट्रिंग जुळणीवर आधारित पंक्ती फिल्टर करण्याचा सर्वोत्तम मार्ग कोणता आहे?
  10. आपण वापरू शकता ३१ पद्धत उदाहरणार्थ: df[df['city'].str.contains('New')].
  11. जेथे स्तंभ मूल्ये गहाळ आहेत त्या पंक्ती मी कशा निवडू?
  12. आपण वापरू शकता ३३ पद्धत उदाहरणार्थ: ३४.
  13. कस्टम फंक्शन वापरून मी पंक्ती कशा फिल्टर करू शकतो?
  14. आपण वापरू शकता apply() लॅम्बडा फंक्शनसह पद्धत. उदाहरणार्थ: ३६.
  15. मी अनुक्रमणिका मूल्यांवर आधारित पंक्ती फिल्टर करू शकतो?
  16. होय, आपण वापरू शकता ३७ पद्धत उदाहरणार्थ: ३८.

डेटाफ्रेम पंक्ती निवडीसाठी मुख्य टेकवे

कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे पांडांसह डेटा विश्लेषणाचे मूलभूत कौशल्य आहे. बुलियन इंडेक्सिंग वापरणे, loc[], , query(), आणि isin() पद्धती कार्यक्षम डेटा फिल्टरिंगसाठी परवानगी देतात. या तंत्रांवर प्रभुत्व मिळवल्याने डेटासेट प्रभावीपणे हाताळण्याची आणि विश्लेषण करण्याची तुमची क्षमता वाढते.