पायथनमधील स्तंभ मूल्यांवर आधारित डेटाफ्रेम पंक्ती निवडणे

Python

स्तंभ मूल्यांनुसार डेटाफ्रेम फिल्टर करण्यासाठी पांडा वापरणे

Python मध्ये डेटासह काम करताना, Pandas लायब्ररी डेटा हाताळणी आणि विश्लेषणासाठी शक्तिशाली साधने ऑफर करते. विशिष्ट स्तंभातील मूल्यांवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे एक सामान्य कार्य आहे. हे ऑपरेशन SQL क्वेरी सारखे आहे: SELECT * FROM टेबल WHERE column_name = some_value.

या लेखात, आम्ही विविध पद्धती वापरून पांडांमध्ये हे कसे मिळवायचे ते शोधू. तुम्ही एकल मूल्य किंवा अनेक निकषांनुसार फिल्टर करत असाल तरीही, Pandas अशा ऑपरेशन्स हाताळण्यासाठी अंतर्ज्ञानी आणि कार्यक्षम मार्ग प्रदान करते. चला तपशीलात जाऊया.

आज्ञा वर्णन
pd.DataFrame() शब्दकोश किंवा इतर डेटा स्ट्रक्चर्समधून डेटाफ्रेम ऑब्जेक्ट तयार करते.
df[condition] डेटाफ्रेम पंक्ती एका अटीवर आधारित फिल्टर करते, जे फक्त निकष पूर्ण करतात ते परत करतात.
print() कन्सोलवर निर्दिष्ट संदेश किंवा डेटाफ्रेम आउटपुट करते.
df['column'] == value पंक्ती फिल्टर करण्यासाठी वापरलेली बुलियन मालिका तयार करते जेथे स्तंभ निर्दिष्ट मूल्याशी जुळतो.
df['column'] >df['column'] > value पंक्ती फिल्टर करण्यासाठी वापरलेली बुलियन मालिका तयार करते जेथे स्तंभ मूल्ये निर्दिष्ट मूल्यापेक्षा जास्त आहेत.
# Comment कोडमध्ये स्पष्टीकरण किंवा नोट्स जोडण्यासाठी वापरले जाते, जे स्क्रिप्टचा भाग म्हणून कार्यान्वित केले जात नाहीत.

पांडामध्ये डेटाफ्रेम पंक्ती निवड लागू करणे

प्रदान केलेल्या स्क्रिप्ट्समध्ये, मुख्य कार्य म्हणजे विशिष्ट स्तंभ मूल्यांवर आधारित डेटाफ्रेममधून पंक्ती फिल्टर करणे, डेटा विश्लेषणामध्ये एक सामान्य आवश्यकता आहे. पहिली स्क्रिप्ट पांडा लायब्ररी आयात करून सुरू होते . हे अत्यावश्यक आहे कारण पायथनमधील पांडस एक शक्तिशाली डेटा मॅनिप्युलेशन लायब्ररी आहे. पुढे, आम्ही वापरून नमुना डेटाफ्रेम तयार करतो नावे, वयोगट आणि शहरांसाठी डेटा असलेल्या शब्दकोशासह. ही रचना आम्हाला टॅब्युलर डेटा सहजपणे दृश्यमान आणि हाताळण्यास अनुमती देते. स्क्रिप्टचा महत्त्वाचा भाग म्हणजे जिथे आपण वापरून पंक्ती फिल्टर करतो . हा आदेश सर्व पंक्ती निवडतो जेथे शहर स्तंभाचे मूल्य 'न्यूयॉर्क' आहे. परिणाम व्हेरिएबलमध्ये संग्रहित केला जातो ny_rows, जे नंतर फिल्टर केलेले डेटाफ्रेम प्रदर्शित करण्यासाठी मुद्रित केले जाते.

दुसरी स्क्रिप्ट सारख्याच संरचनेचे अनुसरण करते परंतु अंकीय स्थितीवर आधारित पंक्ती फिल्टर करण्यावर लक्ष केंद्रित करते. पांडा आयात केल्यानंतर आणि उत्पादन, किंमत आणि प्रमाण स्तंभांसह डेटाफ्रेम तयार केल्यानंतर, स्क्रिप्ट वापरते पंक्ती फिल्टर करण्यासाठी जिथे किंमत 150 पेक्षा जास्त आहे. ही कमांड मूळ डेटाफ्रेमचा एक उपसंच तयार करते ज्यामध्ये फक्त निर्दिष्ट अटी पूर्ण करणाऱ्या पंक्ती असतात. परिणाम मध्ये संग्रहित आहे आणि पडताळणीसाठी मुद्रित केले. दोन्ही स्क्रिप्ट डेटा हाताळण्यासाठी पांडाची शक्ती आणि साधेपणा दर्शवतात. बुलियन इंडेक्सिंगचा वापर करून, एक पद्धत जिथे आम्ही डेटा फिल्टर करण्यासाठी सत्य/असत्य मूल्यांची मालिका पास करतो, आम्ही विविध परिस्थितींवर आधारित डेटाचे उपसंच कार्यक्षमतेने निवडू शकतो, ज्यामुळे ते डेटा विश्लेषक आणि शास्त्रज्ञांसाठी एक अमूल्य साधन बनते.

स्तंभ मूल्यांवर आधारित डेटाफ्रेममध्ये पंक्ती फिल्टर करणे

पायथन - डेटाफ्रेम ऑपरेशन्ससाठी पांडा वापरणे

import pandas as pd
# Create a sample DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'age': [24, 27, 22, 32, 29],
    'city': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)

# Select rows where city is New York
ny_rows = df[df['city'] == 'New York']
print(ny_rows)

# Output:
#       name  age      city
# 0    Alice   24  New York
# 2  Charlie   22  New York

स्तंभ मूल्यांवर आधारित डेटाफ्रेम पंक्तींची क्वेरी करत आहे

पायथन - पांडांसह प्रगत फिल्टरिंग

डेटाफ्रेम पंक्ती निवडण्यासाठी प्रगत तंत्रे

बुलियन इंडेक्सिंगसह मूलभूत फिल्टरिंग व्यतिरिक्त, पांडा स्तंभ मूल्यांवर आधारित पंक्ती निवडण्यासाठी अधिक प्रगत तंत्र ऑफर करते. अशी एक पद्धत आहे फंक्शन, जे तुम्हाला डेटाफ्रेम पंक्ती फिल्टर करण्यासाठी SQL सारखी वाक्यरचना वापरण्याची परवानगी देते. उदाहरणार्थ, आपण वापरू शकता पंक्ती निवडण्यासाठी जेथे वय 25 पेक्षा जास्त आहे आणि शहर न्यूयॉर्क आहे. ही पद्धत तुमचा कोड अधिक वाचनीय बनवू शकते, विशेषतः जटिल परिस्थितींसाठी. याव्यतिरिक्त, पांडा प्रदान करते आणि अधिक अचूक पंक्ती निवडीसाठी ऍक्सेसर्स. द ऍक्सेसर हे लेबल-आधारित आहे, म्हणजे तुम्ही पंक्ती त्यांच्या लेबले किंवा बुलियन ॲरेद्वारे फिल्टर करू शकता. याउलट, द ॲक्सेसर पूर्णांक स्थिती-आधारित आहे, ज्यामुळे तुम्हाला पंक्ती त्यांच्या अनुक्रमणिका स्थानांनुसार फिल्टर करता येतात.

Pandas मधील आणखी एक शक्तिशाली वैशिष्ट्य म्हणजे डेटाफ्रेम पंक्ती वापरून फिल्टर करण्याची क्षमता पद्धत जेव्हा आपल्याला मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करण्याची आवश्यकता असेल तेव्हा ही पद्धत उपयुक्त आहे. उदाहरणार्थ, पंक्ती निवडते जेथे शहर स्तंभ मूल्य एकतर न्यूयॉर्क किंवा लॉस एंजेलिस आहे. शिवाय, तुम्ही वापरून अनेक अटी साखळी करू शकता आणि १५ अधिक जटिल फिल्टर तयार करण्यासाठी ऑपरेटर. उदाहरणार्थ, पंक्ती फिल्टर करते जेथे वय 25 पेक्षा जास्त आहे आणि शहर न्यूयॉर्क आहे. ही प्रगत तंत्रे डेटा फिल्टरिंगसाठी एक मजबूत फ्रेमवर्क प्रदान करतात, ज्यामुळे पांडा डेटा विश्लेषण आणि हाताळणीसाठी एक बहुमुखी साधन बनते.

  1. मी एकाधिक स्तंभ मूल्यांवर आधारित डेटाफ्रेममधील पंक्ती कशा फिल्टर करू?
  2. तुम्ही बूलियन इंडेक्सिंगचा वापर करून अनेक अटी एकत्र करून वापरू शकता आणि . उदाहरणार्थ: .
  3. यांच्यात काय फरक आहे आणि ?
  4. लेबल-आधारित आहे, तर पूर्णांक स्थिती-आधारित आहे. वापरा लेबलांद्वारे फिल्टर करण्यासाठी आणि इंडेक्स पोझिशन्सनुसार फिल्टरिंगसाठी.
  5. मी कसे वापरू शकतो डेटाफ्रेम पंक्ती फिल्टर करण्यासाठी कार्य?
  6. द फंक्शन तुम्हाला SQL सारखी वाक्यरचना वापरण्याची परवानगी देते. उदाहरणार्थ: .
  7. मी मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करू शकतो?
  8. होय, आपण वापरू शकता पद्धत उदाहरणार्थ: .
  9. स्ट्रिंग जुळणीवर आधारित पंक्ती फिल्टर करण्याचा सर्वोत्तम मार्ग कोणता आहे?
  10. आपण वापरू शकता पद्धत उदाहरणार्थ: .
  11. जेथे स्तंभ मूल्ये गहाळ आहेत त्या पंक्ती मी कशा निवडू?
  12. आपण वापरू शकता पद्धत उदाहरणार्थ: .
  13. कस्टम फंक्शन वापरून मी पंक्ती कशा फिल्टर करू शकतो?
  14. आपण वापरू शकता लॅम्बडा फंक्शनसह पद्धत. उदाहरणार्थ: .
  15. मी अनुक्रमणिका मूल्यांवर आधारित पंक्ती फिल्टर करू शकतो?
  16. होय, आपण वापरू शकता पद्धत उदाहरणार्थ: .

कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे पांडांसह डेटा विश्लेषणाचे मूलभूत कौशल्य आहे. बुलियन इंडेक्सिंग वापरणे, , , , आणि isin() पद्धती कार्यक्षम डेटा फिल्टरिंगसाठी परवानगी देतात. या तंत्रांवर प्रभुत्व मिळवल्याने डेटासेट प्रभावीपणे हाताळण्याची आणि विश्लेषण करण्याची तुमची क्षमता वाढते.