à¤¹à¥à¤¯, à¤µà¤¾à¤ªà¤°à¤¾ isin() à¤à¤¾à¤°à¥à¤¯ à¤à¤¦à¤¾à¤¹à¤°à¤£à¤¾à¤°à¥à¤¥, df[df['City'].isin(['Chicago', 'New York'])].

à¤¤à¥à¤®à¥à¤¹à¥ à¤µà¤¾à¤ªà¤°à¥ à¤¶à¤à¤¤à¤¾ loc. à¤à¤¦à¤¾à¤¹à¤°à¤£à¤¾à¤°à¥à¤¥, df.loc[df['Age'] > 25, ['Name', 'City']].

स्तंभ मूल्यांवर

Mia Chevalier

मंगळवार, २५ जून, २०२४ रोजी ३:२९:५५ म.उ.

पांडा डेटाफ्रेममध्ये पंक्ती फिल्टर करणे

डेटा मॅनिपुलेशन आणि विश्लेषणासाठी Python मध्ये Pandas ही एक शक्तिशाली लायब्ररी आहे. कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे एक सामान्य कार्य आहे, SQL च्या SELECT * FROM टेबल WHERE column_name = some_value प्रमाणेच.

हे मार्गदर्शक तुम्हाला पांडामध्ये हे साध्य करण्यासाठी विविध पद्धतींमधून मार्गदर्शन करेल, ज्यामुळे तुमचा डेटा कार्यक्षमतेने फिल्टर करणे सोपे होईल. तुम्ही नवशिक्या असाल किंवा अनुभवी वापरकर्ता असाल, या टिपा तुमचे डेटा हाताळण्याचे कौशल्य वाढवतील.

आज्ञा	वर्णन
pd.DataFrame(data)	डेटाच्या शब्दकोशातून डेटाफ्रेम तयार करते.
df[column_name]	DataFrame मध्ये नावाने कॉलम ऍक्सेस करते.
df[condition]	कॉलमवर लागू केलेल्या अटीवर आधारित डेटाफ्रेम फिल्टर करते.
print(selected_rows)	कन्सोलवर डेटाफ्रेम किंवा त्याचा उपसंच मुद्रित करते.
df[df['Age'] >df[df['Age'] > 25]	पंक्ती निवडते जेथे 'वय' स्तंभ मूल्ये 25 पेक्षा जास्त आहेत.
df[df['City'] == 'Chicago']	पंक्ती निवडते जेथे 'शहर' स्तंभ मूल्ये 'शिकागो' प्रमाणे असतात.

पांडामधील डेटाफ्रेम पंक्ती निवड समजून घेणे

प्रदान केलेल्या स्क्रिप्ट्स Python मधील Pandas लायब्ररी वापरून कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती कशा निवडायच्या हे दाखवतात. पहिल्या स्क्रिप्टची सुरुवात पांडस लायब्ररी सह आयात करून होते import pandas as pd आज्ञा ते नंतर डेटाचा शब्दकोश वापरून नमुना डेटाफ्रेम तयार करते, जे डेटाफ्रेममध्ये रूपांतरित होते १ आज्ञा स्क्रिप्ट नंतर पंक्ती निवडीसाठी दोन पद्धती दर्शवते: जेथे 'वय' स्तंभाचे मूल्य 25 पेक्षा जास्त असेल अशा पंक्ती निवडणे df[df['Age'] > 25], आणि पंक्ती निवडणे जेथे 'शहर' स्तंभाचे मूल्य 'शिकागो' आहे df[df['City'] == 'Chicago']. हे फिल्टर केलेले डेटाफ्रेम वापरून मुद्रित केले जातात print() निवडलेल्या पंक्ती प्रदर्शित करण्यासाठी कार्य.

दुसरी स्क्रिप्ट सारख्याच संरचनेचे अनुसरण करते परंतु भिन्न डेटा आणि निवड निकष वापरते. हे 'उत्पादन', 'किंमत' आणि 'स्टॉक' स्तंभांसह उत्पादन माहितीसह डेटाफ्रेम तयार करते. जेथे 'किंमत' 200 पेक्षा कमी किंवा समान असेल तेथे पंक्ती निवडल्या जातात ५, आणि जेथे 'स्टॉक' चा वापर 40 पेक्षा जास्त आहे df[df['Stock'] > 40]. या स्क्रिप्ट्सचा उद्देश विशिष्ट परिस्थितींवर आधारित डेटाफ्रेम पंक्ती कशा फिल्टर करायच्या हे दाखवणे हा आहे, जसे की तुम्ही स्तंभ मूल्यावर आधारित टेबलमधून पंक्ती निवडण्यासाठी SQL क्वेरी कशी वापरता. या आज्ञा समजून घेऊन आणि लागू करून, तुम्ही तुमच्या डेटाफ्रेममधील डेटा कुशलतेने हाताळू शकता आणि त्याचे विश्लेषण करू शकता.

पांडामधील स्तंभ मूल्ये वापरून डेटाफ्रेममधील पंक्ती निवडणे

पांडा लायब्ररीसह पायथन

# Importing the necessary library
import pandas as pd

# Creating a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}
df = pd.DataFrame(data)

# Selecting rows where Age is greater than 25
selected_rows = df[df['Age'] > 25]
print(selected_rows)

# Selecting rows where City is 'Chicago'
chicago_rows = df[df['City'] == 'Chicago']
print(chicago_rows)

कॉलम निकषांवर आधारित डेटाफ्रेममध्ये डेटा फिल्टर करणे

पांडा लायब्ररीसह पायथन

१

पांडामध्ये डेटाफ्रेम पंक्ती निवडण्यासाठी प्रगत तंत्रे

बुलियन इंडेक्सिंग वापरून मूलभूत फिल्टरिंग व्यतिरिक्त, पांडा स्तंभ मूल्यांवर आधारित पंक्ती निवडण्यासाठी प्रगत तंत्रे ऑफर करते. एक शक्तिशाली पद्धत वापरत आहे ७ फंक्शन, जे तुम्हाला क्वेरी अभिव्यक्तीसह पंक्ती फिल्टर करण्यास अनुमती देते, वाक्यरचना क्लीनर बनवते आणि बरेचदा अधिक अंतर्ज्ञानी बनते. उदाहरणार्थ, वापरण्याऐवजी df[df['Age'] > 25], तुम्ही लिहू शकता ९. अधिक जटिल परिस्थिती हाताळताना किंवा स्तंभाच्या नावांमध्ये मोकळी जागा असताना ही पद्धत विशेषतः उपयुक्त आहे. याव्यतिरिक्त, द isin() जेव्हा तुम्ही मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करू इच्छित असाल तेव्हा फंक्शन फायदेशीर आहे. उदाहरणार्थ, जेथे 'शहर' स्तंभाचे मूल्य एकतर 'शिकागो' किंवा 'न्यू यॉर्क' असेल अशा पंक्ती निवडण्यासाठी, तुम्ही वापरू शकता df[df['City'].isin(['Chicago', 'New York'])].

आणखी एक तंत्र समाविष्ट आहे loc आणि iloc निर्देशांक द loc इंडेक्सर हे लेबल-आधारित आहे, जे तुम्हाला पंक्ती लेबले आणि स्तंभांच्या नावांवर आधारित पंक्ती निवडण्याची परवानगी देते, तर iloc पूर्णांक-स्थान-आधारित आहे, पंक्ती आणि स्तंभ क्रमांकांनुसार निवड सक्षम करते. ही लवचिकता विशेषतः वेगळ्या स्तंभावर लागू केलेल्या अटीवर आधारित पंक्ती निवडण्यासाठी उपयुक्त आहे. उदाहरणार्थ, df.loc[df['Age'] > 25, 'Name'] 25 पेक्षा जास्त वयाच्या व्यक्तींची नावे परत करतील. या पद्धती पांडामधील डेटा कार्यक्षमतेने हाताळण्यासाठी आणि विश्लेषित करण्यासाठी तुमची टूलकिट विस्तृत करतात, अधिक वाचनीय आणि देखरेख करण्यायोग्य कोड ऑफर करतात.

डेटाफ्रेम पंक्ती निवडण्याबद्दल सामान्य प्रश्न आणि उत्तरे

मी अनेक अटींवर आधारित पंक्ती कशी निवडू शकतो?
आपण वापरू शकता ७ फंक्शन किंवा लॉजिकल ऑपरेटरसह परिस्थिती एकत्र करा १८ आणि |. उदाहरणार्थ, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
मी मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करू शकतो?
होय, वापरा isin() कार्य उदाहरणार्थ, df[df['City'].isin(['Chicago', 'New York'])].
यांच्यात काय फरक आहे loc आणि iloc?
loc लेबल-आधारित आहे, तर iloc पूर्णांक-स्थान-आधारित आहे. वापरा loc पंक्ती/स्तंभ लेबलांसह आणि iloc पंक्ती/स्तंभ निर्देशांकांसह.
पंक्ती फिल्टर करताना मी विशिष्ट स्तंभ कसे निवडू शकतो?
तुम्ही वापरू शकता loc. उदाहरणार्थ, df.loc[df['Age'] > 25, ['Name', 'City']].
पंक्ती निवडताना मी हरवलेली मूल्ये कशी हाताळू?
वापरा ३१ गहाळ मूल्यांसह पंक्ती काढण्यासाठी फंक्शन, किंवा fillna() त्यांना निर्दिष्ट मूल्यासह पुनर्स्थित करण्यासाठी.
पंक्ती फिल्टर करण्यासाठी मी रेग्युलर एक्सप्रेशन वापरू शकतो का?
होय, द ३३ सह कार्य करा ३४ पॅरामीटर तुम्हाला रेजेक्स पॅटर्नवर आधारित पंक्ती फिल्टर करण्याची परवानगी देतो. उदाहरणार्थ, df[df['Name'].str.contains('^A', regex=True)].
मी निर्देशांकावर आधारित पंक्ती कशा फिल्टर करू?
तुम्ही वापरू शकता loc अनुक्रमणिका नावासह. उदाहरणार्थ, ३७.
माझ्या स्तंभाच्या नावांमध्ये स्पेस किंवा विशेष वर्ण असल्यास?
वापरा ७ फंक्शन जे अशा कॉलमची नावे बॅकटिकसह हाताळू शकते. उदाहरणार्थ, df.query('`column name` == value').

डेटाफ्रेम पंक्ती निवड तंत्रावरील अंतिम विचार

पांडामधील कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे डेटा मॅनिपुलेशनसाठी एक महत्त्वपूर्ण कौशल्य आहे. बुलियन इंडेक्सिंगसह चर्चा केलेल्या विविध पद्धती, ७, isin(), आणि यासह लेबल-आधारित आणि पूर्णांक-स्थान-आधारित अनुक्रमणिका loc आणि iloc, डेटा कार्यक्षमतेने फिल्टर करण्यासाठी शक्तिशाली साधने प्रदान करा. या तंत्रांचे प्रभुत्व चांगले डेटा विश्लेषण आणि स्वच्छ, अधिक देखभाल करण्यायोग्य कोड सक्षम करते.

स्तंभ मूल्यांवर आधारित पांडा डेटाफ्रेममध्ये पंक्ती कशा फिल्टर करायच्या