Ø¢Ù¾ Ø§Ø³ØªØ¹ÙØ§Ù Ú©Ø± Ø³Ú©ØªÛ ÛÛÚºÛ query() ÙÙÚ©Ø´Ù ÛØ§ ÙÙØ·ÙÛ Ø¢Ù¾Ø±ÛÙ¹Ø±Ø² Ú©Û Ø³Ø§ØªÚ¾ ØØ§ÙØ§Øª Ú©Ù ÛÚ©Ø¬Ø§ Ú©Ø±ÛÚº Ø¬ÛØ³Û & Ø§ÙØ± |. ÙØ«Ø§Ù Ú©Û Ø·ÙØ± Ù¾Ø±Ø df[(df['Age'] > 25) & (df['City'] == 'Chicago')].

Ø¬Û ÛØ§ÚºØ Ø§Ø³ØªØ¹ÙØ§Ù Ú©Ø±ÛÚº isin() ÙÙÚ©Ø´Ù ÙØ«Ø§Ù Ú©Û Ø·ÙØ± Ù¾Ø±Ø df[df['City'].isin(['Chicago', 'New York'])].

Ø§Ù Ú©Û Ø¯Ø±ÙÛØ§Ù ÙØ±Ù Ú©ÛØ§ Ú¾Û loc Ø§ÙØ± iloc?

Ø¢Ù¾ Ø§Ø³ØªØ¹ÙØ§Ù Ú©Ø± Ø³Ú©ØªÛ ÛÛÚº loc. ÙØ«Ø§Ù Ú©Û Ø·ÙØ± Ù¾Ø±Ø df.loc[df['Age'] > 25, ['Name', 'City']].

Ø¬Û ÛØ§ÚºØ Ø¯Û str.contains() Ú©Û Ø³Ø§ØªÚ¾ ÙÙÚ©Ø´Ù regex=True Ù¾ÛØ±Ø§ÙÛÙ¹Ø± Ø¢Ù¾ Ú©Ù Ø±ÛØ¬ÛÚ©Ø³ Ù¾ÛÙ¹Ø±Ù Ú©Û Ø¨ÙÛØ§Ø¯ Ù¾Ø± ÙØ·Ø§Ø±ÙÚº Ú©Ù ÙÙÙ¹Ø± Ú©Ø±ÙÛ Ú©Û Ø§Ø¬Ø§Ø²Øª Ø¯ÛØªØ§ ÛÛÛ ÙØ«Ø§Ù Ú©Û Ø·ÙØ± Ù¾Ø±Ø df[df['Name'].str.contains('^A', regex=True)].

Ø¢Ù¾ Ø§Ø³ØªØ¹ÙØ§Ù Ú©Ø± Ø³Ú©ØªÛ ÛÛÚº loc Ø§ÙÚÛÚ©Ø³ ÙØ§Ù Ú©Û Ø³Ø§ØªÚ¾Û ÙØ«Ø§Ù Ú©Û Ø·ÙØ± Ù¾Ø±Ø df.loc[df.index == 'some_index'].

Ú©Ø§ Ø§Ø³ØªØ¹ÙØ§Ù Ú©Ø±ØªÛ ÛÛÚº query() ÙÙÚ©Ø´Ù Ø¬Ù Ø§ÛØ³Û Ú©Ø§ÙÙ Ú©Û ÙØ§ÙÙÚº Ú©Ù Ø¨ÛÚ© Ù¹ÙÚ©Ø³ Ú©Û Ø³Ø§ØªÚ¾ ÛÛÙÚÙ Ú©Ø± Ø³Ú©ØªØ§ ÛÛÛ ÙØ«Ø§Ù Ú©Û Ø·ÙØ± Ù¾Ø±Ø df.query('`column name` == value').

کالم کی قدروں کی بنیاد پر پانڈا

Mia Chevalier

منگل، 25 جون، 2024 4:07:57 PM

پانڈا ڈیٹا فریمز میں قطاروں کو فلٹر کرنا

پانڈاس ڈیٹا کی ہیرا پھیری اور تجزیہ کے لیے Python میں ایک طاقتور لائبریری ہے۔ ایک عام کام کالم کی اقدار پر مبنی ڈیٹا فریم سے قطاروں کا انتخاب کرنا ہے، جیسا کہ SQL کے SELECT * FROM ٹیبل WHERE column_name = some_value۔

یہ گائیڈ آپ کو پانڈوں میں اسے حاصل کرنے کے لیے مختلف طریقوں سے گزرے گا، جس سے آپ کے ڈیٹا کو مؤثر طریقے سے فلٹر کرنا آسان ہو جائے گا۔ چاہے آپ ابتدائی ہوں یا تجربہ کار صارف، یہ تجاویز آپ کے ڈیٹا کو سنبھالنے کی مہارت کو بہتر بنائیں گی۔

کمانڈ	تفصیل
pd.DataFrame(data)	ڈیٹا کی لغت سے ڈیٹا فریم بناتا ہے۔
df[column_name]	ڈیٹا فریم میں ایک کالم تک رسائی حاصل کرتا ہے۔
df[condition]	کالم پر لاگو شرط کی بنیاد پر ڈیٹا فریم کو فلٹر کرتا ہے۔
print(selected_rows)	ڈیٹا فریم یا اس کا سب سیٹ کنسول پر پرنٹ کرتا ہے۔
df[df['Age'] >df[df['Age'] > 25]	وہ قطاریں منتخب کرتی ہے جہاں 'عمر' کالم کی قدریں 25 سے زیادہ ہوں۔
df[df['City'] == 'Chicago']	قطاریں منتخب کریں جہاں 'شہر' کالم کی قدریں 'شکاگو' کے برابر ہوں۔

پانڈوں میں ڈیٹا فریم قطار کے انتخاب کو سمجھنا

فراہم کردہ اسکرپٹس یہ ظاہر کرتی ہیں کہ Python میں پانڈاس لائبریری کا استعمال کرتے ہوئے کالم کی قدروں کی بنیاد پر ڈیٹا فریم سے قطاریں کیسے منتخب کی جائیں۔ پہلا اسکرپٹ پانڈاس لائبریری کو درآمد کرکے شروع ہوتا ہے۔ import pandas as pd کمانڈ۔ اس کے بعد یہ ڈیٹا کی لغت کا استعمال کرتے ہوئے ایک نمونہ ڈیٹا فریم بناتا ہے، جسے ڈیٹا فریم میں تبدیل کر دیا جاتا ہے۔ pd.DataFrame(data) کمانڈ۔ اس کے بعد اسکرپٹ قطار کے انتخاب کے لیے دو طریقوں کی وضاحت کرتا ہے: قطاروں کا انتخاب کرنا جہاں 'عمر' کالم کی قدر 25 سے زیادہ ہو df[df['Age'] > 25]، اور قطاروں کو منتخب کرنا جہاں 'شہر' کالم کی قدر 'شکاگو' کا استعمال کرتے ہوئے ہے۔ df[df['City'] == 'Chicago']. یہ فلٹر شدہ ڈیٹا فریم کا استعمال کرتے ہوئے پرنٹ کیے جاتے ہیں۔ print() منتخب قطاروں کو ظاہر کرنے کے لیے فنکشن۔

دوسرا اسکرپٹ اسی طرح کے ڈھانچے کی پیروی کرتا ہے لیکن مختلف ڈیٹا اور انتخاب کے معیار کا استعمال کرتا ہے۔ یہ پروڈکٹ کی معلومات کے ساتھ ایک ڈیٹا فریم بناتا ہے، بشمول 'پروڈکٹ'، 'قیمت'، اور 'اسٹاک' کالم۔ قطاریں منتخب کی جاتی ہیں جہاں 'قیمت' 200 سے کم یا اس کے برابر ہو۔ df[df['Price'] <= 200]، اور جہاں 'اسٹاک' استعمال کرتے ہوئے 40 سے زیادہ ہے۔ df[df['Stock'] > 40]. ان اسکرپٹس کا مقصد یہ بتانا ہے کہ ڈیٹا فریم کی قطاروں کو مخصوص حالات کی بنیاد پر کیسے فلٹر کیا جائے، جیسا کہ آپ کالم ویلیو کی بنیاد پر ٹیبل سے قطاروں کو منتخب کرنے کے لیے SQL استفسار کا استعمال کرتے ہیں۔ ان کمانڈز کو سمجھ کر اور لاگو کر کے، آپ اپنے ڈیٹا فریمز میں ڈیٹا کو مؤثر طریقے سے جوڑ توڑ اور تجزیہ کر سکتے ہیں۔

پانڈوں میں کالم ویلیو کا استعمال کرتے ہوئے ڈیٹا فریم میں قطاروں کا انتخاب کرنا

پانڈاس لائبریری کے ساتھ ازگر

# Importing the necessary library
import pandas as pd

# Creating a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}
df = pd.DataFrame(data)

# Selecting rows where Age is greater than 25
selected_rows = df[df['Age'] > 25]
print(selected_rows)

# Selecting rows where City is 'Chicago'
chicago_rows = df[df['City'] == 'Chicago']
print(chicago_rows)

کالم کے معیار کی بنیاد پر ڈیٹا فریم میں ڈیٹا کو فلٹر کرنا

پانڈاس لائبریری کے ساتھ ازگر

# Importing pandas library
import pandas as pd

# Creating a sample DataFrame
data = {'Product': ['A', 'B', 'C', 'D', 'E'],
        'Price': [100, 150, 200, 250, 300],
        'Stock': [30, 60, 90, 20, 50]}
df = pd.DataFrame(data)

# Selecting rows where Price is less than or equal to 200
affordable_products = df[df['Price'] <= 200]
print(affordable_products)

# Selecting rows where Stock is more than 40
in_stock = df[df['Stock'] > 40]
print(in_stock)

پانڈوں میں ڈیٹا فریم قطاروں کو منتخب کرنے کے لیے جدید تکنیک

بولین انڈیکسنگ کا استعمال کرتے ہوئے بنیادی فلٹرنگ کے علاوہ، پانڈاس کالم کی قدروں پر مبنی قطاروں کو منتخب کرنے کے لیے جدید تکنیک پیش کرتا ہے۔ ایک طاقتور طریقہ استعمال کر رہا ہے۔ query() فنکشن، جو آپ کو استفسار کے اظہار کے ساتھ قطاروں کو فلٹر کرنے کی اجازت دیتا ہے، جس سے نحو صاف اور اکثر زیادہ بدیہی ہو جاتا ہے۔ مثال کے طور پر استعمال کرنے کے بجائے df[df['Age'] > 25]، تم لکھ سکتے ہو df.query('Age > 25'). یہ طریقہ خاص طور پر مفید ہے جب زیادہ پیچیدہ حالات سے نمٹنے کے لیے یا جب کالم کے نام خالی جگہوں پر مشتمل ہوں۔ مزید برآں، isin() فنکشن فائدہ مند ہے جب آپ اقدار کی فہرست کی بنیاد پر قطاروں کو فلٹر کرنا چاہتے ہیں۔ مثال کے طور پر، قطاروں کو منتخب کرنے کے لیے جہاں 'شہر' کالم کی قدر یا تو 'شکاگو' یا 'نیو یارک' ہے، آپ استعمال کر سکتے ہیں df[df['City'].isin(['Chicago', 'New York'])].

ایک اور تکنیک میں شامل ہے۔ loc اور iloc انڈیکسرز دی loc انڈیکسر لیبل پر مبنی ہے، جو آپ کو قطار کے لیبلز اور کالم کے ناموں کی بنیاد پر قطاروں کو منتخب کرنے کی اجازت دیتا ہے، جبکہ iloc عددی مقام پر مبنی ہے، قطار اور کالم نمبروں کے لحاظ سے انتخاب کو فعال کرتا ہے۔ یہ لچک خاص طور پر کسی مختلف کالم پر لاگو ہونے والی شرط کی بنیاد پر قطاروں کے انتخاب کے لیے مفید ہے۔ مثال کے طور پر، df.loc[df['Age'] > 25, 'Name'] 25 سال سے زیادہ عمر کے افراد کے نام واپس کر دیں گے۔ یہ طریقے پانڈوں میں ڈیٹا کو موثر طریقے سے ہینڈل کرنے اور تجزیہ کرنے کے لیے آپ کی ٹول کٹ کو وسعت دیتے ہیں، مزید پڑھنے کے قابل اور برقرار رکھنے کے قابل کوڈ پیش کرتے ہیں۔

ڈیٹا فریم قطاروں کو منتخب کرنے کے بارے میں عام سوالات اور جوابات

میں متعدد شرائط کی بنیاد پر قطاروں کا انتخاب کیسے کرسکتا ہوں؟
آپ استعمال کر سکتے ہیں۔ query() فنکشن یا منطقی آپریٹرز کے ساتھ حالات کو یکجا کریں جیسے & اور |. مثال کے طور پر، df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
کیا میں اقدار کی فہرست کی بنیاد پر قطاروں کو فلٹر کر سکتا ہوں؟
جی ہاں، استعمال کریں isin() فنکشن مثال کے طور پر، df[df['City'].isin(['Chicago', 'New York'])].
ان کے درمیان فرق کیا ھے loc اور iloc?
loc لیبل پر مبنی ہے، جبکہ iloc انٹیجر لوکیشن پر مبنی ہے۔ استعمال کریں۔ loc قطار/کالم لیبل کے ساتھ اور iloc قطار/کالم انڈیکس کے ساتھ۔
قطاروں کو فلٹر کرتے وقت میں مخصوص کالم کیسے منتخب کر سکتا ہوں؟
آپ استعمال کر سکتے ہیں loc. مثال کے طور پر، df.loc[df['Age'] > 25, ['Name', 'City']].
قطاروں کا انتخاب کرتے وقت میں گمشدہ اقدار کو کیسے ہینڈل کروں؟
کا استعمال کرتے ہیں dropna() لاپتہ اقدار والی قطاروں کو ہٹانے کے لیے فنکشن، یا fillna() ان کو ایک مخصوص قدر سے بدلنے کے لیے۔
کیا میں قطاروں کو فلٹر کرنے کے لیے ریگولر ایکسپریشنز استعمال کر سکتا ہوں؟
جی ہاں، دی str.contains() کے ساتھ فنکشن regex=True پیرامیٹر آپ کو ریجیکس پیٹرن کی بنیاد پر قطاروں کو فلٹر کرنے کی اجازت دیتا ہے۔ مثال کے طور پر، df[df['Name'].str.contains('^A', regex=True)].
میں انڈیکس کی بنیاد پر قطاروں کو کیسے فلٹر کروں؟
آپ استعمال کر سکتے ہیں loc انڈیکس نام کے ساتھ۔ مثال کے طور پر، df.loc[df.index == 'some_index'].
اگر میرے کالم کے ناموں میں خالی جگہیں یا خصوصی حروف ہوں تو کیا ہوگا؟
کا استعمال کرتے ہیں query() فنکشن جو ایسے کالم کے ناموں کو بیک ٹِکس کے ساتھ ہینڈل کر سکتا ہے۔ مثال کے طور پر، df.query('`column name` == value').

ڈیٹا فریم قطار کے انتخاب کی تکنیکوں پر حتمی خیالات

پانڈوں میں کالم کی قدروں کی بنیاد پر ڈیٹا فریم سے قطاروں کا انتخاب ڈیٹا میں ہیرا پھیری کے لیے ایک اہم مہارت ہے۔ بولین انڈیکسنگ سمیت مختلف طریقوں پر تبادلہ خیال کیا گیا، query()، isin()، اور لیبل پر مبنی اور عددی مقام پر مبنی اشاریہ سازی کے ساتھ loc اور ilocڈیٹا کو مؤثر طریقے سے فلٹر کرنے کے لیے طاقتور ٹولز فراہم کریں۔ ان تکنیکوں میں مہارت بہتر ڈیٹا تجزیہ اور صاف ستھرا، زیادہ برقرار رکھنے کے قابل کوڈ کو قابل بناتی ہے۔

کالم کی قدروں کی بنیاد پر پانڈا ڈیٹا فریم میں قطاروں کو کیسے فلٹر کریں۔