Git LFS रिपोज़ बड़ा क्यों हो सकता है: एक गाइड

Bash Script

Git LFS रिपोजिटरी आकार को समझना

एक बड़े SVN रिपॉजिटरी को Git में स्थानांतरित करने की प्रक्रिया में, मुझे एक दिलचस्प समस्या का सामना करना पड़ा। बायनेरिज़ को संग्रहीत करने के लिए Git LFS का उपयोग करने के लिए Git रिपॉजिटरी को परिवर्तित करते समय, रिपॉजिटरी का आकार काफी बढ़ गया।

यह लेख इस बात की पड़ताल करता है कि क्यों Git LFS माइग्रेटेड रिपॉजिटरी मूल से बड़ी हो जाती है, और क्या नियमित Git, Git LFS की तुलना में बायनेरिज़ को अधिक कुशलता से पैक करता है। मैं माइग्रेशन प्रक्रिया के दौरान उपयोग किए गए चरणों और आदेशों को भी साझा करूंगा।

आज्ञा विवरण
git lfs track Git LFS के साथ निर्दिष्ट फ़ाइल प्रकारों को ट्रैक करता है, बड़ी फ़ाइलों को मुख्य Git रिपॉजिटरी से बाहर ले जाता है।
bfg --convert-to-git-lfs Git इतिहास से बड़ी फ़ाइलों को हटाकर, Git LFS का उपयोग करने के लिए रिपॉजिटरी में निर्दिष्ट फ़ाइल प्रकारों को परिवर्तित करता है।
git reflog expire रीफ्लॉग में सभी प्रविष्टियाँ समाप्त हो जाती हैं, जो LFS माइग्रेशन के बाद रिपॉजिटरी आकार को कम करने में मदद कर सकती हैं।
git gc --prune=now --aggressive अनावश्यक फ़ाइलों को हटाने और रिपॉजिटरी आकार को आक्रामक तरीके से अनुकूलित करने के लिए कचरा संग्रहण चलाता है।
subprocess.run सबप्रोसेस में एक कमांड निष्पादित करता है, जो पायथन स्क्रिप्ट से ऑपरेटिंग सिस्टम के कमांड-लाइन इंटरफ़ेस के साथ इंटरेक्शन की अनुमति देता है।
du -sh किसी निर्दिष्ट निर्देशिका के डिस्क उपयोग को मानव-पठनीय प्रारूप में प्रदर्शित करता है।

माइग्रेशन स्क्रिप्ट को समझना

बैश स्क्रिप्ट को Git LFS का उपयोग करने के लिए Git रिपॉजिटरी के माइग्रेशन को स्वचालित करने के लिए डिज़ाइन किया गया है। सबसे पहले, यह LFS को आरंभ करता है और बाइनरी फ़ाइलों को ट्रैक करता है आज्ञा। फिर, यह ट्रैकिंग कॉन्फ़िगरेशन को रिपॉजिटरी में जोड़ता है और इसे प्रतिबद्ध करता है। कमांड का उपयोग रिपॉजिटरी में मौजूदा बाइनरी फ़ाइलों को एलएफएस में परिवर्तित करने के लिए किया जाता है, उन्हें प्रभावी रूप से मुख्य गिट इतिहास से हटा दिया जाता है। इस रूपांतरण के बाद, स्क्रिप्ट चलती है और git gc --prune=now पुराने संदर्भों को समाप्त करने और अनावश्यक फ़ाइलों को काटने, रिपॉजिटरी आकार को कम करने के लिए।

पायथन स्क्रिप्ट माइग्रेशन से पहले और बाद में रिपॉजिटरी आकार की तुलना करने का एक तरीका प्रदान करके इसे पूरक करती है। का उपयोग फ़ंक्शन, यह निष्पादित करता है निर्दिष्ट निर्देशिकाओं का डिस्क उपयोग प्राप्त करने के लिए कमांड। यह एलएफएस माइग्रेशन से पहले और बाद के रिपॉजिटरी आकार की स्पष्ट तुलना की अनुमति देता है। आउटपुट माइग्रेशन प्रक्रिया की प्रभावशीलता की पुष्टि करते हुए, रिपॉजिटरी आकार पर माइग्रेशन और क्लीनअप कमांड के प्रभाव को समझने में मदद करता है।

Git LFS माइग्रेशन और क्लीनअप प्रक्रिया को स्वचालित करना

Git LFS माइग्रेशन और क्लीनअप के लिए बैश स्क्रिप्ट

#!/bin/bash
# Step 1: Initialize LFS and track file type
git lfs install
git lfs track "*.bin"
git add .gitattributes
git commit -m "Track binary files with LFS"
# Step 2: Migrate existing files to LFS
bfg --convert-to-git-lfs '*.bin' --no-blob-protection
git reflog expire --expire=now --all
git gc --prune=now --aggressive

प्रवासन के बाद रिपोजिटरी आकार में परिवर्तन का विश्लेषण करना

रिपॉजिटरी आकार तुलना के लिए पायथन स्क्रिप्ट

import subprocess
def get_repo_size(path):
    result = subprocess.run(['du', '-sh', path], stdout=subprocess.PIPE)
    size = result.stdout.split()[0].decode('utf-8')
    return size
before_migration = get_repo_size('/path/to/repo_before_lfs')
after_migration = get_repo_size('/path/to/repo_after_lfs')
print(f"Size before LFS migration: {before_migration}")
print(f"Size after LFS migration: {after_migration}")

रिपॉजिटरी आकार पर Git LFS के प्रभाव की खोज

Git LFS में माइग्रेट करने का एक महत्वपूर्ण पहलू Git और Git LFS फ़ाइल भंडारण को संभालने के तरीके में अंतर को समझना है। Git LFS आपके रिपॉजिटरी में बड़ी फ़ाइलों को छोटी पॉइंटर फ़ाइलों से बदल देता है, जबकि वास्तविक फ़ाइल सामग्री अलग से संग्रहीत की जाती है। यह पृथक्करण मूल बड़ी फ़ाइलों और नए एलएफएस पॉइंटर्स दोनों की उपस्थिति के कारण माइग्रेशन के दौरान ऑन-डिस्क आकार को अस्थायी रूप से बढ़ाने का कारण बन सकता है। एक अन्य कारक यह है कि Git LFS विभिन्न संपीड़न और भंडारण तंत्रों का उपयोग करता है, जिसके परिणामस्वरूप हमेशा छोटे रिपॉजिटरी आकार नहीं हो सकते हैं, खासकर माइग्रेशन के तुरंत बाद।

माइग्रेशन के बाद रिपॉजिटरी आकार को अनुकूलित करने के लिए, जैसे कमांड चलाना महत्वपूर्ण है और . ये कमांड अनावश्यक फ़ाइलों और संदर्भों को हटाने में मदद करते हैं, जिससे रिपॉजिटरी का आकार काफी कम हो जाता है। समय के साथ रिपॉजिटरी के आकार की निगरानी करना और इसे अनुकूलित बनाए रखने के लिए नियमित रखरखाव करना भी महत्वपूर्ण है। इन बारीकियों को समझने से अपेक्षाओं को प्रबंधित करने और एक कुशल प्रवासन प्रक्रिया सुनिश्चित करने में मदद मिल सकती है।

  1. आरंभिक Git LFS माइग्रेशन के बाद रिपॉजिटरी का आकार क्यों बढ़ जाता है?
  2. यह वृद्धि मूल फ़ाइलों और एलएफएस पॉइंटर्स दोनों की उपस्थिति के कारण है। दौड़ना आदेश इस आकार को कम करने में मदद करते हैं।
  3. क्या करता है करना?
  4. यह कमांड पुरानी रीफ्लॉग प्रविष्टियों को हटा देता है, रिपॉजिटरी को साफ करने और स्थान खाली करने में मदद करता है।
  5. कैसे हुआ काम?
  6. यह मौजूदा बड़ी फ़ाइलों को Git LFS का उपयोग करने के लिए परिवर्तित करता है, और उन्हें प्रभावी ढंग से मुख्य Git इतिहास से बाहर ले जाता है।
  7. क्यों इस्तेमाल किया गया?
  8. यह कमांड आक्रामक रूप से अनावश्यक फ़ाइलों को साफ़ करता है और रिपॉजिटरी स्टोरेज को अनुकूलित करता है।
  9. Git LFS का उपयोग करने का क्या लाभ है?
  10. Git LFS बड़ी फ़ाइलों को अलग से संग्रहीत करके रिपॉजिटरी क्लोन के आकार को कम करता है, जिससे प्रदर्शन में सुधार होता है।
  11. क्या माइग्रेशन के तुरंत बाद रिपॉजिटरी का आकार कम किया जा सकता है?
  12. हाँ, दौड़कर और अनावश्यक डेटा हटाने का आदेश।
  13. क्या Git LFS का उपयोग करते समय डेटा हानि का जोखिम है?
  14. नहीं, जब तक माइग्रेशन और क्लीनअप कमांड सही ढंग से चलाए जाते हैं, डेटा बरकरार रहता है।
  15. रखरखाव आदेश कितनी बार चलाए जाने चाहिए?
  16. रखरखाव कमांड को नियमित रूप से चलाने की सलाह दी जाती है, खासकर रिपॉजिटरी में महत्वपूर्ण बदलावों के बाद।

Git LFS माइग्रेशन पर अंतिम विचार

Git LFS में माइग्रेशन के परिणामस्वरूप मूल फ़ाइलों और LFS पॉइंटर्स के सह-अस्तित्व के कारण रिपॉजिटरी आकार में अस्थायी वृद्धि हो सकती है। हालाँकि, रखरखाव आदेश चलाना जैसे कि और आकार को काफी हद तक कम कर सकता है। प्रभावी माइग्रेशन के लिए Git और Git LFS फ़ाइल संग्रहण को कैसे संभालते हैं, इसके अंतर को समझना महत्वपूर्ण है।

हालाँकि प्रारंभिक आकार में वृद्धि चिंताजनक हो सकती है, Git LFS का उपयोग करने के दीर्घकालिक लाभ, विशेष रूप से दूरस्थ भंडारण और क्लोनिंग दक्षता के लिए, अस्थायी नुकसान से अधिक हैं। नियमित रखरखाव और उचित कॉन्फ़िगरेशन एक अनुकूलित और प्रबंधनीय भंडार आकार सुनिश्चित कर सकता है।