എന്തുകൊണ്ടാണ് Git LFS റിപ്പോകൾ വലുതാകുന്നത്: ഒരു ഗൈഡ്

Bash Script

Git LFS റിപ്പോസിറ്ററി വലുപ്പം മനസ്സിലാക്കുന്നു

ഒരു വലിയ SVN റിപ്പോസിറ്ററി Git-ലേക്ക് മൈഗ്രേറ്റ് ചെയ്യുന്ന പ്രക്രിയയിൽ, എനിക്ക് രസകരമായ ഒരു പ്രശ്നം നേരിട്ടു. ബൈനറികൾ സംഭരിക്കുന്നതിന് Git LFS ഉപയോഗിക്കുന്നതിനായി Git റിപ്പോസിറ്ററി പരിവർത്തനം ചെയ്യുമ്പോൾ, റിപ്പോസിറ്ററിയുടെ വലിപ്പം ഗണ്യമായി വർദ്ധിച്ചു.

Git LFS മൈഗ്രേറ്റഡ് റിപ്പോസിറ്ററി ഒറിജിനലിനേക്കാൾ വലുതായി അവസാനിക്കുന്നത് എന്തുകൊണ്ടാണെന്നും സാധാരണ Git Git LFS നേക്കാൾ കാര്യക്ഷമമായി ബൈനറികൾ പായ്ക്ക് ചെയ്യുന്നുണ്ടോ എന്നും ഈ ലേഖനം പര്യവേക്ഷണം ചെയ്യുന്നു. മൈഗ്രേഷൻ പ്രക്രിയയിൽ ഉപയോഗിക്കുന്ന ഘട്ടങ്ങളും കമാൻഡുകളും ഞാൻ പങ്കിടും.

കമാൻഡ് വിവരണം
git lfs track Git LFS ഉപയോഗിച്ച് നിർദ്ദിഷ്ട ഫയൽ തരങ്ങൾ ട്രാക്കുചെയ്യുന്നു, പ്രധാന Git ശേഖരണത്തിൽ നിന്ന് വലിയ ഫയലുകൾ നീക്കുന്നു.
bfg --convert-to-git-lfs Git ചരിത്രത്തിൽ നിന്ന് വലിയ ഫയലുകൾ നീക്കംചെയ്ത് Git LFS ഉപയോഗിക്കുന്നതിന് റിപ്പോസിറ്ററിയിലെ നിർദ്ദിഷ്ട ഫയൽ തരങ്ങളെ പരിവർത്തനം ചെയ്യുന്നു.
git reflog expire എൽഎഫ്എസ് മൈഗ്രേഷനുശേഷം റിപ്പോസിറ്ററി വലുപ്പം കുറയ്ക്കാൻ സഹായിക്കുന്ന റിലോഗിലെ എല്ലാ എൻട്രികളും കാലഹരണപ്പെടുന്നു.
git gc --prune=now --aggressive അനാവശ്യ ഫയലുകൾ നീക്കം ചെയ്യുന്നതിനും റിപ്പോസിറ്ററി വലുപ്പം ആക്രമണാത്മകമായി ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിനും മാലിന്യ ശേഖരണം നടത്തുന്നു.
subprocess.run ഒരു പൈത്തൺ സ്ക്രിപ്റ്റിൽ നിന്ന് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിൻ്റെ കമാൻഡ്-ലൈൻ ഇൻ്റർഫേസുമായി ഇടപഴകാൻ അനുവദിക്കുന്ന സബ്പ്രോസസിൽ ഒരു കമാൻഡ് എക്സിക്യൂട്ട് ചെയ്യുന്നു.
du -sh ഒരു നിർദ്ദിഷ്‌ട ഡയറക്‌ടറിയുടെ ഡിസ്‌ക് ഉപയോഗം മനുഷ്യർക്ക് വായിക്കാവുന്ന ഫോർമാറ്റിൽ പ്രദർശിപ്പിക്കുന്നു.

മൈഗ്രേഷൻ സ്ക്രിപ്റ്റുകൾ മനസ്സിലാക്കുന്നു

Git LFS ഉപയോഗിക്കുന്നതിനായി ഒരു Git ശേഖരണത്തിൻ്റെ മൈഗ്രേഷൻ ഓട്ടോമേറ്റ് ചെയ്യുന്നതിനാണ് ബാഷ് സ്ക്രിപ്റ്റ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്. ആദ്യം, ഇത് LFS ആരംഭിക്കുകയും ബൈനറി ഫയലുകൾ ട്രാക്ക് ചെയ്യുകയും ചെയ്യുന്നു കമാൻഡ്. തുടർന്ന്, അത് റിപ്പോസിറ്ററിയിലേക്ക് ട്രാക്കിംഗ് കോൺഫിഗറേഷൻ ചേർക്കുകയും അത് സമർപ്പിക്കുകയും ചെയ്യുന്നു. ദി റിപ്പോസിറ്ററിയിൽ നിലവിലുള്ള ബൈനറി ഫയലുകളെ പ്രധാന Git ചരിത്രത്തിൽ നിന്ന് ഫലപ്രദമായി നീക്കം ചെയ്യുന്നതിനായി LFS-ലേക്ക് പരിവർത്തനം ചെയ്യാൻ കമാൻഡ് ഉപയോഗിക്കുന്നു. ഈ പരിവർത്തനത്തിന് ശേഷം, സ്ക്രിപ്റ്റ് പ്രവർത്തിക്കുന്നു ഒപ്പം git gc --prune=now പഴയ റഫറൻസുകൾ കാലഹരണപ്പെടാനും അനാവശ്യ ഫയലുകൾ വെട്ടിമാറ്റാനും, റിപ്പോസിറ്ററി വലുപ്പം കുറയ്ക്കുക.

മൈഗ്രേഷനു മുമ്പും ശേഷവും റിപ്പോസിറ്ററി വലുപ്പങ്ങൾ താരതമ്യം ചെയ്യുന്നതിനുള്ള ഒരു മാർഗം നൽകിക്കൊണ്ട് പൈത്തൺ സ്ക്രിപ്റ്റ് ഇത് പൂർത്തീകരിക്കുന്നു. ഉപയോഗിച്ച് ഫംഗ്ഷൻ, അത് എക്സിക്യൂട്ട് ചെയ്യുന്നു നിർദ്ദിഷ്ട ഡയറക്ടറികളുടെ ഡിസ്ക് ഉപയോഗം ലഭിക്കുന്നതിന് കമാൻഡ് ചെയ്യുക. LFS-ന് മുമ്പും ശേഷവുമുള്ള മൈഗ്രേഷൻ റിപ്പോസിറ്ററി വലുപ്പങ്ങളുടെ വ്യക്തമായ താരതമ്യം ഇത് അനുവദിക്കുന്നു. മൈഗ്രേഷൻ പ്രക്രിയയുടെ ഫലപ്രാപ്തി പരിശോധിച്ച്, റിപ്പോസിറ്ററി വലുപ്പത്തിൽ മൈഗ്രേഷൻ, ക്ലീനപ്പ് കമാൻഡുകൾ എന്നിവയുടെ സ്വാധീനം മനസ്സിലാക്കാൻ ഔട്ട്പുട്ട് സഹായിക്കുന്നു.

Git LFS മൈഗ്രേഷനും ക്ലീനപ്പ് പ്രക്രിയയും ഓട്ടോമേറ്റ് ചെയ്യുന്നു

Git LFS മൈഗ്രേഷനും ക്ലീനപ്പിനുമുള്ള ബാഷ് സ്ക്രിപ്റ്റ്

#!/bin/bash
# Step 1: Initialize LFS and track file type
git lfs install
git lfs track "*.bin"
git add .gitattributes
git commit -m "Track binary files with LFS"
# Step 2: Migrate existing files to LFS
bfg --convert-to-git-lfs '*.bin' --no-blob-protection
git reflog expire --expire=now --all
git gc --prune=now --aggressive

മൈഗ്രേഷനു ശേഷമുള്ള റിപ്പോസിറ്ററി വലുപ്പത്തിലുള്ള മാറ്റങ്ങൾ വിശകലനം ചെയ്യുന്നു

റിപ്പോസിറ്ററി സൈസ് താരതമ്യത്തിനുള്ള പൈത്തൺ സ്ക്രിപ്റ്റ്

import subprocess
def get_repo_size(path):
    result = subprocess.run(['du', '-sh', path], stdout=subprocess.PIPE)
    size = result.stdout.split()[0].decode('utf-8')
    return size
before_migration = get_repo_size('/path/to/repo_before_lfs')
after_migration = get_repo_size('/path/to/repo_after_lfs')
print(f"Size before LFS migration: {before_migration}")
print(f"Size after LFS migration: {after_migration}")

റിപ്പോസിറ്ററി വലുപ്പത്തിൽ Git LFS-ൻ്റെ സ്വാധീനം പര്യവേക്ഷണം ചെയ്യുന്നു

Git LFS-ലേക്ക് മൈഗ്രേറ്റുചെയ്യുന്നതിൻ്റെ ഒരു പ്രധാന വശം Git, Git LFS ഫയൽ സംഭരണം എങ്ങനെ കൈകാര്യം ചെയ്യുന്നു എന്നതിലെ വ്യത്യാസങ്ങൾ മനസ്സിലാക്കുക എന്നതാണ്. Git LFS നിങ്ങളുടെ റിപ്പോസിറ്ററിയിലെ വലിയ ഫയലുകളെ ചെറിയ പോയിൻ്റർ ഫയലുകൾ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു, അതേസമയം യഥാർത്ഥ ഫയൽ ഉള്ളടക്കങ്ങൾ പ്രത്യേകം സംഭരിക്കുന്നു. ഒറിജിനൽ വലിയ ഫയലുകളുടെയും പുതിയ എൽഎഫ്എസ് പോയിൻ്ററുകളുടെയും സാന്നിധ്യം കാരണം മൈഗ്രേഷൻ സമയത്ത് ഓൺ-ഡിസ്‌കിൻ്റെ വലുപ്പം താൽക്കാലികമായി വർദ്ധിപ്പിക്കാൻ ഈ വേർതിരിവ് കാരണമാകും. മറ്റൊരു ഘടകം, Git LFS വ്യത്യസ്ത കംപ്രഷൻ, സ്റ്റോറേജ് മെക്കാനിസങ്ങൾ ഉപയോഗിക്കുന്നു, ഇത് എല്ലായ്പ്പോഴും ചെറിയ റിപ്പോസിറ്ററി വലുപ്പങ്ങൾക്ക് കാരണമായേക്കില്ല, പ്രത്യേകിച്ച് മൈഗ്രേഷനുശേഷം ഉടൻ തന്നെ.

മൈഗ്രേഷനു ശേഷമുള്ള റിപ്പോസിറ്ററി സൈസ് ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിന്, ഇതുപോലുള്ള കമാൻഡുകൾ പ്രവർത്തിപ്പിക്കുന്നത് നിർണായകമാണ് ഒപ്പം . ഈ കമാൻഡുകൾ അനാവശ്യ ഫയലുകളും റഫറൻസുകളും നീക്കംചെയ്യാൻ സഹായിക്കുന്നു, റിപ്പോസിറ്ററി വലുപ്പം ഗണ്യമായി കുറയ്ക്കുന്നു. കാലക്രമേണ റിപ്പോസിറ്ററിയുടെ വലുപ്പം നിരീക്ഷിക്കുന്നതും അത് ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിനായി പതിവ് അറ്റകുറ്റപ്പണികൾ നടത്തുന്നതും പ്രധാനമാണ്. ഈ സൂക്ഷ്മതകൾ മനസ്സിലാക്കുന്നത് പ്രതീക്ഷകൾ നിയന്ത്രിക്കാനും കാര്യക്ഷമമായ മൈഗ്രേഷൻ പ്രക്രിയ ഉറപ്പാക്കാനും സഹായിക്കും.

  1. പ്രാരംഭ Git LFS മൈഗ്രേഷനുശേഷം ശേഖരണ വലുപ്പം വർദ്ധിക്കുന്നത് എന്തുകൊണ്ട്?
  2. യഥാർത്ഥ ഫയലുകളുടെയും എൽഎഫ്എസ് പോയിൻ്ററുകളുടെയും സാന്നിധ്യമാണ് വർദ്ധനവിന് കാരണം. പ്രവർത്തിക്കുന്ന ഈ വലിപ്പം കുറയ്ക്കാൻ കമാൻഡുകൾ സഹായിക്കുന്നു.
  3. എന്താണ് ചെയ്യുന്നത് ചെയ്യണോ?
  4. ഈ കമാൻഡ് കാലഹരണപ്പെട്ട reflog എൻട്രികൾ നീക്കം ചെയ്യുന്നു, ഇത് റിപ്പോസിറ്ററി വൃത്തിയാക്കാനും ഇടം ശൂന്യമാക്കാനും സഹായിക്കുന്നു.
  5. എങ്ങിനെയാണ് ജോലി?
  6. ഇത് നിലവിലുള്ള വലിയ ഫയലുകളെ Git LFS ഉപയോഗിക്കുന്നതിന് പരിവർത്തനം ചെയ്യുന്നു, അവയെ പ്രധാന Git ചരിത്രത്തിൽ നിന്ന് ഫലപ്രദമായി നീക്കുന്നു.
  7. എന്ത് കൊണ്ടാണു ഉപയോഗിച്ചത്?
  8. ഈ കമാൻഡ് ആക്രമണാത്മകമായി അനാവശ്യ ഫയലുകൾ വൃത്തിയാക്കുകയും റിപ്പോസിറ്ററി സ്റ്റോറേജ് ഒപ്റ്റിമൈസ് ചെയ്യുകയും ചെയ്യുന്നു.
  9. Git LFS ഉപയോഗിക്കുന്നതിൻ്റെ പ്രയോജനം എന്താണ്?
  10. Git LFS വലിയ ഫയലുകൾ വെവ്വേറെ സംഭരിച്ചുകൊണ്ട് റിപ്പോസിറ്ററി ക്ലോണുകളുടെ വലിപ്പം കുറയ്ക്കുന്നു, പ്രകടനം മെച്ചപ്പെടുത്തുന്നു.
  11. മൈഗ്രേഷൻ കഴിഞ്ഞാൽ ഉടനെ റിപ്പോസിറ്ററി വലിപ്പം കുറയ്ക്കാനാകുമോ?
  12. അതെ, ഓടിക്കൊണ്ട് ഒപ്പം അനാവശ്യ ഡാറ്റ നീക്കം ചെയ്യാനുള്ള കമാൻഡുകൾ.
  13. Git LFS ഉപയോഗിക്കുമ്പോൾ ഡാറ്റ നഷ്‌ടപ്പെടാനുള്ള സാധ്യതയുണ്ടോ?
  14. ഇല്ല, മൈഗ്രേഷൻ, ക്ലീനപ്പ് കമാൻഡുകൾ ശരിയായി പ്രവർത്തിപ്പിക്കുന്നിടത്തോളം, ഡാറ്റ കേടുകൂടാതെയിരിക്കും.
  15. മെയിൻ്റനൻസ് കമാൻഡുകൾ എത്ര തവണ പ്രവർത്തിപ്പിക്കണം?
  16. മെയിൻ്റനൻസ് കമാൻഡുകൾ പതിവായി പ്രവർത്തിപ്പിക്കുന്നത് നല്ലതാണ്, പ്രത്യേകിച്ച് റിപ്പോസിറ്ററിയിലെ കാര്യമായ മാറ്റങ്ങൾക്ക് ശേഷം.

Git LFS മൈഗ്രേഷനെക്കുറിച്ചുള്ള അന്തിമ ചിന്തകൾ

Git LFS-ലേക്കുള്ള മൈഗ്രേഷൻ യഥാർത്ഥ ഫയലുകളുടെയും LFS പോയിൻ്ററുകളുടെയും സഹവർത്തിത്വം കാരണം റിപ്പോസിറ്ററി വലുപ്പത്തിൽ താൽക്കാലിക വർദ്ധനവിന് കാരണമാകും. എന്നിരുന്നാലും, പോലുള്ള മെയിൻ്റനൻസ് കമാൻഡുകൾ പ്രവർത്തിപ്പിക്കുന്നു ഒപ്പം വലിപ്പം ഗണ്യമായി കുറയ്ക്കാൻ കഴിയും. Git, Git LFS ഫയൽ സംഭരണം എങ്ങനെ കൈകാര്യം ചെയ്യുന്നു എന്നതിലെ വ്യത്യാസങ്ങൾ മനസ്സിലാക്കുന്നത് ഫലപ്രദമായ മൈഗ്രേഷനായി നിർണായകമാണ്.

പ്രാരംഭ വലുപ്പം വർധിക്കുന്നത് ആശങ്കാജനകമാണെങ്കിലും, Git LFS ഉപയോഗിക്കുന്നതിൻ്റെ ദീർഘകാല നേട്ടങ്ങൾ, പ്രത്യേകിച്ച് റിമോട്ട് സ്റ്റോറേജിനും ക്ലോണിംഗ് കാര്യക്ഷമതയ്ക്കും വേണ്ടി, താൽക്കാലിക ദോഷങ്ങളേക്കാൾ കൂടുതലാണ്. പതിവ് അറ്റകുറ്റപ്പണികളും ശരിയായ കോൺഫിഗറേഷനും ഒപ്റ്റിമൈസ് ചെയ്തതും കൈകാര്യം ചെയ്യാവുന്നതുമായ ഒരു ശേഖരണ വലുപ്പം ഉറപ്പാക്കാൻ കഴിയും.