லாஸ்பி மூலம் லாஸ் டேட்டாவை டவுன்சாம்ப்ளிங் செய்யும் செயல்முறையைப் புரிந்துகொள்வது
பைத்தானில் பெரிய LAS அல்லது LAZ கோப்புகளுடன் பணிபுரியும் போது, திறமையான செயலாக்கம் மற்றும் பகுப்பாய்விற்கு கீழிறக்கம் அவசியம். , LAS தரவைப் படிக்க, எழுத மற்றும் மாற்றுவதற்கான பைதான் தொகுப்பு, LAS தலைப்புகளை உருவாக்குதல் மற்றும் திருத்துதல் போன்ற புள்ளி கிளவுட் தரவைக் கையாள பல வழிகளை வழங்குகிறது.
ஒவ்வொரு பத்தாவது புள்ளியையும் a இலிருந்து பிரித்தெடுப்பதன் மூலம் தரவுத்தொகுப்பை எவ்வாறு குறைப்பது என்பதை இந்த எடுத்துக்காட்டு காட்டுகிறது கோப்பு மற்றும் ஏற்கனவே உள்ளதை மீண்டும் பயன்படுத்தவும் . தலைப்புகள் தரவுகளுடன் எவ்வாறு தொடர்பு கொள்கின்றன என்பதைப் புரிந்துகொள்வது இதற்குத் தேவை, குறிப்பாக வெவ்வேறு புள்ளி எண்ணிக்கைகளுடன் பணிபுரியும் போது.
புதிய ஒன்றை நிறுவும் போது ஏற்கனவே உள்ள தலைப்பிலிருந்து பொருள், பயனர்கள் அடிக்கடி பொருந்தாத வரிசை அளவை எதிர்கொள்கின்றனர். தலைப்பின் காரணமாக இந்த வேறுபாடு ஏற்படுகிறது புதிய தரவுகளுடன் தானாக சீரமைக்காமல் இருக்கலாம்.
ஆஃப்செட்டுகள், அளவுகள் மற்றும் புள்ளி_கவுண்ட் போன்ற தலைப்பு பண்புக்கூறுகளை கைமுறையாக மாற்ற வேண்டுமா அல்லது இன்னும் தானியங்கி தீர்வு உள்ளதா என்பதை மதிப்பிடுவதே சவாலாகும். பயன்படுத்திக் குறைக்கும் போது இந்த மதிப்புகளை எவ்வாறு சரியாகப் புதுப்பிப்பது என்பதை இந்த இடுகை விளக்குகிறது , ஒரு பயனுள்ள செயல்முறை விளைவாக.
கட்டளை | பயன்பாட்டின் உதாரணம் |
---|---|
laspy.read() | இந்த கட்டளை ஒரு LAS அல்லது LAZ கோப்பை LasData பொருளாக மாற்றுகிறது. இது கோப்பில் இருந்து புள்ளி கிளவுட் தரவு மற்றும் தலைப்பு தகவலை பிரித்தெடுக்கிறது, இது பைத்தானில் மாற்றியமைக்கவும் செயலாக்கவும் அனுமதிக்கிறது. |
np.arange() | சீரான இடைவெளியில் குறியீடுகளின் வரிசையை உருவாக்குகிறது. இந்த சூழ்நிலையில், ஏற்றப்பட்ட புள்ளி கிளவுட் தரவிலிருந்து ஒவ்வொரு 10வது புள்ளியையும் தேர்ந்தெடுக்கிறது, இது மாதிரியை குறைக்க அவசியம். |
laspy.LasHeader() | இந்த கட்டளை LAS மற்றும் LAZ தரவுகளுக்கான புதிய தலைப்பை உருவாக்குகிறது. தலைப்பு வடிவம், பதிப்பு, ஆஃப்செட்டுகள் மற்றும் அளவீடுகள் உள்ளிட்ட முக்கிய மெட்டாடேட்டாவை வழங்குகிறது, அவை உருவாக்கும்போது அல்லது திருத்தும்போது முக்கியமானவை. . |
header.offsets | புள்ளி கிளவுட் தரவுக்கான குறைந்தபட்ச x, y மற்றும் z ஒருங்கிணைப்புகளை தீர்மானிக்கிறது. புள்ளி மேகக்கணிக்கான குறிப்புப் புள்ளியை மாற்றுவதற்கு இது உதவுகிறது, இதன் விளைவாகக் குறைத்த பிறகு சரியான தரவுப் பிரதிநிதித்துவம் கிடைக்கும். |
header.scales | அளவுக் காரணிகளை வரையறுப்பதன் மூலம் x, y மற்றும் z மதிப்புகளின் துல்லியத்தைக் குறிப்பிடுகிறது. மாதிரியைக் குறைத்த பிறகு, அளவுக் காரணிகளை மறுகணக்கீடு செய்தல் மற்றும் மாற்றியமைத்தல் ஆகியவை தரவு ஒருமைப்பாட்டைப் பேணுவதற்கு முக்கியமானதாக இருக்கும். |
copy() | ஒரு பொருளின் மேலோட்டமான நகலை உருவாக்குகிறது. இந்த வழக்கில், அசல் புள்ளி கிளவுட்டில் இருந்து ஏற்கனவே உள்ள தலைப்பை மாற்ற இது பயன்படுகிறது, புதிய தரவுத்தொகுப்பில் எந்த மாற்றமும் அசல் தரவை சேதப்படுத்தாது என்று உத்தரவாதம் அளிக்கிறது. |
downsampled_las.write() | இந்த கட்டளையானது மேம்படுத்தப்பட்ட அல்லது புதிதாக உருவாக்கப்பட்டதை எழுதுவதன் மூலம் குறைக்கப்பட்ட புள்ளி மேகத்தை புதிய LAS அல்லது LAZ கோப்பாக சேமிக்கிறது. ஒரு கோப்புக்கு பொருள். |
unittest.TestCase | இது பைத்தானின் யூனிட்டெஸ்ட் கட்டமைப்பிற்கான அடித்தள வகுப்பாகும், இது சோதனை நிகழ்வுகளை உருவாக்க பயன்படுகிறது. இந்த கட்டுரை சரியான அளவு புள்ளிகள் பராமரிக்கப்படுவதை உறுதி செய்வதன் மூலம் குறைத்தல் செயல்முறையை சோதிக்க இதைப் பயன்படுத்துகிறது. |
self.assertEqual() | ஒரு யூனிட் சோதனை இரண்டு மதிப்புகளை ஒப்பிட்டு அவை சமமாக இல்லாவிட்டால் பிழையை வழங்கும். எடுத்துக்காட்டில், குறைக்கப்பட்ட புள்ளிகளின் எண்ணிக்கை கணிக்கப்பட்ட எண்ணுடன் ஒத்திருப்பதை இது உறுதி செய்கிறது. |
லாஸ்பி மூலம் பாயிண்ட் கிளவுட் டவுன்சாம்ப்பிங்கை மேம்படுத்துதல்
இந்த இடுகையில் உள்ள முதல் ஸ்கிரிப்ட், a ஐக் குறைப்பதில் கவனம் செலுத்துகிறது பெரிய புள்ளி கிளவுட் தரவுத்தொகுப்புகளை நிர்வகிக்க தேவையான கோப்பு. ஐப் பயன்படுத்தி அசல் கோப்பை இறக்குமதி செய்வதன் மூலம் செயல்பாடு, புள்ளி மேகத்தைப் பற்றிய மெட்டாடேட்டாவைக் கொண்ட புள்ளி தரவு மற்றும் தலைப்பை நாம் அணுகலாம். டவுன்சாம்ப்ளிங் நுட்பம் ஒவ்வொரு பத்தாவது புள்ளியையும் எடுப்பதை உள்ளடக்குகிறது, இது முக்கியமான புவியியல் பண்புகளைத் தக்க வைத்துக் கொண்டு தரவுத்தொகுப்பின் அளவைக் குறைக்கிறது. இது பயன்படுத்தி செய்யப்படுகிறது குறியீடுகளின் வரிசையை உருவாக்க. புள்ளிகளைத் தேர்ந்தெடுத்த பிறகு, மெட்டாடேட்டாவில் பொருந்தக்கூடிய தன்மையை உறுதிப்படுத்த அசல் கோப்பிலிருந்து தலைப்பை நகலெடுக்கவும் புள்ளி_வடிவம் மற்றும் பதிப்பு.
இருப்பினும், அசல் தலைப்பில் உள்ள புள்ளிகளின் எண்ணிக்கையானது குறைக்கப்பட்ட தரவுகளுடன் ஒத்துப்போகாதபோது ஒரு பொதுவான சிக்கல் ஏற்படுகிறது. இதை சரிசெய்ய, நாங்கள் பயன்படுத்துகிறோம் அசல் தலைப்பின் ஆழமற்ற நகலை உருவாக்கி கைமுறையாக மாற்றியமைக்கும் செயல்பாடு குறைக்கப்பட்ட புள்ளிகளின் எண்ணிக்கையை பிரதிபலிக்கும் புலம். புதிய தலைப்பை உருவாக்கிய பிறகு, குறைக்கப்பட்ட புள்ளிகள் புதியதாக ஒதுக்கப்படும் உண்மையான x, y மற்றும் z ஆயத்தொகுதிகளைக் கொண்ட பொருள். இறுதியாக, தி லாஸ்டேட்டா ஐப் பயன்படுத்தி புதிய LAZ கோப்பாகச் சேமிக்கப்படுகிறது எழுது() முறை. பெரிய புள்ளி மேகங்களிலிருந்து சிறிய தரவுத்தொகுப்புகளைப் பிரித்தெடுக்க வேண்டிய பயனர்களுக்கு இந்த ஸ்கிரிப்ட் பயனுள்ளதாக இருக்கும்.
இரண்டாவது ஸ்கிரிப்ட், கீழேயுள்ள தரவுகளுக்கான ஆஃப்செட்கள் மற்றும் அளவுகளை தானாக மீண்டும் கணக்கிடுவதன் மூலம் முதல் ஸ்கிரிப்டை நீட்டிக்கிறது. புள்ளி மேகங்களுடன் பணிபுரியும் போது, துல்லியமான ஆஃப்செட்களைக் கொண்டிருப்பது மிகவும் முக்கியமானது, ஏனெனில் அவை 3D இடத்தில் தரவின் தோற்றத்தைக் குறிப்பிடுகின்றன. தி பண்புக்கூறு குறைந்தபட்சம் x, y, மற்றும் z ஆயத்தொலைவுகளுடன் குறைக்கப்பட்ட புள்ளிகளிலிருந்து புதுப்பிக்கப்படுகிறது. இதேபோல், புள்ளி தரவின் துல்லியத்தை பாதிக்கும் அளவு காரணிகள் ஐப் பயன்படுத்தி அமைக்கப்படுகின்றன பண்பு. இந்த ஸ்கிரிப்ட் புள்ளி கிளவுட்டின் அளவைக் குறைப்பது மட்டுமல்லாமல், தரவு துல்லியமாகவும் சீரமைக்கப்படுவதையும் உறுதிசெய்கிறது, இது நடைமுறை பயன்பாட்டிற்கு மிகவும் பொருத்தமானது.
இறுதியாக, இறுதி ஸ்கிரிப்ட் பைத்தானின் அலகு சோதனையை நிரூபிக்கிறது கட்டமைப்பு. இந்த ஸ்கிரிப்ட்டில், ஒரு சோதனை கேஸ், குறைக்கப்பட்ட புள்ளி எண்ணிக்கை கணிக்கப்பட்ட மதிப்புடன் ஒத்துப்போகிறதா என்பதை தீர்மானிக்கிறது. சூழல்கள் மற்றும் தரவுத்தொகுப்புகள் முழுவதும் தரமிறக்குதல் செயல்முறை தொடர்ந்து செயல்படுவதை உறுதிசெய்வதற்கு இது மிகவும் முக்கியமானது. சோதனை வழக்கு ஐப் பயன்படுத்தி வரையறுக்கப்படுகிறது வகுப்பு, மற்றும் ஒப்பீடு ஐப் பயன்படுத்தி நடத்தப்படுகிறது முறை. பணிப்பாய்வு சோதனையைச் சேர்ப்பதன் மூலம், பெரிய திட்டங்கள் அல்லது பைப்லைன்களுக்குப் பயன்படுத்துவதற்கு முன், டவுன்சாம்ப்ளிங் செயல்முறை சரியாகச் செயல்படுகிறதா என்பதை உறுதிப்படுத்திக் கொள்ளலாம். இந்த ஸ்கிரிப்ட் பயனர்கள் பல புள்ளி கிளவுட் கோப்புகளுடன் பணிபுரியும் போது சிக்கல்கள் மற்றும் முரண்பாடுகளைத் தவிர்க்க உதவுகிறது.
லாஸ்பியைப் பயன்படுத்தி LAZ கோப்புகளை இறக்குதல்: புள்ளி கிளவுட் தரவைக் கையாளுதல்
பழைய LAZ கோப்பிலிருந்து ஒவ்வொரு பத்தாவது புள்ளியையும் பிரித்தெடுக்கவும் புதிய தரவுத்தொகுப்பிற்கான தலைப்பு மாற்றங்களை நிர்வகிக்கவும் இந்த முறை பைதான் மற்றும் லாஸ்பி தொகுப்பைப் பயன்படுத்துகிறது.
import laspy
import numpy as np
from copy import copy
# Load the existing LAZ file
las = laspy.read("input_file.laz")
# Downsample by taking every 10th point
indices = np.arange(0, len(las.points), 10)
downsampled_points = las.points[indices]
# Copy the header and adjust the point count
header = copy(las.header)
header.point_count = len(downsampled_points)
# Create new LasData with downsampled points
d_las = laspy.LasData(header)
d_las.points = downsampled_points
# Write to a new LAZ file
d_las.write("downsampled_output.laz")
LAZ கோப்புகளை இறக்கும் போது ஆஃப்செட் மற்றும் ஸ்கேல் சரிசெய்தலை தானியக்கமாக்குகிறது
Python இன் இந்தப் பதிப்பு தானாகக் குறைக்கப்பட்ட தரவுகளின் அடிப்படையில் ஆஃப்செட்கள் மற்றும் அளவுகளை மீண்டும் கணக்கிடுகிறது.
import laspy
import numpy as np
# Load the original LAZ file
las = laspy.read("input_file.laz")
# Downsample by taking every 10th point
indices = np.arange(0, len(las.points), 10)
downsampled_points = las.points[indices]
# Create new header and adjust offsets/scales
header = laspy.LasHeader(point_format=las.header.point_format, version=las.header.version)
header.offsets = np.min([las.x[indices], las.y[indices], las.z[indices]], axis=1)
header.scales = np.array([0.01, 0.01, 0.01]) # Set new scales
# Create new LasData and write to file
downsampled_las = laspy.LasData(header)
downsampled_las.points = downsampled_points
downsampled_las.write("downsampled_with_scales.laz")
LAS/LAZ கோப்புகளை டவுன்சாம்ப்ளிங்கிற்கான அலகு சோதனை
இந்த பைதான் ஸ்கிரிப்ட் பல சூழல்களில் டவுன்சாம்ப்ளிங் செயல்முறை சரியாக வேலை செய்கிறது என்பதை உறுதிப்படுத்த ஒரு யூனிட் சோதனையை உள்ளடக்கியது.
import unittest
import laspy
import numpy as np
class TestDownsampling(unittest.TestCase):
def test_downsample_point_count(self):
las = laspy.read("input_file.laz")
indices = np.arange(0, len(las.points), 10)
downsampled_points = las.points[indices]
self.assertEqual(len(downsampled_points), len(indices))
if __name__ == "__main__":
unittest.main()
LAS கோப்பு மெட்டாடேட்டா மற்றும் மேம்பட்ட டவுன்சாம்ப்ளிங் நுட்பங்களைக் கையாளுதல்
பெரிய தரவுத்தொகுப்புகளுடன் பணிபுரியும் போது , உண்மையான புள்ளி கிளவுட் தரவை நிர்வகிப்பதைப் போலவே மெட்டாடேட்டாவை நிர்வகிப்பது மிகவும் முக்கியமானது. துல்லியத்தை பராமரித்தல் மாதிரியை குறைத்த பிறகு மதிப்புகள் ஒரு குறிப்பிடத்தக்க சிரமம். புள்ளி கிளவுட் தரவின் ஆயத்தொலைவுகள் (x, y மற்றும் z) மாறுவதால், தலைப்பு இந்த மாற்றங்களை பிரதிபலிக்க வேண்டும். மீண்டும் கணக்கிடுதல் ஒவ்வொரு பரிமாணத்திற்கும் குறைந்தபட்ச மதிப்புகளை மீண்டும் கணக்கிட வேண்டும், அதேசமயம் செதில்கள் புள்ளி தரவின் துல்லியத்தை தீர்மானிக்கவும், குறிப்பாக சேமிப்பிற்காக.
லாஸ் கோப்பில் உள்ள கூடுதல் பரிமாணங்களின் நேர்மையை மதிப்பிடுவதற்கான மற்றொரு காரணியாகும். தீவிரம் அல்லது GPS நேரம் போன்ற சாதாரண x, y மற்றும் z ஆயத்தொலைவுகளைத் தவிர மற்ற தகவல்களை வைத்திருக்க கூடுதல் பைட்டுகள் பொதுவாகப் பயன்படுத்தப்படுகின்றன. தரவுத்தொகுப்பில் இந்த கூடுதல் பரிமாணங்கள் இருந்தால், அவற்றைக் குறைக்கும் போது கையாள வேண்டும். கூடுதல் பரிமாணங்களில் உள்ள புள்ளிகளின் எண்ணிக்கையானது முதன்மைத் தரவில் குறைக்கப்பட்ட புள்ளி எண்ணிக்கையுடன் ஒத்துப்போகிறது என்பதை நீங்கள் உத்தரவாதம் செய்ய வேண்டும். தி உள்ள செயல்பாடு LAS தலைப்பில் தனிப்பயன் பரிமாணங்களைச் சேர்ப்பதை செயல்படுத்துகிறது.
இறுதியாக, புள்ளி மேகங்களைக் குறைக்கும் போது வேக உகப்பாக்கம் ஒரு முக்கியமான காரணியாகும். தலைப்பில் மனித மாற்றங்கள் பொதுவாக தேவைப்படும் போது, திறமையான அட்டவணைப்படுத்தலை மேம்படுத்துவதன் மூலமும், வரிசை செயல்பாடுகளைப் பயன்படுத்துவதன் மூலமும் செயல்முறையை தானியக்கமாக்குகிறது செயல்முறையை கணிசமாக துரிதப்படுத்த முடியும். சக்தியைப் பயன்படுத்துவதன் மூலம் உணர்ச்சியற்ற, நீங்கள் செயல்திறனை தியாகம் செய்யாமல் மகத்தான தரவுத்தொகுப்புகளை விரைவாக நிர்வகிக்கலாம். இது பெரிய திட்டங்களுக்கு தீர்வுகளை விரிவுபடுத்த அல்லது பல LAZ கோப்புகளை செயலாக்க பைப்லைன்களை தானியக்கமாக்க உங்களை அனுமதிக்கிறது.
- பொருந்தாத வரிசை பரிமாணங்களை எவ்வாறு கையாள்வது ?
- இதை சரிசெய்ய, உறுதி செய்ய வேண்டும் ஹெடரில் உள்ள தரவுகள் குறைக்கப்பட்ட தரவுகளில் உள்ள புள்ளிகளின் உண்மையான எண்ணிக்கையை ஒத்துள்ளது. தேவைக்கேற்ப எண்ணிக்கையை கைமுறையாக மாற்றவும்.
- நான் எப்போதும் மீண்டும் கணக்கிட வேண்டும் மற்றும் மாதிரியை குறைத்த பிறகு?
- ஆம், இந்த மதிப்புகளை மீண்டும் கணக்கிடுவது அவசியம், குறிப்பாக பெரிய தரவுத்தொகுப்புகளுக்கு. தி புதிய குறைந்தபட்ச மதிப்புகளைக் குறிக்கிறது தரவு துல்லியத்தை உறுதி செய்கிறது.
- முடியும் LAS கோப்புகளில் கூடுதல் பரிமாணங்களைக் கையாளவா?
- ஆம், மேலும் பரிமாணங்களைப் பயன்படுத்தி நிர்வகிக்கலாம் அம்சம் , இது தீவிரம் அல்லது ஜிபிஎஸ் நேரம் போன்ற தனிப்பயன் பரிமாணங்களை அமைக்க உங்களை அனுமதிக்கிறது.
- உள்ளது உடன் இறக்கம் தேவை ?
- அவசியமில்லை என்றாலும், குறியீடுகளை திறமையாக உருவாக்கி வரிசைகளை கையாள்வதன் மூலம் பாரிய தரவுத்தொகுப்புகளை கையாள உதவுகிறது.
- நான் எப்படி குறைப்பு செயல்முறையை விரைவுபடுத்துவது?
- பயன்படுத்தவும் வரிசை செயல்பாடுகள் மற்றும் திறமையாக குறியீட்டு செய்ய. பெரிய புள்ளி மேகங்களுடன் பணிபுரியும் போது இது செயல்திறனை மேம்படுத்துகிறது.
சாம்பிள் செய்யும்போது பரிமாணப் பொருத்தமின்மையைத் தவிர்க்க உடன் கோப்புகள் , தி சொத்து தலைப்பில் கைமுறையாக சரிசெய்யப்பட வேண்டும். ஆஃப்செட்டுகள் மற்றும் அளவீடுகளை மீண்டும் கணக்கிடுவது புதிய தரவின் சரியான பிரதிநிதித்துவத்திற்கு உத்தரவாதம் அளிக்கிறது.
தலைப்பு மாற்றங்கள் போன்ற சில கூறுகளுக்கு கைமுறையான தலையீடு தேவைப்படுகிறது, மற்றவற்றைப் பயன்படுத்தி தானியங்கு செய்ய முடியும் வேகத்தை அதிகரிக்க மற்றும் பெரிய தரவுத்தொகுப்புகளை நிர்வகிக்க. யூனிட் சோதனையானது, உங்களின் தரமிறக்குதல் பணிப்பாய்வுகளின் வலிமையை மேம்படுத்துகிறது, இது உண்மையான சூழ்நிலைகளில் மிகவும் திறமையானதாக ஆக்குகிறது.