$lang['tuto'] = "tutorials"; ?> Web-scraping tutorials Bloc de correu electrònic temporal!
Aprendre a utilitzar Python i Beautiful Soup per al raspat web en llocs web dinàmics
Daniel Marino
31 de desembre 2024
Aprendre a utilitzar Python i Beautiful Soup per al raspat web en llocs web dinàmics

El raspat web pot ser difícil, especialment per a llocs web dinàmics com els que utilitzen JavaScript. Es poden obtenir diverses solucions utilitzant eines com Beautiful Soup per a HTML estàtic i Selenium per a pàgines dinàmiques. Trobar punts finals de l'API també pot facilitar l'extracció de dades. Les operacions funcionen bé quan el rendiment i els mètodes de raspat moral estan equilibrats.

Ús de JSoup per renderitzar HTML dinàmic millorat amb JavaScript
Lucas Simon
16 d’octubre 2024
Ús de JSoup per renderitzar HTML dinàmic millorat amb JavaScript

En aquest article es tracten les dificultats d'extreure HTML de pàgines web que depenen significativament de JavaScript mitjançant JSoup. S'investiguen tècniques alternatives, com ara Selenium i Puppeteer, per capturar l'HTML renderitzat final perquè JSoup no pot executar JavaScript.