Lær at bruge Python og smuk suppe til webskrabning på dynamiske websteder
Daniel Marino
31 december 2024
Lær at bruge Python og smuk suppe til webskrabning på dynamiske websteder

Webskrabning kan være svært, især for dynamiske websteder som dem, der bruger JavaScript. Forskellige løsninger kan opnås ved at bruge værktøjer såsom Beautiful Soup til statisk HTML og Selen til dynamiske sider. At finde API-endepunkter kan også gøre dataudtræk lettere. Operationer kører godt, når performance og moralsk skrabningsmetoder er afbalancerede.

Brug af JSoup til at gengive dynamisk JavaScript-forbedret HTML
Lucas Simon
16 oktober 2024
Brug af JSoup til at gengive dynamisk JavaScript-forbedret HTML

Vanskelighederne ved at udtrække HTML fra websider, der i høj grad er afhængige af JavaScript ved hjælp af JSoup, er dækket i denne artikel. Alternative teknikker, såsom Selenium og Puppeteer, undersøges for at fange den endelige gengivede HTML, fordi JSoup ikke er i stand til at køre JavaScript.