Czy web scraping powinniśmy stosować zawsze? NIE. W tym artykule dowiesz się kiedy nie powinniśmy scrapować oraz dlaczego niektóre strony tego zakazują.
Kategoria: web scraping
Dlaczego warto scrapować?
Internet jest największym zbiorem danych zgromadzonych przez ludzkość. Niezliczone pokłady materiałów naukowych, artykułów, zdjęć. Ogrom wiedzy dostępnej za darmo. A gdyby tak móc zebrać tę wiedzę i ją przetwarzać? Jest na to sposób, nazywa się web scraping i w tym artykule powiem Ci, dlaczego warto się tym zainteresować oraz dlaczego warto scrapować.
Jak działają boty Google? Web crawling
Każdego dnia internet przemierzany jest przez tysiące botów, głównie firmy Google. Jak działają takie boty? W jaki sposób widzą strony internetowe i jak się po nich poruszają? Jak dużo jest botów w internecie?
Web Scraping w Pythonie
Wyniki ankiety przeprowadzanej przez JetBrains wśród programistów Pythona pokazują, że 1/3 developerów używa Pythona do tworzenia web parserów, crawlerów i scraperów. Z całą pewnością programu tego typu są niezwykle przydatne, dlatego chciałbym podzielić się z Wami jednym ze sposobów ich tworzenia.