Le jeudi 24 mai 2018 de 14h30 à 16h30 les Tuto@Mate ont acceuilli Jean-Baptiste Pressac sur le thème : Introduction au web scraping avec Scrapy
Vous souhaitez extraire des données d’un forum de discussion ou d’un blog et vous n’avez aucune idée sur la manière de procéder ? Vous avez une vague notion de ce qu’est le HTML, les CSS et la programmation en Python ? Lors de ce Tuto@Mate, nous abordons le principe de l’extraction de données encapsulées dans une page web avec la librairie Python Scrapy, tout en commençant par voir comment s’en passer. Car entre les flux RSS, les API et autres SPARQL Endpoint, les éditeurs de sites internet donnent de plus en plus la possibilité de récupérer les données libérées de leur mise en forme en HTML.
Les transparents de la présentation en ligne sont disponibles ici !