Atelier de grattage Web 

Inscrivez-vous à ce séminaire.

Le Web est devenu une source de données pour la recherche quotidienne et scientifique. Bien qu'il existe de nombreuses initiatives visant à faciliter l'échange de données, la plupart des contenus du Web sont écrits en HTML simple. Cet atelier présentera trois approches (Google Sheets, Python et R), de la plus simple à la plus avancée, pour gratter les données du Web dans un format standard comme CSV, XML et JSON, et comment ces techniques peuvent être appliquées au travail et à la recherche au quotidien.

Cet atelier sera en anglais, mais les questions en français sont les bienvenues.

Liens connexes

Haut de page