L'objectif est de récupérer le contenu depuis l'ancien site de Geotribu (2007-2015) pour l'intégrer au nouveau site basé sur MkDocs et dont le contenu est donc en markdown.
Deux volets au projet :
- web scraping avec Scrapy
- conversion et export des contenus en markdown avec markdownify
Pour plus d'infos techniques, consulter la documentation.
- Python 3.7+
- disposer de l'ancien site déployé sur une URL accessible. URL par défaut : https://web.archive.org/web/20170423052005/http://geotribu.net/.