Nous vous informons de la mise en production ce matin de deux nouveaux formats de données, disponibles dans votre interface diffuseur. Cette nouveauté fait suite aux suggestions des utilisateurs, collectées dans le cadre de notre dernier sondage en ligne.
"Fichiers JSON" : export compressé dans un format ZIP, composé de multiples fichiers JSON
• un fichier par POI, où l’intégralité de sa hiérarchie est détaillée
• un fichier d’index, reprenant la liste des POI inclus dans l’export + leur date de mise à jour (label + lastUpdateDatatourisme + file)
• un fichier de contexte Json-LD, permettant d’obtenir une version sémantique de chaque POI, pour les utilisateurs interessés.
"Fichiers XML" : export compressé dans un format ZIP, composé de multiples fichiers XML.
• un fichier par POI, où l’intégralité de sa hiérarchie est détaillée
• un fichier d’index, reprenant la liste des POI inclus dans l’export + leur date de mise à jour (label + lastUpdateDatatourisme + file)
Ces nouveaux formats présentent de nombreux avantages répondants à différents objectifs :
• Ils sont plus simples à exploiter : les données étant au format JSON ou XML classiques, complètes pour chaque POI
• Pour l’export composé de fichiers JSON, la complexité du web sémantique est externalisée dans un fichier context.json, optionnel pour le traitement des fichiers.
• Ils sont plus simples à traiter : les données étant contenues dans plusieurs fichiers, l’utilisateur n’a pas besoin de se préoccuper de la gestion de la mémoire propre au traitement de fichiers volumineux.
• Sur la base du fichier d’index, l’utilisateur peut facilement exécuter un différentiel pour connaître les POI qui ont été supprimés et ceux qui ont été mis à jour.
• La propriété file du fichier d’index, fournit le chemin (liste des dossiers ou « path ») et le nom du fichier concerné. Il n’est pas nécessaire de « scanner » les dossiers de l’archive.
• Ils sont plus simples à préparer côté serveur : il s’agit d’un assemblage de fichiers pré-calculé pour l’ensemble des flux
A noter : ces formats demandent davantage d’espace sur vos machines pour l’hébergement des données. A titre d’exemple, la base actuelle composée de 375.000 POI génère, pour le format « Fichiers JSON », un fichier compressé de 900 Mo soit 5 Go une fois décompressé.
Toute l’équipe DATAtourisme remercie @Simon_BLUM et @Julien_PERRON qui ont apporté leur aide à cette réalisation en étant bêta testeurs de ces nouveaux formats !