Bonjour à tous,
Voici les résultats du sondage en ligne, qui comptabilisé 64 répondants (28 identifiés + 36 anonymes) :
- Difficultés liées à la qualité des données : 25 réponses
- Difficultés liées au format RDF des données : 23 réponses
- Difficultés liées à la configuration d’un flux : 22 réponses
- Difficultés liées au mode d’accès asynchrone : 10 réponses
- Difficultés liées à la mise en place et au maintien opérationnel d’une base de données locale : 8 réponses
- Difficultés liées au volume des données : 6 réponses
- Aucune difficulté rencontrée : 16 réponses
La Direction Générale des Entreprises et l’ensemble de l’équipe DATAtourisme remercient les personnes ayant pris le temps de répondre à ce sondage.
Nous sommes en train d’étudier différentes pistes d’évolution pour répondre aux problématiques identifiées, et avons le plaisir de vous annoncer de premières mesures et évolutions :
S’agissant de la qualité des données :
- Nous sommes en contact avec chaque territoire afin de compléter au plus tôt la couverture géographique nationale et intégrer les données des départements manquants,
- Un travail approfondi est en cours avec les territoires, visant à compléter et améliorer les fiches descriptives des POI disponibles, à commencer par les sites « incontournables » de la Destination France,
- De nouvelles données sont en cours de collecte, en lien avec la crise sanitaire, afin de préciser les modalités d’accueil des clientèles et mettre à jour les périodes d’ouverture de chaque lieu,
- Un outil est en réflexion pour identifier automatiquement un certain nombre d’erreurs ou de manquements et faciliter leur correction.
Pour répondre aux difficultés liées au format RDF des données, deux nouveaux formats d’export seront proposés aux réutilisateurs dans les prochains jours :
Export compressé dans un format ZIP, composé de multiple fichiers JSON :
• un fichier par POI, où l’intégralité de sa hiérarchie est détaillée
• un fichier d’index, reprenant la liste des POI inclus dans l’export + leur date de mise à jour (uuid + label + lastUpdateDatatourisme)
• un fichier de contexte Json-LD, permettant d’obtenir une version sémantique de chaque POI, pour les utilisateurs interessés.
Export compressé dans un format ZIP, composé de multiple fichiers XML :
• un fichier par POI, où l’intégralité de sa hiérarchie est détaillée
• un fichier d’index, reprenant la liste des POI inclus dans l’export + leur date de mise à jour (uuid + label + lastUpdateDatatourisme)
Ces nouveaux formats présenteront de nombreux avantages répondants à différents objectifs :
- Il est plus simple à exploiter : les données étant au format JSON ou XML classiques, complètes pour chaque POI (sauf référence à d’autres POI)
- Pour l’export composé de fichiers JSON, la complexité du web sémantique est externalisée dans un fichier context.json, optionnel pour le traitement des fichiers.
- Il est plus simple à traiter : les données étant contenues dans plusieurs fichiers, l’utilisateur n’a pas besoin de se préoccuper de la gestion de la mémoire propre au traitement de fichiers volumineux.
- Sur la base du fichier d’index, l’utilisateur peut facilement exécuter un différentiel pour connaître les POI qui ont été supprimés et ceux qui ont été mis à jour.
- Il est plus simple à préparer côté serveur : il s’agit d’un assemblage de fichiers pré-calculé pour l’ensemble des flux
Enfin, un développement va être réalisé dans les prochaines semaines afin de simplifier les étapes de configuration d’un flux : il s’agira de proposer une alternative de création de flux plus simple que le query editor, basée sur 2 étapes : la sélection des types de POI (type principaux et/ou types secondaires), et la sélection du territoire (Région, département).
Nous communiquerons dès que ces évolutions seront opérationnelles.
Nous poursuivons également les réflexions pour apporter à l’avenir d’autres améliorations destinées à faciliter l’expérience utilisateur sur la plateforme www.datatourisme.gouv.fr, en lien avec les remontées régulières que nous recevons des utilisateurs via ce forum, et ne manquerons pas de vous tenir informés.
A très vite !
L’équipe DATAtourisme