DATAtourisme

Résultats du sondage utilisateurs et pistes de travail

Bonjour à tous,

Voici les résultats du sondage en ligne, qui comptabilisé 64 répondants (28 identifiés + 36 anonymes) :

  • Difficultés liées à la qualité des données : 25 réponses
  • Difficultés liées au format RDF des données : 23 réponses
  • Difficultés liées à la configuration d’un flux : 22 réponses
  • Difficultés liées au mode d’accès asynchrone : 10 réponses
  • Difficultés liées à la mise en place et au maintien opérationnel d’une base de données locale : 8 réponses
  • Difficultés liées au volume des données : 6 réponses
  • Aucune difficulté rencontrée : 16 réponses

La Direction Générale des Entreprises et l’ensemble de l’équipe DATAtourisme remercient les personnes ayant pris le temps de répondre à ce sondage.

Nous sommes en train d’étudier différentes pistes d’évolution pour répondre aux problématiques identifiées, et avons le plaisir de vous annoncer de premières mesures et évolutions :

S’agissant de la qualité des données :

  • Nous sommes en contact avec chaque territoire afin de compléter au plus tôt la couverture géographique nationale et intégrer les données des départements manquants,
  • Un travail approfondi est en cours avec les territoires, visant à compléter et améliorer les fiches descriptives des POI disponibles, à commencer par les sites « incontournables » de la Destination France,
  • De nouvelles données sont en cours de collecte, en lien avec la crise sanitaire, afin de préciser les modalités d’accueil des clientèles et mettre à jour les périodes d’ouverture de chaque lieu,
  • Un outil est en réflexion pour identifier automatiquement un certain nombre d’erreurs ou de manquements et faciliter leur correction.

Pour répondre aux difficultés liées au format RDF des données, deux nouveaux formats d’export seront proposés aux réutilisateurs dans les prochains jours :

Export compressé dans un format ZIP, composé de multiple fichiers JSON :

• un fichier par POI, où l’intégralité de sa hiérarchie est détaillée

• un fichier d’index, reprenant la liste des POI inclus dans l’export + leur date de mise à jour (uuid + label + lastUpdateDatatourisme)

• un fichier de contexte Json-LD, permettant d’obtenir une version sémantique de chaque POI, pour les utilisateurs interessés.

Export compressé dans un format ZIP, composé de multiple fichiers XML :

• un fichier par POI, où l’intégralité de sa hiérarchie est détaillée

• un fichier d’index, reprenant la liste des POI inclus dans l’export + leur date de mise à jour (uuid + label + lastUpdateDatatourisme)

Ces nouveaux formats présenteront de nombreux avantages répondants à différents objectifs :

  • Il est plus simple à exploiter : les données étant au format JSON ou XML classiques, complètes pour chaque POI (sauf référence à d’autres POI)
  • Pour l’export composé de fichiers JSON, la complexité du web sémantique est externalisée dans un fichier context.json, optionnel pour le traitement des fichiers.
  • Il est plus simple à traiter : les données étant contenues dans plusieurs fichiers, l’utilisateur n’a pas besoin de se préoccuper de la gestion de la mémoire propre au traitement de fichiers volumineux.
  • Sur la base du fichier d’index, l’utilisateur peut facilement exécuter un différentiel pour connaître les POI qui ont été supprimés et ceux qui ont été mis à jour.
  • Il est plus simple à préparer côté serveur : il s’agit d’un assemblage de fichiers pré-calculé pour l’ensemble des flux

Enfin, un développement va être réalisé dans les prochaines semaines afin de simplifier les étapes de configuration d’un flux : il s’agira de proposer une alternative de création de flux plus simple que le query editor, basée sur 2 étapes : la sélection des types de POI (type principaux et/ou types secondaires), et la sélection du territoire (Région, département).

Nous communiquerons dès que ces évolutions seront opérationnelles.

Nous poursuivons également les réflexions pour apporter à l’avenir d’autres améliorations destinées à faciliter l’expérience utilisateur sur la plateforme www.datatourisme.gouv.fr, en lien avec les remontées régulières que nous recevons des utilisateurs via ce forum, et ne manquerons pas de vous tenir informés.

A très vite !
L’équipe DATAtourisme

2 « J'aime »

:heart_eyes: :star_struck: :star_struck:

Excellentes initiatives ! Hâte de pouvoir tester les formats JSON :grinning:

Bonjour,
Avez-vous avancé sur ce sujet qui date d’il y a 7 mois ?

Les formats que vous proposez sur DataTourisme sont en effet peu accessibles et peu utilisés dans le milieu de l’Open Data.

Il faudrait faciliter l’ouverture de ces données au plus grand nombre en utilisant des formats plus facilitateurs pour la réutilisation (CSV, JSON…). Inspirez-vous de ce que font les autres par exemple.

Vous vous faites plaisir avec le format RDF mais l’Open Data n’a pas comme but de faire de la recherche fondamentale ou d’utiliser le Machine Learning : il faut juste proposer des données au plus grand nombre, dans un format ouvert et facile d’accès.

Là, vous avez oublié le principe KISS.

Merci.

Bonsoir,

Les formats JSON et XML décrits dans cette discussion, sont disponibles depuis le mois de juin 2020, pour répondre aux attentes des utilisateurs ne souhaitant pas exploiter le RDF.
Nous avons en plus mis en place un assistant qui permet de créer des flux plus simplement sur la plateforme, en sélectionnant les catégories de données et la zone géographique, puis le format des données.
Quant au CSV, plusieurs fichiers sont mis à disposition sur https://www.data.gouv.fr/fr/datasets/datatourisme-la-base-nationale-des-donnees-du-tourisme-en-open-data/

A bientôt,
L’équipe DATAtourisme