DATAtourisme

Suivi des POI dans le temps - Maj de base

Bonjour

J’ai créé une base de donnée début 2023 à partir des POIs (campings, gites) …
Aujourd’hui j’essaye de mettre à jour la base et je me rends compte que c’est très difficile.

Sur 7700 poi référencés par leur URI la mise à jour en supprime prés de 1000 et en ajoute un peu moins de 1000. Beaucoup sont supprimés puis recréés.
Mais même en essayant de les retrouver par le nom + commune et le n° de telephone + commune, il reste encore près de 690 POIs possiblement supprimés (uri non retrouvé) sans que je sache combien ont été recrées sous un nouvel uri.

Que signifie la mention « Ne pas aligner » sur la page | DATAtourisme ?

En l’occurence (et ce n’est qu’un exemple parmi beaucoup d’autres), ce camping a été supprimé et non recrée alors qu’il existe toujours (https://www.camping-maubuisson.com/).

Quelle est la méthode à suivre pour conserver le lien entre 2 mises à jour de POI.
Avec des suppressions puis des créations (nouvel uri) comment peut-on faire ?

Camping de la Garenne enregistré sous l’uri : | DATAtourisme, supprimé puis recréé avec l’uri Camping de la Garenne | DATAtourisme
Dans le cas présent l’uri passe de /29 à /28
Est ce qu’il convient de prendre uniquement en compte la fin de l’uri pour conserver le lien ?

De façon similaire au camping de la Garenne, il y a pas moins de 141 POI qui ont été supprimés puis recréés dans le département du Nord. Y-a-t’il eu un problème ? Est ce pour cela que les URI sont légerement différentes ? Dans ce cas quelle est la régle à appliquer pour pouvoir faire le lien.
Est ce valable pour d’autres départements ?

Merci pour vos réponses

Cordialement

Bonjour @Brunaud_DEVILLARD

L’id (uri) de chaque POI est stable, juste l’URI principale, vous pouvez vous en servir comme clé.
Vous disposez des id dans le flux json d’index à la racine de vos flux
« ne pas aligner » est une mention pour nos producteurs de données afin qu’ils laissent DATAtourisme injecter cette valeur lors de leur maj.

Si l’URI est stable et permet d’identifier de façon unique un POI comment se fait-il que pratiquement tous les POIs de type camping du département du Nord ont maintenant un nouvel URI ?

Voici le lien vers un fichier ods avec la liste des uri des hébergements du département du Nord en 2023 et en 2024 :

Non seulement les URI ont changé (le plus souvent uniquement le champ lastupdate) mais beaucoup de campings ont disparu du flux alors qu’ils existent encore.

Lorsqu’un POI disposant d’un URI a des informations (telephone, email, …) qui changent, est-il modifié ou bien supprimé et recréé sous un nouvel URI ?

De façon similaire voici les campings de Carnac en 2023 et maintenant en 2024 :

Tous les campings de Carnac dans le flux de janvier 2023 ont maintenant un nouvel uri.

Est ce normal qu’ils aient été tous recréés ?

Si oui comment peux-t-on conserver dans le temps un lien entre un POI dont l’URI change au fil des mois ?

Voici la synthèse par département entre uri présents début 2023, supprimés, créés puis présents en 2024. Le périmetre couvre les campings, les gites et les auberges de jeunesse.

Vous noterez le cas de la Creuse où tous les POIs ont été supprimés puis recréés.

Merci pour vos réponses. En l’état actuel je ne sais plus comment je dois procéder pour mettre à jour ma base de POIs

Cordialement

Bonjour @Brunaud_DEVILLARD
Il y a un cas où le même POI change d’URI, c’est quand le producteur change de système d’information, ce qui est très rare. Cependant, il y a eu effectivement quelques changements dernièrement : effectivement le département du Nord et 3 départements de l’ancienne région Limousin.
Nous communiquerons à l’avenir sur ces bascules afin que vous puissiez agir de votre côté si besoin.
En vous souhaitant une bonne semaine

Bonjour @Jean-Francois_TRICHA

Merci pour ce retour. Effectivement il serait interessant que les utilisateurs de la plateforme DataTourisme soient tenus informés de ces évenements pour pouvoir en tenir en compte.

Je pense malheureusement qu’il y a bien d’autres cas de figures ou un POI change d’URI.

Vous trouverez sur le cloud en suivant le lien ci-dessous une analyse des 1008 hébergements (#Camping, #StopOverOrGroupLodge, #YouthHostelAndInternationalCenter) supprimés entre le 29 janvier 2023 et le 31 janvier 2024.

Plusieurs constats :

  • sur les 1008 POI (campings, refuges et gîtes d’étape, auberge de jeunesse et cis) qui ont été supprimés du flux, je vais en conserver 859.

  • Les 149 POI supprimés correspondent à :

  • 49 fermetures effectives d’établissements
  • 25 doublons
  • 75 établissements dont l’ontologie est erronée. Le cas le plus courant étant les gites de groupe (#GroupLodging) que l’on classe en refuge et gite d’étape(#StopOverOrGroupLodge).

Le plus grave pour moi est que sur les 859 POI supprimés entre 2023 et 2024 :
555 non maintenant plus d’URI dans datatourisme alors que ces hébergements existent toujours.
304 ont été recréés après avoir été supprimés, ils ont donc un nouvel URI.

Force est donc de constater qu’il n’est pas facile de maintenir à jour une base de POI issue de DataTourisme.

Je serai curieux de savoir comment les autres utilisateurs de la plateforme.font pour gérer ce genre de difficultés.

NB: dans le fichier .ods la colonne uri correspond à l’uri de début 2023. La colonnne newuri correspond au nouvel uri du POI lorsqu’il a été recrée. Si il est indiqué idem c’est qu’il n’a pas été recréé et que je vais devoir garder l’ancienne référence qui m’envoit inexorablement vers le message comme quoi il a été supprimé. Je ne vois malheureusement pas quoi faire d’autre.

Bien cordialement

Merci @Brunaud_DEVILLARD
Votre fichier est sur mon bureau et je vais questionner les producteurs concernés pour connaitre la raison de ces disparitions
Bonne soirée
Jean François

Bonjour

Avez-vous pu avoir un début de réponse sur ces suppressions ou bien est ce encore trop tôt pour le savoir ?

Cordialement
Brunaud Devillard

Bonsoir
Non je n’ai pas eu le temps de m’y pencher et cela va être difficile…
Pour information, un nouveau département change de SI: le Morbihan.
Les données devraient disparaitre et revenir avec de nouvelles URI dans les prochains jours…

Merci pour ce retour.

Concernant le Morbihan vous savez si c’est dans une semaine, un mois ?
Je pose la question pour savoir si j’attends ou pas que ce changement ait eu lieu pour mettre à jour ma base de POI.

Cordialement

Brunaud Devillard

Cette nuit ou demain surement…

Bonjour

Juste vous signaler que je suis venu à bout de la mise à jour de la base de données de mon site.
Cela n’a pas été simple entre les URI qui changent et les vrais / faux doublons de POI.

Le résultat est toujours ici : https://randocamping.touteslatitudes.fr

Bon week-end

Bravo et merci pour vos retours