DATAtourisme

Manque 20'000 POI les 12 et 13 avril

Bonjour,

Il y a eu une chute du nombre de POI dans les dumps des 12 et 13 avril par rapport au 11 avril. Ils sont ré apparu le 14 avril.

Est-ce qu’il s’est passé quelque chose ces jours là ?

Pour éviter de créer des doublons (je ne compare que deux dumps consécutifs), je préfère qu’un dump incomplet ne soit pas publié, quitte à rattraper les jours suivant.

Bonjour @Alexandra_CADET
Nous sommes dépendants des flux entrants de chaque producteur de données. Il nous faudrait remonter ces derniers pour trouver celui qui a eu un problème durant ces deux journées, mais cela n’apportera pas de solution à votre problème.
Afin d’éviter les doublons, vous pouvez vous baser sur les URI des POIs qui sont stables.
Bien à vous
Jean François

Merci pour votre réponse

celui qui a eu un problème

20’000, ça me paraît beaucoup pour un seul fournisseur.

vous pouvez vous baser sur les URI des POIs

C’est ce que je fais mais, je considérais jusqu’à cette incident, qu’une entrée (et donc son URI) qui n’apparaissait plus avait été supprimée de la base et je la supprimais de mon côté.

qui sont stables

J’ai pu constater au moins un cas d’un ID réutilisé quatre fois dans une année pour des événements manifestement différents. D’où mon implémentation décrite ci-dessus.

Mais si vous n’avez pas pu identifier de cause flagrante, je vais adapter mon traitement.

Merci

Bonjour @Alexandra_CADET
Effectivement, si le producteur réutilise la même fiche dans son système d’information pour en changer complétement le contenu, c’est possible…
Merci pour vos adaptations
Bien à vous
Jean François