DATAtourisme

Compréhension des données

Bonjour,

J’ai plusieurs questions svp concernant les données exportées en XML:

  1. Les fichiers XMLs générés sont-ils en ASCII ou en UTF-8?

  2. Peut-on savoir si un POI est localisé dans un autre POI ex. un restaurant dans un musée ou un événement dans un lieu? hasPart et isAPartOf ne sont jamais remplis et j’ai remarqué que le schema:streetAddress contient des fois, en plus de l’adresse, le nom du POI où est localisé le POI courant mais on ne peut pas se fier à cette information. Et le isLocatedAt ne référence que des schema:address et jamais il me semble les autres types de localisations comme :City ou autre.

  3. Les dates sans la partie time zone ex. 2024-09-01 sont-elles considérées comme étant dans le time zone Europe/France?

  4. Quel est le format XML du weekOfMonth dans les périodes et les openingHoursSpecification? 1? et il n’y a qu’un seul weekOfMonth possible par période/openingHoursSpecification?

  5. Pour les hasTheme, hasEligibleAudience, hasArchitecturalStyle et similaires, est-ce qu’il y a toujours un tag xml:lang pour l’anglais?

  6. Parfois les dates start et end dans takesPlaceAt par exemple sont erronées avec la date end qui est avant la date start. C’est une erreur du producteur?

  7. Dans priceSpecification, est-ce hasEligibleAudience/hasEligiblePolicy/hasPricingMode/… peuvent être multiples?

  8. Dans certains priceSpecification, il y a plusieurs minPrice et maxPrice. Que faut-il en conclure? que c’est un ensemble de tarifs? ex. pour un hôtel le prix des différentes chambres? Le créateur n’aurait-il pas du créer plusieurs priceSpecification pour chaque prix?

  9. Les credits des images sont-ils au format html? j’ai repéré des credits avec des tags html ex.

  10. Pour certains objets, les openingHoursSpecification et les takesPlaceAt sont mentionnés en même temps. A quelle information se fier?

Cordialement.

Bonjour @Rony_ZOGHBY

  1. Les données transmises sont en utf-8
  2. Vous avez bien vu les propriétés hasPart et isPartOf qui effectivement sont peu renseignés. Pour chaque Poi vous avez la rue, le code insee de la commune et le code postal
  3. Les dates sont bien dans le timezone France
  4. Il peut y avoir plusieurs weekofmonth dans la période, pour le format XML, je n’ai pas d’exemple mais la structure suit la même logique que pour les autres propriétés
  5. Toutes propriétés textuelles doivent avoir l’attribut de localisation linguistique
  6. Oui c’est une erreur côté producteur, nous allons regarder…
  7. Oui
  8. Oui il devrait y avoir plusieurs priceSpecification, auriez vous un exemple svp
  9. Normalement non, cela devrait être du texte simple, nous allons aussi regarder
  10. Les informations doivent être identiques, takesPlaceAt doit être réservé aux evenements

En vous remerciant de l’intérêt porté à notre projet

Bonjour,

Merci pour vos réponses et bravo pour ce projet très intéressant.

Concernant le point 8, voici quelques exemples parmi beaucoup d’autres (format = [identifier,nom_du_fichier] avec le nom du fichier étant le chemin depuis le répertoire ‹ objects › de l’export XML de tous les objets en France):

5130226,0/00/13-001e0197-5210-3cee-940f-f99052b9aa22.xml
4615488,0/00/13-00268b86-0c35-3757-b1d5-f97deedbbd56.xml
122268,0/00/13-0028527a-2a67-3823-ae35-2f425767de00.xml
6010036,0/00/13-002c9030-68a0-317c-864c-64d915bd00bf.xml
117939,0/00/13-002cfd45-1acf-3e03-9b87-2d0d6a7c82d7.xml
117939,0/00/13-002cfd45-1acf-3e03-9b87-2d0d6a7c82d7.xml
4600788,0/00/13-00328a97-3203-3aef-8efa-4e08be03b038.xml
4657393,0/00/13-0046ff5c-bdc2-3e44-9a60-669c01994ad9.xml
4657393,0/00/13-0046ff5c-bdc2-3e44-9a60-669c01994ad9.xml
4657393,0/00/13-0046ff5c-bdc2-3e44-9a60-669c01994ad9.xml
5172569,0/00/13-0049febb-eeda-3a57-9f2d-34b15373cd90.xml
5709203,0/00/13-00552fae-0ed8-354c-993b-7b2b88869d40.xml
124032,0/00/13-005ae356-8f99-31c8-8fab-090f7fb49ec6.xml
679622,0/00/13-00616a8e-28bf-3300-9922-63e698fd824a.xml
4835892,0/00/13-00625a60-5672-3cde-872c-a99ada18b8a1.xml
4835892,0/00/13-00625a60-5672-3cde-872c-a99ada18b8a1.xml
41060,0/00/13-00670351-72fc-3864-88ff-7c6317ed88c9.xml
4772710,0/00/13-00697cd8-ead1-3ac0-bbaa-9b0960681b70.xml
6493651,0/00/13-006ce4b5-39e8-3259-85e1-6bc3a5fedadf.xml
5116031,0/00/13-006ddc89-0f43-3455-88be-e7fee6c5b2f2.xml
122121,0/00/13-006de99f-fe95-36e5-b39c-7c130687d860.xml
4805366,0/00/13-006e89fd-a6c7-31a1-a304-25dcb41babf0.xml
5772504,0/00/13-00737b36-23c1-3e3d-98e7-642ab824a2cf.xml

J’ai également une question concernant la classification des objets:

  • il y a énormément d’objets (50% au moins je pense) avec uniquement des classifications haut niveau (des classes parents) ex. des TastingProvider alors que ce sont des Restaurant ou des ReligiousSite alors que ce sont des Church. J’ai compris que votre modèle est additif - on ajoute des classes au fur et à mesure - mais ceci n’entrainerait il pas ce genre de problèmes? et d’autres incohérences avec quelques exemples rencontrés comme un objet représentant un quartier avec des classifications pour décrire plusieurs éléments présents dans ce quartier etc.? Est-ce que les producteurs devraient corriger ces éléments?

Cordialement.

Bonjour,

J’ai également ces questions svp:

a) quand une classification DataTourisme (DATAtourisme) est utilisée est-ce que toutes ses classifications parent (DataTourisme ou schema_org ou …) sont automatiquement ajoutées à la liste des classifications?

b) est-ce qu’une classification DataTourisme est toujours présente ou bien le producteur peut ne choisir que des classifications externes comme schema_org ou autres?

c) une classification DataTourisme peut-elle avoir plusieurs classifications parent DataTourisme? ou toujours une seule comme spécifié dans le fichier classes_fr.csv des ressources développeurs?

Cordialement

Et d) est-ce que toutes les classifications externes ex. schema_org ont systèmatiquement un équivalent DataTourisme qui sera utilisé le cas échéant? en résumé, est-ce que les classifications DataTourisme sont systématiquement utilisées et suffisent à elles seules pour déterminer le(s) type(s) d’un objet sans l’aide des autres ontologies?

Merci encore

Bonjour Rony
Merci pour ces remarques sur les specifications tarifaires, nous allons corriger l’alignement des données de ce producteur dans la semaine.
Je vous en avertirai

Ce n’est pas une erreur de « multi typer » les pois.

a) Oui toutes les classifications sont indiquées
b) A minima le POI est Point of Interest + une classification
c) c’est possible mais je crois que c’est le cas une seule fois pour les « hotels-restaurants » qui sont « hotels » et « restaurants » à la fois

d) nous nous sommes rapprochés le + possible de schema lors de la réalisation de DATAtourisme, cependant nous avons du compléter ce qui était disponible pour répondre à nos besoins et depuis Schema a aussi évolué… nous espérons trouver le temps dans l’année de déclarer les nouvelles correspondances entre les deux formats