DATAtourisme

Explciation sur le téléchargement du graph complet

Bonjour,

Lorsque l’on coche toutes les cases lors de la création d’un flux, de manière à télécharger l’ensemble des données, la requête Sparql générée est la suivante (j’ai dû enlever le début des URI pour poster le message) :

CONSTRUCT {
    ?res <...type> <urn:resource>. 
} WHERE {
    ?res <...type> <.....PointOfInterest>.
}

Serait-il possible d’avoir des explications sur cette requêtes ?
Elle semble:

  1. récupérer dans la variable ?res les URI de type « Point d’intérêt », dans la clause WHERE
  2. simplement associer ces URI au type « resource » dans le graph que l’on construit, en perdant au passage toute information sur ces URI (la clause CONSTRUCT ne semble exploiter aucun triplet lié à ces URI : labels, localisations, catégorisation en Évènement/Lieu/Produit/Tour, etc.)

Le bouton « Prévisualiser les résultats » confirme ce type de résultat.

Pourtant, le flux produit reproduit bien le graph complet. On n’y retrouve d’ailleurs plus les objets « resource ». Comment expliquer cela ? Est-ce que les objets « resource » sont propres à Datatourisme ? (ça a l’air assez peu utilisé)

A l’inverse, j’ai essayé de reproduire le graph avec cette commande très simple mais ça n’a pas fonctionné:

CONSTRUCT {
    ?s ?p ?o. 
} WHERE {
    ?s ?p ?o.
}

Le prévisualiseur a bien semblé reproduire les différents types de triplets du graph, mais le génération du flux a conduit à une erreur. Comment expliquer cela? Est-ce du à l’objet « resource » ?

Je me permets de relancer ce sujet qui me semble d’intérêt général : il pourra, je l’espère, permettre à chacun de mieux comprendre les graph qu’il est possible de récupérer sur Datatourisme

Bonjour,

Vous pointez là un fonctionnement spécifique à la plateforme DATAtourisme. Comme les données DATAtourisme sont nombreuses, profondes et globalement optionnelles, une requête CONSTRUCT classique qui génèrerait un graph complet pour chaque POI serait énorme et nécessiterait beaucoup de ressources serveur pour être exécutée.

Au lieu de ça, nous utilisons un procédé spécifique : nous générons dans un premier temps une liste d’URI pour lesquelles nous souhaitons obtenir le graphe complet, en leur assignant le type générique <urn:resource>. Une seconde passe automatique complète le graph obtenu auprès du triplestore avec les triplets du graph complet de chaque ressource typée <urn:resource>.

Cela permet de limiter l’effort mobilisé par le triplestore et de profiter de la mise en cache.

Cordialement,

1 « J'aime »