Outil de récolte de services Web géospatiaux

Un outil novateur de récolte et un catalogue de services Web géospatiaux offrant aux utilisateurs des services Web pour le Canada et l’Arctique à jour, normalisés, faciles à trouver et accessibles.

Outil de récolte et catalogue Web

L’outil de récolte de services Web géospatiaux est un robot de recherche qui surveille les sources canadiennes faisant autorité (municipales, provinciales, territoriales, fédérales, etc.) dans les domaines “.ca” pour recueillir les plus récents services Web géospatiaux. Ces services sont ajoutés au catalogue de services Web géospatiaux, où les utilisateurs peuvent trouver à un même endroit des données fiables et accessibles pouvant être visualisées en ligne ou en format Excel et JSON.

Accéder au catalogue des services web géospatiaux

L’outil de récolte parcourt Internet quotidiennement et met à jour le catalogue sur une base hebdomadaire. Les services recueillis sont organisés par titre, mots-clés, type d’affichage et nombre de couches, et sont accompagnés de liens vers les services. Les utilisateurs peuvent ainsi facilement intégrer et utiliser les services en fonction de leurs besoins.

Le catalogue contient des données provenant de plus de 2000 serveurs et 60,000 couches individuelles, ce qui démontre l’efficacité de l’outil de récolte Web automatisé pour recueillir des données géospatiales normalisées.

Objectif

Les catalogues de données géospatiales standard offrent des ressources précieuses, mais nécessitent souvent d’importantes mises à jour manuelles et beaucoup de ressources. Pour remédier à cette situation, le programme GéoConnexions, qui est responsable de l’Infrastructure canadienne de données géospatiales (ICDG), a mis au point un outil novateur de récolte et un catalogue de services Web géospatiaux offrant aux utilisateurs des services Web canadiens à jour, normalisés, faciles à trouver et accessibles. À titre de membre contribuant à l’infrastructure de données spatiales pour l’Arctique (IDS-Arctique), GéoConnexions recueille également des services Web concernant l’Arctique pour le géoportail et le catalogue de l’IDS pour l’Arctique.

Figure 1 - Changement de paradigme : Transition du catalogage manuel au catalogage automatisé sur le web

Graphique comparant les inefficacités du catalogage manuel aux avantages rationalisés et technologiques du catalogage sur le web.
Version texte :
Catalogage Manuel Catalogage sur le Web
Processus chronophages Processus et mises à jour automatisés
Difficulté de tenir les dossiers à joue Service récoltés sur Internet
Problème d’exhaustivité Utilisation de services Web et d’API

Le catalogage sur le Web est une méthode automatisée qui remplace le processus manuel classique de tenir à jour des catalogues de métadonnées. En voici quelques avantages :

  • Efficacité du processus : Le catalogage manuel est chronophage, tandis que le catalogage sur le Web utilise des processus et des mises à jour automatisés pour gagner du temps et économiser des efforts.
  • Tenue à jour de dossiers : Avec les méthodes manuelles, il est difficile de tenir les dossiers à jour et il faut recourir à des experts en métadonnées. À l’opposé, le catalogage sur le Web récolte les services sur Internet et maintient l’information à jour.
  • Exhaustivité : Le catalogage manuel n’est pas exhaustif. La récolte sur le Web améliore la couverture en utilisant des services Web et des interfaces de programmation d’applications (API) pour garantir que les métadonnées sont complètes et à jour.

Développement et fonctionnalité

L’outil de récolte Web utilise un programme d’apprentissage automatique qui cherche des adresses de services Web spatiaux sur Internet. Une fois qu’il a trouvé ces services, il analyse les métadonnées et détermine le lien de chaque service avec le Canada et l’ensemble de l’Arctique en utilisant une méthode d’évaluation de la portée géographique qui aide l’outil à déterminer quel service ajouter au catalogue.

Vous trouverez ci-dessous un diagramme résumant le processus de récolte sur le Web, qui produit les catalogues de services Web du Canada et de l’Arctique ainsi que les données connexes.

Figure 2 - Processus de récolte Web : Identification et catalogage automatisés des services web géospatiaux pour le Canada et l’ensemble de l’Arctique

Ce diagramme illustre le processus automatisé de récolte sur le Web et de catalogage de services Web géospatiaux pour les catalogues de services du Canada et de l’Arctique.
Description détaillée :

Ce diagramme illustre le processus automatisé de récolte sur le Web et de catalogage de services Web géospatiaux pour les catalogues de services du Canada et de l’Arctique.

  • Sources de données d’entrée : Le processus commence par les entrées sur le Web, y compris les portails et les catalogues de données géospatiales, qui sont continuellement balayées au moyen de recherches automatiques sur Internet.
  • Robot de recherche : Un robot cherche des adresses de services Web géospatiaux sur Internet. Il fonctionne automatiquement et effectue des balayages hebdomadaires pour tenir l’information à jour.
  • Filtres : Le robot applique des filtres pour cibler les services pertinents :
    • Les services canadiens sont filtrés et stockés dans le catalogue de services Web du Canada.
    • Les services pour l’Arctique sont filtrés et stockés dans le catalogue de services Web de l’Arctique.
  • Produits
    • Le catalogue de services Web du Canada génère trois types de produits :
      • un navigateur de catalogue accessible au public;
      • un fichier JSON;
      • un fichier Excel.
    • Le catalogue de services Web de l’Arctique alimente le géoportail et le catalogue de l’IDS pour l’Arctique.

L’ensemble du système permet le catalogage automatique, filtré et à jour des services Web géospatiaux dans les domaines canadien et arctique.

Pour accéder au catalogue de services Web géospatiaux du Canada

Vous pouvez accéder au plus récent catalogue de services Web géospatiaux du Canada à l’aide des méthodes suivantes :

Parcourir le catalogue

Tableau interrogeable et filtrable contenant des liens vers les services Web, leurs titres, le nombre de couches et plus encore.

Feuille de calcul Excel

Fichier téléchargeable contenant des liens vers les services Web, le nombre de couches et d’autres détails.

Fichier Json

Fichier téléchargeable contenant des liens vers les services Web, le nombre de couches et d’autres détails.