STRAVA

La gestion des espaces naturels à l’heure des « big data »

 

Espaces naturels n°65 - janvier 2019

Accueil - Fréquentation

Le volume des données numériques recueillies via les nouvelles technologies donne le vertige. Pour autant, certaines peuvent être utiles aux gestionnaires d’espaces naturels. Retour sur l’affaire médiatisée de l’application Strava, et autres exemples...

Image capturée par un piège-photo au milieu d'une colonie de laro-limicoles à Frontignan (34) dans le cadre d'une étude sur le dérangement. © CEN-LR

Janvier 2018. Une nouvelle surprenante est relayée par l’ensemble de la presse planétaire : une application destinée aux sportifs a permis la localisation de bases secrètes américaines en Afghanistan, en Irak et en Syrie(1) ! Comment une simple application embarquée sur un smartphone a-t-elle pu conduire à un tel résultat ? La faute à un algorithme qui a permis la production d’une carte de chaleur des zones de pratique (course à pied, cyclisme, trail, sports nautiques) à partir des données collectées par l’application Strava(2). Il a suffi à un étudiant australien en sécurité de repérer les traces créées par les militaires américains lors de leur footing. Réunion de crise au Pentagone et mise en lumière de l’existence de ces jeux de données gigantesques qui, une fois traités, fournissent des informations potentiellement sensibles.

QUESTION DE TRACES NUMÉRIQUES

Strava, c’est 27 millions d’utilisateurs sur la planète qui ont pris l’habitude d’enregistrer leurs parcours sportifs (les traces) et les performances associées (distance, durée, vitesse, etc.). La carte de chaleur proposée par l’entreprise fin 2017 rassemblait ainsi près d’un milliard de données publiques représentant pas loin de 27 milliards de kilomètres de traces. Un constat s’impose alors : la multiplication des objets connectés et l’Internet mobile conduisent à une géolocalisation presque systématique des objets et des personnes (qu’elle soit volontaire ou non). Ainsi, nous laissons des traces numériques derrière nous lorsque nous naviguons sur Internet ou lorsque nous faisons appel à un service à partir d’un terminal numérique. Elles sont dites géonumériques si des données (ou méta-données) géographiques leur sont associées. Ces données très hétérogènes peuvent donc être mobilisées à des fins d’étude ou d’analyse de comportement. De manière générale, il est important de souligner que ce type de traces peut être produit de manière volontaire (photos géo-référencées, outils de mesure de ses performances, etc.) ou involontaire (smartphone, vélos en libre-service, navigateurs web, etc.). Cette production de données par les personnes est définie par le terme anglo-saxon de « crowdsourcing », littéralement « approvisionnement par la foule » et fait appel à la notion de marketing collaboratif. Le monde produit ainsi une quantité inouïe de données très variables. Quel intérêt peut donc y trouver un gestionnaire d’espaces naturels ?

À ce jour, même s’il est impossible d’accéder à des données précises de fréquence ou de temporalité, l’examen des traces permet de mieux comprendre le comportement des pratiquants sur un territoire donné.

 

Revenons à la fameuse application Strava et aux cartes de chaleur qui ont été mises en ligne. Non contente de mettre en ligne une cartographie interactive sur son site, l’entreprise propose également un service WMS (Web Map Service) permettant d’afficher ces données dans un Système d'information géographique (SIG). Suite aux problèmes liés à l’armée américaine, il est aujourd’hui nécessaire de créer un compte pour visualiser les données de manière précise. Néanmoins, les échelles proposées permettent d’examiner son territoire et d’y détecter les zones de pratique les plus intenses (zones les plus claires donc chaudes, comme pour l’acier) ainsi que les tracés non référencés. À ce jour, même s’il est impossible d’accéder à des données précises de fréquence ou de temporalité, l’examen des traces permet de mieux comprendre le comportement des pratiquants sur un territoire donné (respect des délimitations, etc.). Autre source d’informations, les photographies prises par le grand public. Ces dernières peuvent être une source intéressante de données sur le comportement des personnes dans une réserve naturelle. C’est ce qu’ont démontré Walden-Schreiner et ses collaborateurs en utilisant les photographies prises dans les Parcs naturels d’Aconcagua (Argentine) et de Kosciuszko (Australie) et mises en ligne dans l’application Flickr. Les photographies géotaguées ont en effet permis de mettre en évidence un schéma saisonnier et temporel de l’utilisation de l’espace par les visiteurs, mais également de mieux appréhender la divagation hors des sentiers en Argentine et la dispersion hivernale des randonneurs dans le cas australien. Ces comportements n’auraient pu être identifiés aussi facilement avec les permis délivrés à l’entrée des parcs ou avec les écocompteurs.

À L’ÈRE DES « BIG DATA »

Des connexions de plus en plus performantes et des serveurs de plus en plus gros conduisent à une accumulation encore jamais vue de données numériques. Ces données, qui excèdent aujourd’hui les capacités analytiques de n’importe quel individu ainsi que celles des outils classiques de gestion de base de données sont appelées « big data » ou « mégadonnées ». Une deuxième manière de les définir a été proposée par IBM au début des années 2000 et reprend le principe des quatre « V » : volume, vélocité, variété, véracité. Le volume fait référence à la taille du jeu de données, la vélocité au fait que les données ont une relation étroite avec le temps (analyse en temps réel, etc.), la variété au fait que les jeux de données sont hétérogènes et la véracité à leur fiabilité. Outre le fait qu’ils peuvent provoquer une panique générale dans notre cerveau, ces flux continus de données représentent de nouvelles opportunités d’étude des écosystèmes à des échelles variées et avec une résolution élevée. En écologie, ces données sont issues de cinq grands types de sources : 1) les capteurs automatiques embarqués (satellites, avions, drones, balises GPS), 2) les capteurs automatiques in-situ (pièges photos, enregistreurs de paramètres physico- chimiques, éco-compteurs, etc.), 3) les bases de données d’inventaires (avec le problème de l’hétérogénéité des sources et leur validation), 4) les sciences participatives (dont la validité des données est un point central) et 5) les suivis à long terme. En tant que gestionnaires, nous sommes associés à cette collecte de données au travers des suivis que nous effectuons sur les sites, des programmes que nous développons avec le monde de la recherche (équipement d’animaux avec des balises, installation de capteurs sur les sites, etc.) et notre participation aux grands programmes d’inventaires (INPN).

Ce développement des mégadonnées va de pair avec celui des nouvelles technologies qui, en automatisant la collecte de données, conduisent à une production d’informations parfois difficile à appréhender ou analyser. L’équipement d’oiseaux par des balises GPS ouvre par exemple un champ inédit d’étude des mouvements ou du comportement, mais son application concrète sur le terrain pour la gestion est aujourd’hui loin d’être évidente. En effet, l’expertise nécessaire à l’analyse de ces données est rare et les questions intéressantes pour la science ne sont pas forcément celles qui intéressent les gestionnaires d’espaces naturels. Il est plus que jamais important de ne pas se laisser dépasser par le simple déploiement d’un système technologique sans réfléchir en amont aux questions auxquelles on souhaiterait répondre.

RECHERCHE ET GESTION, UN DUO DE CHOIX

Ces réflexions rejoignent les conclusions émises par la FRB dans le cadre de l’enquête chercheurs – gestionnaires qui montrent l’intérêt croisé de ces deux mondes qui ont un grand avantage à travailler ensemble (NDLR : cf. article des pages 43-44). À l’heure des mégadonnées, il semble en effet nécessaire d’être accompagné dans l’analyse de ce que l’on observe et collecte, afin que la préservation des enjeux sur nos sites soit bien un objectif atteint. Par ailleurs, rester au contact des innovations peut permettre de mieux appréhender le fonctionnement de nos sites et, de la même manière que pour l’armée, des applications grand public peuvent avoir un intérêt pour la gestion de nos territoires. 

Image capturée par un piège-photo au milieu d'une colonie de laro-limicoles à Frontignan (34) dans le cadre d'une étude sur le dérangement. © CEN-LR

 

 

 

(1) L'application Strava révèle la position de bases militaires secrètes. Les Échos, 29 janvier 2018. bit.ly/2JloQGL
(2) www.strava.com