La collecte des données du métabolisme

De Metabolisme territorial
Aller à : navigation, rechercher

Dans le chapitre précédent (§ 2), nous désignons l'étude du métabolisme comme un exercice comptable qui vise à rassembler les "meilleures données disponibles" pour obtenir une vue globale et systémique du territoire. Nous présentons aussi un échantillon de la diversité des sources, mentionnées dans le guide du CGDD (2014). Au total, il y en a près d'une cinquantaine. Ces sources sont généralement récupérées sous la forme de tableurs 1D (ou enregistrements, voir chapitre X) représentant des listes de flux : importations, exportations, extraction, rejets dans l'environnement, recyclage, productions, consommations ...

Nous pouvons toutefois identifier plusieurs lacunes de ce recensement :

  • Les sources ne sont pas présentées de manière synthétique, ce qui masque l'ampleur de la tâche et ne permet pas un accès rapide : il faut en effet entrer dans le détail du texte pour retrouver ces sources. Les liens URL permettant un accès direct aux données ne sont pas non plus mentionnés pour la plupart.
  • Comme tout document finalisé, il ne pourra pas évoluer. De nouvelles données peuvent apparaître, d'autres disparaître (notamment suite à de nouvelles lois, comme pour les données sur le transport ferroviaire), les organismes qui produisent ces données changer ainsi que les systèmes d'information, et avec eux l'organisation des données, les liens URL ...
  • Enfin, les travaux, réalisés pour être pertinent à l'échelle nationale, ne peuvent pas présenter toutes les particularités des territoires. Il existe notamment des organismes à plus petite échelle (régionale, voire communale) qui disposent également de données qui peuvent être mobilisées dans l'étude du métabolisme d'un territoire[1]. Les jeux de données à mobiliser son donc variables pour chaque territoire et ne peuvent donc pas tous être cités dans le guide national.

En ce qui concerne les données elle-même, plusieurs éléments doivent être soulignés :

  • Tout d'abord, l'accessibilité des données est variable : certaines données sont gratuites et accessibles sur internet (même si les trouver demande parfois un temps non négligeable) tandis que d'autres sont connues d'agences spécifiques et ne font pas forcément l'objet d'une diffusion ouverte. Elles peuvent notamment être payantes ou être diffusées de manière restreinte.
  • Ensuite, les formats des données varient également. Dans la plupart des cas les données récupérées sont structurées sous forme d'un tableur (Excel, ODS ou CSV). Parfois les données sont également accessibles via une API et donc sous un format de sérialisation textuel comme XML ou JSON, éventuellement selon les standards du web de données. Quelques données (heureusement minoritaires) sont dans un format non adapté à l'exploitation automatisé de données : PDF, Word, HTML ...
  • L'échelle des données diffère également selon les sources. Il existent des données nationales, régionales, départementales, urbaines, ... qui ne sont pas produites par les mêmes acteurs. Les données ne sont pas forcément disponible à toutes les échelles. Aux échelles les plus petites (départements et en deçà), les impératifs du secret statistique deviennent notamment tangibles et limitent le niveau de détail que l'on peut obtenir.

La phase de rassemblement des données peut être améliorée en rendant les données plus utilisables (au sens du paragraphe XX). Conformément à notre positionnement de recherche, nous ne questionnerons pas la qualité des données produites ; nos réflexions porteront ainsi sur leur repérabilité, leur accessibilité et leur exploitabilité.

Il est possible de faciliter cette phase d'identification en jouant sur différents aspects :

  • Les aspects de recensement
  • Les aspects juridiques
  • Les aspects techniques
  • Les aspects communicationnels

Nous avons déjà discuté de l'utilisabilité des données en général. Nous allons ainsi nous concentrer sur des aspects spécifiques de notre exercice : le recensement des sources et les aspects juridiques.

Améliorer le recensement des sources de données

Afin de faciliter le travail d'identification des sources de données, nous proposons un tableau synthétique accessible en ligne (et en annexe) qui reprend les sources identifiées par Barles (2014) et le CGDD (2014) avec certaines caractéristiques (producteur, contenu, URL, condition d'utilisation ...) [2]. Ce travail de synthèse est ouvert aux contributeurs volontaires afin de permettre son amélioration et sa mise à jour régulière. Il vise à (1) donner une meilleure vue d'ensemble des jeux de données à mobiliser et permettre d'y accéder rapidement par un lien URL direct le cas échéant, (2) être actualisable pour recenser de nouveaux jeux de données ou en modifier les caractéristiques, (3) permettre de référencer des sources plus locales (régionales, départementales, voire communales).

De manière plus générale, nous appelons les acteurs travaillant sur les questions de métabolisme territorial à mutualiser leurs efforts pour recenser de manière la plus complète possible les jeux de données disponibles. Nous espérons ainsi que ce travail de synthèse pourra être diffusé, poursuivi et actualisé.

La création d'un "Système d'information régional sur l'utilisation des flux de ressources" comme proposé par le CGDD (2014) nous semble contribuer à renforcer l'utilisabilité des données.

Adapter le cadre règlementaire

Le cadre règlementaire peut être à la fois un frein et un moteur dans cette étape de regroupement des données.

Il est moteur lorsqu'il oblige les pouvoirs publics à ouvrir leurs données, notamment à travers la loi pour une République numérique voir chapitre 1.3.2). Cela a ainsi contraint l’État et les collectivités à ouvrir leurs données et à déployer les solutions techniques pour se faire. Ainsi, de nombreuses collectivités disposent et/ou alimentent des plateformes de données librement utilisables. Une partie de ces données concernent des éléments matériels et énergétiques des territoires qui nous intéressent. De plus, d'autres textes vont également dans ce sens, comme la loi de transition énergétique qui contraint les opérateurs énergétiques à communiquer leur données locales de consommation[3].

A d'autres égards, le cadre règlementaire est plutôt un frein à la diffusion des données. Le secret statistique rend par exemple concrètement difficile les études sur de petits territoires.

  • Certaines données peuvent être incomplètes (notamment en raison du secret statistique ou de réglementation spécifique)
  • Dynamique de l'Open Data vs. secret des affaires
  • Mais des restrictions (privées ou réglementaires) qui limitent de fait cet accès aux données
    • Cas du frêt ferroviaire
    • Cas du transport de passager

Faire évoluer les nomenclatures

Dans les jeux de données relatifs au métabolisme territorial, les données récupérées sont classifiées selon plusieurs nomenclatures. Il peut s'agir de nomenclatures formellement définies, comme la Nomenclature uniforme des marchandises pour les statistiques de transport (NST 2007, qui a succédé à la NST-R), la Classification statistiques des produits par Activités (CPA) (Statistical classification of products by activity) ou encore la Nomenclature Combinée (CN) qui évolue chaque année pour tenir compte des évolutions technologiques et des changements de tendance dans le commerce international (Eurostat 2013a).

Certaines données reposent sur des nomenclatures implicites, comme les statistiques agricoles. Le terme nomenclature n'est ainsi pas utilisé, mais les données sont bien classifiées selon des termes prédéfinis (Céréales, Choux-fleurs Logiciel Actif.

Dans une étude exploratoire que nous menons à partir des données sur le transport de marchandises classifiées selon la NST 2007 (Voir chapitre X), nous montrons que le niveau d'information disponible par cette classification ne permet pas de connaitre l'étape du cycle de vie des produits (matières premières / produits finis / déchets). Les statistiques sur le transports de marchandises, pourtant essentielles dans les études de métabolisme, sont ainsi intrinsèquement limitées pour appuyer pleinement les démarches d'écologie territoriale qui reposent en partie sur ce type d'information. Le changement de nomenclature vers un nouveau référentiel qui tienne compte du cycle de vie des produits permettrait d'élargir les possibilités d'usage de ces statistiques. Mais ce type de statistiques étant harmonisé au niveau européen ( Men-at-work-44px.pngTask : voir plus ? ), ce changement risque de prendre un peu de temps.


Voir aussi / Autres

Niveau de détail des données

(Adoue 2004) : des données détaillés (Georgeault 2015) : moins de détails

Droit d'accès et licences

Les données permettant de connaître le métabolisme des territoires n'ont pas toutes la même accessibilité ni les mêmes conditions d'utilisation (§ 2). Si les données produites par les organismes publiques (Insee, SDES du ministère de la transition, ...) sont généralement gratuites, publiques et librement diffusables (à condition de les sourcer et de ne pas les modifier), ça n'est généralement pas le cas des données présentes dans les organisations privées. Pourtant, ces données peuvent être également très utiles pour mener des analyses de flux : elles sont souvent plus précises et donc potentiellement plus opérationnelles, même si elles concernent un périmètre plus restreint.

Ainsi, la question de la confidentialité et de la propriété des données que nous évoquions précédemment (§1) est pleinement présente dans les études de métabolisme, surtout si l'on souhaite atteindre un grand niveau de finesse (Shahrokni et al. 2015). Il y a un conflit assez difficile à trancher entre la volonté de protéger les intérêts individuels et économiques à travers la confidentialité, et celle de mieux connaître la pression de notre société sur l'environnement et de nous coordonner pour sa préservation qui nécessite au contraire de partager de l'information. Dans cette opposition, la seconde approche nous semble plus impérative aux regards des enjeux, et nous rejoignons la position de différents auteurs qui demandent une plus grande transparence des personnes morales, publiques et privées, quant aux ressources qu'elles mobilisent (Georgeault 2015).

Les livrables de la phase de collecte

A la fin de la phase de collecte, nous disposons en général d'un grand quantité de données, essentiellement des tableurs Excel, mais aussi des données non structurées obtenues de différentes sources (Citer exemple).

Les tableurs Excel sont généralement des listes de flux : importations, exportations, extraction, rejets dans l'environnement, recyclage, productions, consommations ...



Références

• Adoue, C., 2004, Méthodologie d'identification de synergies éco-industrielles réalisables entre entreprises sur le territoire français.. [En ligne] URL : http://www.theses.fr/2004TROY0016. Consulté le 19 avril 2018.
• Barles, S., 2014, L’écologie territoriale et les enjeux de la dématérialisation des sociétés : l’apport de l’analyse des flux de matières, Développement durable et territoires, 5. DOI : 10.4000/developpementdurable.10090
• CGDD, 2014, Comptabilité des flux de matières dans les régions et les départements - Guide méthodologique, Références du Service de l’observation et des statistiques (SOeS). Commissariat Général au Développement Durable. [En ligne] URL : https://www.ecologique-solidaire.gouv.fr/sites/default/files/EIT_-_comptabilite_des_flux_de_matieres.pdf. Consulté le 19 avril 2018.
• Eurostat, 2013a, Economy-wide Material Flow Accounts (EW-MFA) - Compilation guide. [En ligne] URL : http://ec.europa.eu/eurostat/documents/1798247/6191533/2013-EW-MFA-Guide-10Sep2013.pdf/54087dfb-1fb0-40f2-b1e4-64ed22ae3f4c. Consulté le 19 avril 2018.
• Georgeault, L., 2015, Le potentiel d'écologie industrielle en France : approche territoriale et éléments de réalisation.. [En ligne] URL : http://www.theses.fr/s91113. Consulté le 19 avril 2018.
• Shahrokni, H., Lazarevic, D., Brandt, N., 2015, Smart Urban Metabolism: Towards a Real-Time Understanding of the Energy and Material Flows of a City and Its Citizens, Journal of Urban Technology, 22, pp. 65-86. Routledge. DOI : 10.1080/10630732.2014.954899


Notes de bas de pages

  1. C'est par exemple le cas des associations agréées de surveillance de la qualité de l'air (la plupart connue sous le nom ATMO) qui produisent des données à l'échelle régionale et en deçà.
  2. https://docs.google.com/spreadsheets/d/1QEFdXToeoLe_wVEyChV9B49KuM9o9iZy505Rqyl1mYs/edit?usp=sharing
  3. La mise à disposition de données locales d’énergie est inscrite dans l’article 179 de la loi de transition énergétique pour une croissance verte (LTECV). Sa mise en œuvre est précisée le 18 juillet 2016 par : par le décret n°2016-972 relatif à la confidentialité des informations détenues par les opérateurs gaziers et par les gestionnaires des réseaux publics de transport ou de distribution d’électricité ; par le décret n° 2016-973 relatif à la mise à disposition des personnes publiques de données relatives au transport, à la distribution et à la production d’électricité, de gaz naturel et de biométhane, de produits pétroliers et de chaleur et de froid ; et par l’arrêté XX fixant les modalités de transmission des données de transport, distribution et production d’électricité, de gaz naturel et de biométhane, de produits pétroliers et de chaleur et de froid.
KeyRefcgdd2014 +, barles2014 +, eurostat2013a +, adoue2004 +, georgeault2015 + et shahrokni2015 +
PageLabelLa collecte des données du métabolisme +
Taskvoir plus ? +