Automatiser les traitements de données avec un système d'information

De Metabolisme territorial
Aller à : navigation, rechercher

Malgré le nombre croissant d'études du métabolisme de différents territoires, le traitement des données reste encore une opération complexe et/ou chronophage. Les méthodes proposées requièrent souvent un traitement manuel des données ; le CGDD (2014) p.21) indique d'ailleurs dans son guide sur la comptabilité des flux de matières qu'"il n’existe pas, à ce jour, d'outil permettant de structurer les données de façon standardisée et d'en automatiser le traitement". Plusieurs solutions logicielles dédiées à l'étude de flux existent, comme Actif {Ref needed} pour l'écologie industrielle ou OpenLCA {Ref needed} pour l'analyse du cycle de vie des produits, mais aucune n'offre suffisamment de souplesses et de fonctionnalités pour aborder la question des flux de matière et d'énergie de façon multidimensionnelle à l'échelle d'un territoire. Ainsi, faute de solution automatisée, l’exercice est "long et complexe" (Bahers 2012), présente des risques d'erreur et oblige à s'interroger systématiquement sur la façon de manipuler les données.

Une plus grande automatisation des processus de traitement des données dans les études de métabolisme territorial pourrait ainsi contribuer à améliorer les études sur différents plans :

  • faciliter le développement de nouveaux processus de traitements pour diversifier l'information accessible
  • réduire le temps nécessaire aux traitements de données, pour consacrer plus de temps à la compréhension des informations et à l'action,
  • rendre reproductibles les traitements dans d'autres contextes (temporels, spatiaux, ... )
  • rendre transparents les processus de traitement
  • réduire le risque d'erreur lié à la manipulation des données

Durant ces travaux, nous envisageons la conception d'un Système d'INformation pour l'Analyse du MEtabolisme des Territoires (SINAMET) afin de faciliter et automatiser le traitement des données pour ce type d'étude. La conception du SINAMET, comme pour d’autres systèmes d'informations (SI), est envisagée comme un processus long et itératif, qui devra mobiliser de nombreuses personnes et compétences à l'intersection entre plusieurs disciplines (Flichy 2013). Il n'est ainsi pas possible d'envisager dans le cadre de cette seule thèse la réalisation d'un système pleinement fonctionnel et opérationnel, mais c'était bien notre objectif d'en formaliser des fondements possibles.

Pour cela, nous avons tout d'abord procédé à une phase d'analyse qui a permis de définir l'ontologie du métabolisme d'un territoire et d'identifier les fonctionnalités mobilisées dans les traitement de données associés. Nous avons également examiné d'autres approches similaires, comme le modèle de données de Wikidata ou les entrepôts de données. A partir de ces éléments, nous sommes entrés dans une phase de conceptualisation visant à définir le modèle pour notre base de données, à choisir un paradigme pour la manipulation de données, et à mettre au point une architecture logicielle adaptés à nos attentes. En parallèle de cette conceptualisation, nous avons développé un prototype logiciel pour vérifier l'applicabilité de notre approche et l'éprouver avec des données variées. Si nous présentons quelques éléments techniques sur ce prototype, les résultats obtenus grâce à lui figurent dans le chapitre suivant.

Analyse

Conceptualisation

Modèle conceptuel de données

Il existe différentes approches permettant de mettre au point un modèle de données pour un entrepôt (Inmon 2005). Généralement, une des premières étapes consiste en la définition du diagramme entité-association.

(Inmon 2005)Le développement du modèle de données d'un entrepôt se base sur les mo


Ajouter Image approche ----

Utilisateurs


Analyse fonctionnelle

  • Quels sont les étapes du processus de traitement ?
    • Acquisition, agrégation, synthèse, restitution

Voir également : Chaîne de traitement des données du métabolisme territorial

Il s’agit de définir une ontologie adaptée, c’est-à-dire les concepts clefs mobilisés dans les différentes études, et à la transposer sous forme d’une architecture logicielle fonctionnelle.

Acquisition : quels sont les données mobilisées dans ces étapes

Sources éparses, multi-format (essentiellement xls)

Voir également : Les données à mobiliser dans les études de métabolisme territorial ; Évaluer les sources de données ; Catégorie:Source de données



Références

• Bahers, J., 2012, Dynamiques des filières de récupération-recyclage et écologie territoriale : l'exemple de la filière de traitement des déchets d'équipements électriques et électroniques (DEEE) en Midi-Pyrénées.. [En ligne] URL : https://tel.archives-ouvertes.fr/tel-00711199/document. Consulté le 19 avril 2018.
• CGDD, 2014, Comptabilité des flux de matières dans les régions et les départements - Guide méthodologique, Références du Service de l’observation et des statistiques (SOeS). Commissariat Général au Développement Durable. [En ligne] URL : https://www.ecologique-solidaire.gouv.fr/sites/default/files/EIT_-_comptabilite_des_flux_de_matieres.pdf. Consulté le 19 avril 2018.
• Flichy, P., 2013, Rendre visible l'information, Réseaux, pp. 55-89. [En ligne] URL : http://www.cairn.info/revue-reseaux-2013-2-page-55.htm. Consulté le 19 avril 2018.
• Inmon, W., 2005, Building the Data Warehouse. Wiley, 576 p.. [En ligne] URL : http://homes.dcc.ufba.br/~mauricio052/Material_Artigo/Building_The_Data_Warehouse_(2005)_Fourth_Edition-Inmon-Wiley.pdf. Consulté le 19 avril 2018.