L'exemple transversal du traitement des données sur le transport de marchandises

De Metabolisme territorial
Aller à : navigation, rechercher

Afin de rendre compte des difficultés opérationnelles à explorer des jeux de données, nous voulons illustrer les différents points évoqués précédemment par un exemple concret : l'analyse des données sur le transport de marchandises en France. Ces données statistiques sont fondamentales pour l'étude du métabolisme des régions et des départements : ce sont celles qui nous renseignent sur les volumes importés et exportés (CGDD 2014).

En introduction, nous devons préciser que l'usage que nous faisons de ces données (décrire les ressources mobilisées) n'est pas celui pour lequel elles étaient initialement destinée (décrire l'activité de transport de marchandises). Comme souvent dans le cycle de l'information, les données connaissent de nouveaux débouchés avec toutefois une perte de fiabilité car elles n'ont pas été consolidées dans cette intention. Les travaux de Courtonne (2016) présentent notamment une méthode pour consolider ces données pour notre usage.

Le recherche de ces données directement sur internet est difficile. D'une part, les sites institutionnels changent, et avec eux les liens et l'ergonomie rendant difficile les données à retrouver. Finalement, nous arrivons à récupérer des données très générales sur les flux entrants et sortant pour l'année 2015 (https://www.statistiques.developpement-durable.gouv.fr/donnees-sur-les-flux-de-marchandises-sitram-annee-2015) et pour des séries plus longues sur un autre site institutionnel (http://www.stats.environnement.developpement-durable.gouv.fr/Eider/). Toutefois, le niveau de détail de ces données est faible : elles ne décrivent que les entrées et sorties des différentes régions, par route ou voie navigable. Ce niveau de détail est insatisfaisant pour approfondir nos études, descendre à l'échelle des départements, ou s'interroger sur l'origine ou destination des produits.

Pour obtenir des données plus fines, il faut faire une demande d'extraction spécifique auprès du XXXXXXXXX. TEMPS (3 mails pour expliquer la demande, plus 3 semaines d'attente, la demande ayant eu le malheur d'être formulée pendant les vacances estivales de la personne en charge, puis XXX euros, la sollicitation de ma hiérarchie pour valider la dépense.)

Les données plus fines n'intègrent pas les celles liées au transport de marchandise par voie ferrée. Ces données sont protégées par un arsenal juridique qu'il est difficile de comprendre, puis de satisfaire.

  • Arrêté du 23 avril 2012 pris pour l'application du décret n° 2012-555 du 23 avril 2012 relatif à l'accès de l'Etat, des collectivités territoriales et de leurs établissements publics à certaines informations et données sur le transport ferroviaire

Les statistiques du transport de marchandises sont déclinées selon la nomenclature NST 2007 qui se décompose en XX groupes, divisions tout ça. Les données accessibles sur internet ne vont pas au delà des groupes, mais celle fournie par l'extraction demandée détaille les flux jusque dans leur positions. Obtenir la nomenclature détaillée (les sites institutionnels n'indiquant pas les positions) et en français n'a pas été simple, l'obtenir sous un format structuré s'est avéré impossible. Un PDF a ainsi du faire l'objet d'une restructuration manuelle. (+ LIEN)

les données sur le transport de marchandises sont séparées selon les modes de transport et selon qu'il s'agisse du transport intérieur ou international. De plus les niveaux de détails disponibles ne sont pas les mêmes (département d'origine ou de destination pour le transport intérieur, pays sinon).