Le couplage de la géostatistique et des mesures sur site offre la perspective de pouvoir quantifier les incertitudes liées à l'estimation des teneurs en polluants et de la diminuer par l'ajout d'informations complémentaires via ces mesures sur site. Cette étude a pour but d'évaluer lors du diagnostic d'un site contaminé, une démarche de couplage entre deux types de mesures sur site (PID, Kit colorimétrique) et l'outil géostatistique. L?étude a été conduite sur un site industriel concerné par une importante contamination des sols en hydrocarbures aromatiques polycycliques (HAP). Des mesures PID au sachet ont été effectuées sur l'ensemble des échantillons car cette méthode permet une analyse plus cohérente et semi-quantitative des composés volatils. Ces données ont été intégrées au modèle géostatistique via un cokrigeage. De plus, là où les données laboratoires sont inconnues, des analyses colorimétriques ont été effectuées. Plus précise et fortement corrélée aux analyses laboratoires, cette variable a été discrétisée en 4 classes puis intégrée à la variable principale après une transformation par régression linéaire. La comparaison entre les deux modèles géostatistiques, avec et sans variables auxiliaires, a montré que l'ajout des variables auxiliaires améliorait nettement le modèle de variogramme et réduisait en conséquence l'incertitude des estimations de teneur. Grâce au couplage de la géostatistique et des mesures sur site, une meilleure connaissance du phénomène dans les sols et donc une meilleure prise de décisions pour les futurs travaux de décontamination ont été possibles.
La réhabilitation des sites contaminés répond à des enjeux environnementaux mais aussi sanitaires et économiques. C'est un moteur important du développement durable de l’espace urbain qui permet la restauration des milieux dégradés par des infiltrations de substances chimiques ou des déchets industriels, la limitation de l’étalement urbain par la réaffectation des terrains après dépollution et l’assurance d’absence de risques sur la santé humaine. Les projets de réhabilitation doivent reposer sur une
Mots clés : géostatistique, mesures sur site, diagnostic, sites et sols contaminés, PID, Kit colorimétrique
Keywords : geostatistics, measurements onsite, diagnostic, contaminated sites and soil, colorimetric kit
caractérisation juste et précise, de la contamination du sol, c’est-à-dire l’évaluation de la nature, de l’étendue et de la mobilité de la contamination. Dans ce but, la connaissance de l’état du milieu implique l’acquisition et l’interprétation des données, spécifiques et représentatives du site. Cependant, les méthodes actuelles d’investigation, soumises à des contraintes politiques, budgétaires et organisationnelles, rendent difficilement compte de l’étendue des pollutions. Le retour d’expérience acquis ces dernières années met clairement en évidence qu’une description erronée ou approximative de l’état de la contamination conduit à une gestion non maîtrisée, inefficace et qui se révèle être par la suite un gouffre financier.
Le processus de reconnaissance des sites et sols contaminés peut être divisé en trois phases de réalisation : l’échantillonnage, l’analyse en laboratoire et l’interprétation. Généralement, les échantillons de sols sont prélevés sur la base d’une stratégie d’échantillonnage empirique et sont envoyés en laboratoire pour analyse des teneurs en polluants. Cette démarche classiquement employée est longue et coûteuse principalement en raison des prix et des délais analytiques ; ce qui encourage des pratiques défavorables à l’obtention d’une caractérisation précise des sols tels que le positionnement de sondage définis à l’aveugle sans réajustement possible et la réduction du nombre de points de sondage et des échantillons à analyser. De plus, cette approche d’investigation à caractère ponctuel (quelques échantillons de petite taille analysés sur l’ensemble du site) témoigne médiocrement de l’hétérogénéité physico-chimique et spatiale, caractéristique des pollutions anthropiques des sols. Cette situation se voit amplifiée par l’absence de quantification des incertitudes produites lors des différentes étapes du diagnostic (échantillonnage, analyses de laboratoire) et liées à l’estimation (cartographie) des teneurs en polluants. En effet, les méthodes d’interpolation présentement utilisées sont majoritairement déterministes, ne permettant pas de quantifier les incertitudes liées aux estimations.
Cette dernière décennie, le désir d’améliorer la caractérisation des sols pollués s’est traduit par l’application de la géostatistique dans le domaine environnemental ; celle-ci était auparavant dédiée à l’exploitation minière et pétrolière. En parallèle, les avancées technologiques ont permis le développement d’appareils de mesures portatifs permettant l’analyse des teneurs en polluant sur site. D’une part, ces analyses sur site constituent un outil de diagnostic rapide, parfois à temps réel et à coûts réduits. Leur utilisation apporte donc potentiellement une aide pour la localisation des points de sondage, la sélection des échantillons à analyser et l’opportunité de multiplier les données disponibles pour les interprétations.
D’autre part, la géostatistique regroupe des méthodes de modélisation de la répartition spatiale de la pollution permettant l’intégration de données issues du laboratoire (variable principale) mais également de mesures sur site (variable auxiliaire), en y associant une incertitude d’estimation. Leur couplage offre donc la perspective de pouvoir quantifier les incertitudes liées à l’estimation des teneurs en polluants et de la diminuer par l’ajout d’informations complémentaires via les mesures sur site. Par exemple, les travaux (Jeannée, 2001 ; Jeannée et al., 2003) ont ainsi montré que des indices organoleptiques, qualitatifs, ont pu être intégrés à la modélisation géostatistique et améliorer l’estimation des teneurs réalisées. Une démarche de couplage entre géostatistique et des mesures au spectromètre portable à fluorescence X (FPXRF) a également été développée par Jeannée et al., 2003. Dans la démarche proposée, une phase préliminaire permet d’établir une corrélation entre mesures sur site et analyses de laboratoire permettant dans les phases d’échantillonnage ultérieures, de déduire des mesures de terrain, plus abondantes, des données de qualité équivalente à celle de laboratoire.
Cependant, la diversité des mesures sur sites et l’hétérogénéité de la qualité des données obtenues par celles-ci ne permettent pas l’automatisation d’une démarche d’une mesure sur site à une autre. Certaines mesures (diagraphies MIP, mesures géophysiques) permettent un screening complet d’une zone ou d’un site mais ne renseignent qu’indirectement sur la pollution. D’autres mesures, déterminent la famille de polluants concernée et un ordre de grandeur de la contamination mais elles sont non sélectives vis-à-vis des composés (p. ex. PID, kits colorimétriques). D’autres encore produisent des résultats se rapprochant des résultats obtenus en laboratoire (p. ex. mesures FPXRF ou mallette Secomam). Ces différences impliquent par conséquent de développer une méthodologie de traitement de ces données adaptée au type d’informations apportées.
Cette étude a pour but d’évaluer lors d’un diagnostic d’un site contaminé, une démarche de couplage entre des outils de mesures sur site et l’outil géostatistique. Compte tenu du type de pollution mise en évidence sur le site (créosote), les kits colorimétriques et le détecteur portable à photoionisation (PID) ont été choisis pour cette étude. Les kits colorimétriques fournissent des informations qualitatives ou semi-quantitatives sur la présence d’hydrocarbures aromatiques dans les sols. Il est possible de déterminer le type de composés (BTEX, PAHs, PCB...) par le type de couleur et un ordre de grandeur de la concentration par l’intensité de la coloration (EPA, 1997 ; ANTEA, 1994). Le PID détecte de manière non-sélective les composés organiques volatils. Il est très apprécié des praticiens de par sa facilité d’utilisation, et sa rapidité : son temps de réponse très bref rend possible son utilisation pour qualifier en temps réel une atmosphère en termes de présence ou non de polluants.
Ces deux types de mesures sur site ont été utilisés dans le double objectif :
- 1) de qualifier les impacts en contaminants en un temps très court et sur site permettant ainsi d’ajuster la localisation des points de sondage et la sélection des analyses réalisées en laboratoire ;
- 2) de multiplier les données à moindre coût dans l’optique d’une utilisation en géostatistique afin de diminuer les incertitudes d’estimation.
Les objectifs précis de cette étude sont :
- a) d’examiner les relations entre les mesures laboratoires et les mesures sur sites ;
- b) d’établir une démarche de couplage avec la définition d’une méthode d’intégration de ces mesures sur site dans les modélisations géostatistiques ;
- c) d’évaluer l’amélioration de la précision des estimations des teneurs avec l’incorporation de ces mesures sur site en comparant les deux approches géostatistiques, avec et sans mesures sur site.
Matériels et méthodes
Description du site d’étude
L’étude a été conduite sur une partie, d'une superficie d’environ 20 000 m², d'un site industriel. L’activité a entraîné une importante contamination des sols en hydrocarbures totaux (HCT) et en hydrocarbures aromatiques polycycliques (HAP). Sur le site (figure 1), trois zones à risque de pollutions ont été identifiées : au niveau de la zone de dépotage des produits chimiques ; du bassin de décantation des eaux pluviales provenant des ateliers ; et des puisards. Les sols observés sont des remblais limons-sableux jusqu’à 2 m puis du sable et graviers et galets jusqu’à 6 m. Le niveau de la nappe est observé en moyenne à 6 m de profondeur sur l’ensemble du site.
Le diagnostic approfondi réalisé avait pour but de dimensionner les sources pollutions afin d'en définir les mesures de gestion.
Stratégie d’échantillonnage
Un échantillonnage systématique a été effectué selon une grille à maille carrée de 15 m et resserrée localement à 5 m au droit des zones à risque (figure 1). Au total, 37 sondages ont été réalisés jusqu’à une profondeur maximale de 6 m (toit de la zone de rabattement de la nappe). L’échantillonnage a été réalisé en deux phases. Une première campagne de sondages a été effectuée afin de caractériser les zones à risques. Les premières mesures sur sites ayant mis en évidence des impacts de pollution en HCT et HAP, des sondages complémentaires ont été réalisés lors d’une seconde campagne afin de délimiter précisément l’extension des pollutions.
Pour que l’intégration des données de mesures sur site aux modèles géostatistiques soit possible, la stratégie d’échantillonnage adoptée doit remplir cette condition : au moins 10 % de mesures sur site doivent être collectées sur les mêmes échantillons analysés en laboratoires (GeoSiPol, 2005). Cette étape permet d’établir le type de corrélation existant entre les deux jeux de données et déterminer le choix de la méthodologie d’intégration des données de mesure sur site.
Les sondages ont été réalisés à l’aide d’une tarière mécanique et après chaque passe de 0,5 m les sols ont été prélevés. L’échantillon de sol homogénéisé a été partagé en deux contenants : un flacon en verre maintenu en glacière destiné à l’analyse en laboratoire et un sachet en plastique hermétique dédié aux analyses de mesure sur site. Un total de 79 échantillons a été sélectionné pour l'analyse laboratoire et 68 échantillons pour l’analyse en kit colorimétriques. Les mesures PID ont été effectuées sur l’ensemble des échantillons, soit 314 mesures. Le protocole a été réalisé de façon à obtenir 26 % de mesures communes entre les mesures laboratoires et les mesures PID et 14 % avec les mesures kits colorimétriques.
Protocoles analytiques
En laboratoire, les échantillons de sol ont été séchés à 20 °C, broyés et tamisés à 2 mm. Par la suite, les concentrations en hydrocarbures totaux et les 16 HAP de la liste US EPA ont été déterminées en chromatographie en phase gazeuse couplée à spectromètre de masse.
Le kit colorimétrique utilisé a été le kit de terrain FTK et ses réactifs pour hydrocarbures aromatiques et hydrocarbures pétroliers dans les sols, commercialisés par Hanby Environmental. Tout d’abord, 5 g d’échantillon est mélangé à 10 ml d’extractant contenant du tétrachlorure de carbone. Quatre millilitres de surnageant sont ensuite récupérés dans un tube à essai. Enfin, une poudre de colorant réactif est ajoutée et le tube à essai est remué pendant 1 min. La lecture du résultat se fait par comparaison de la coloration à une grille de couleurs de référence associée à une concentration, spécifique à des substances (gazole, diesel, fuel, etc.). Cette grille présente le désavantage d’être inexploitable lors d'un mélange de substances ou de substance non répertoriée par le fabricant, comme c’est le cas pour la créosote. Une calibration spécifique au site a donc été effectuée sur la base des échantillons analysés à la fois au kit colorimétrique et en laboratoire.
L’outil PID utilisé est un MiniRAE Lite, commercialisé par RAE Systems. Une méthode « headspace screening » adaptée a été choisie car elle permet une analyse plus cohérente et semi-quantitative des composés volatils. Le principe de cette méthode est que les composés sont volatilisés dans l’air interstitiel d’un container étanche où l’échantillon de sol a été introduit. Cet air est ensuite mesuré au PID. La méthode a été modifiée en utilisant comme container des sachets en plastique hermétiques. Sur le terrain, l’échantillon de sols introduit dans le sachet est malaxé provoquant ainsi un échauffement de l’échantillon et laissé sur place 10 min pour favoriser la répartition des composés dans l’espace au-dessus de l’échantillon. Le sachet est ensuite perforé pour laisser pénétrer la sonde du PID et réaliser la mesure dans l’air du sachet.
Méthodologie géostatistique
Les deux approches géostatistiques, avec et sans variables auxiliaires, ont été réalisées afin de déterminer l’intérêt et les limites de la nouvelle démarche. Dans le cas de cette étude, les données laboratoires ont été identifiées comme étant la variable principale et les mesures sur site, PID et kit colorimétrique, comme les variables auxiliaires.
liaires. La prise en compte d'une ou plusieurs variables secondaires fait appel à la technique du Krigeage multivariable (Wackernage et al., 2009). Plusieurs méthodes sont disponibles et le choix de celle-ci a été guidé par les corrélations mises en évidence avec la variable principale et selon la disponibilité des données secondaires (sur l'ensemble de la grille ou sur un ensemble de points restreints). Les mesures PID sont disponibles sur l'ensemble des points de la grille établie ; un cokrigage a donc été effectué. Comme le Krigeage, elle permet la formation d’une estimation optimale, linéaire et non biaisée de la variable principale, dont l’erreur d’estimation est minimisée. Elle permet en plus de renforcer le krigeage en y ajoutant l'information apportée par des variables secondaires, qui doivent être corrélées entre elles. Les données kits colorimétriques sont moins denses mais apportent une information plus précise que les mesures PID, là où les données laboratoires sont inconnues. Après transformation par régression linéaire, cette variable a donc été intégrée à la variable principale puis un co-krigeage a été ensuite réalisé entre la variable principale (analyses 16 HAP et kits colorimétriques) et les mesures PID (variable auxiliaire).
L'étude géostatistique a été réalisée avec le logiciel ISATIS 2012 (Géovariances, France).
Résultats et discussion
Relation entre les mesures sur sites et les analyses laboratoires
L'analyse des données auxiliaires et l'étude de leur relation avec la variable principale ont été réalisées dans un premier temps afin de définir comment les informations apportées par le PID et les kits colorimétriques peuvent être utilisées : comment intégrer une teneur globale en composés volatils fournie par un PID ? Ou comment convertir un indice couleur en gamme de concentrations fourni par le kit colorimétrique ? Cette analyse a été possible car les données de mesures sur site et les données laboratoire ont été collectées sur des points communs. L'étude de la corrélation pouvant exister entre les mesures sur site et les mesures laboratoires peut alors être réalisée et conditionnera par la suite la méthodologie d'intégration de ces données auxiliaires en géostatistique.
Les statistiques élémentaires des mesures PID et des analyses de la somme des 16 HAP en laboratoire, variable principale retenue pour cette étude, sont reprises dans le tableau 1. Le taux de variation est très proche entre les mesures PID et les mesures laboratoire. La comparaison des mesures PID à celles du laboratoire (figure 2) montre que les données sont moyennement corrélées (coefficient de corrélation égal à 0,43). Il apparaît des mesures PID fausses positives, c'est-à-dire que certains échantillons de faible teneur en HAP correspondent à un signal élevé au PID. Cependant, toutes les teneurs élevées [...]
Tableau 1 : Statistiques élémentaires sur les mesures PID et les teneurs de la somme des 16 HAP de l’US EPA
Nombre | Moyenne | Écart type | Minimum | Maximum | Médiane | Coefficient de variation | |
---|---|---|---|---|---|---|---|
Mesures PID (ppmv) | 314 | 14,1 | 30,9 | 0,3 | 189,9 | 3,2 | 2,2 |
Mesures 16 HAP laboratoire (mg/kg) | 79 | 542,6 | 1 398,4 | 0 | 7 700 | 12 | 2,6 |
Tableau 2 : Caractéristiques des 4 classes d’observation kit colorimétrique
Classe | Observations | Gammes de concentration 16 HAP (mg/kg) | Moyenne de concentration 16 HAP (mg/kg) |
---|---|---|---|
1 | Blanc | 0-48 | 25 |
2 | Gris clair | 40-140 | 90 |
3 | Vert | 1 300-2 500 | 1 900 |
4 | Vert foncé | 4 400-7 700 | 6 000 |
en HAP ont été détectées au PID. Pour la suite de l'étude, cette corrélation linéaire a été utilisée pour intégrer les mesures PID en géostatistique comme variable auxiliaire.
Les observations qualitatives obtenues par les kits colorimétriques apportent une information sur le type de composés et sa concentration. Ces informations ne peuvent être intégrées comme telles dans un cokrigage des teneurs. Une discrétisation des mesures kits colorimétriques a été réalisée sur la base des nuances de coloration observée (figure 3). Les conditions d’évaluation de la corrélation sont favorables puisqu’elle a été établie sur l’ensemble de la gamme de teneurs observées. Cette variable a donc été codée en 4 classes et une variable continue (moyenne des teneurs), définies par la comparaison entre les données kits colorimétriques et les analyses laboratoire (tableau 2).
Apport des variables secondaires pour l'estimation des 16 HAP
Les données de concentrations en 16 HAP obtenues en laboratoire ont fait l’objet d'un premier traitement géostatistique et elles mettent en évidence une répartition des teneurs fortement marquées par la présence de valeurs extrêmes autour des sources de pollution identifiées sur le site. Ce phénomène se traduit par une forte variabilité spatiale des concentrations à une faible échelle. Par conséquent, le nombre insuffisant de données en laboratoire ne permet pas une reconnaissance optimale de ce type de phénomène. L'augmentation des données via l'intégration de données auxiliaires telles que les mesures sur site (PID, kit colorimétrique) permettraient alors une connaissance plus précise du phénomène et ainsi augmenter la représentativité du modèle de la contamination. Afin de déterminer l’apport des variables auxiliaires, les étapes de modélisation géostatistique ont été réalisées en parallèle avec ou sans variables auxiliaires et les résultats ont été comparés.
Avant d’entreprendre le krigeage, une validation croisée des deux modèles, avec ou sans variables auxiliaires, a été effectuée afin de déterminer le meilleur modèle géostatistique. Cette validation croisée consiste à retirer à tour de rôle chaque donnée et à l'estimer à l'aide de ses voisins avec le modèle défini. On peut ainsi comparer la valeur estimée à la valeur réellement observée. Les résultats des validations croisées sont présentés dans la figure 4. Les deux modèles rendent une estimation globalement sans biais puisque les erreurs d’estimation ne s’écartent pas fortement de 0. Cependant, on observe une nette amélioration du coefficient de corrélation et un nuage de corrélation plus concentré vers la bissectrice avec l’ajout des variables auxiliaires. Cette étape de validation montre donc clairement que l’ajout des variables auxiliaires (PID, kit colorimétrique) améliore l’estimation des teneurs en HAP.
Les simulations géostatistiques ont été réalisées, permettant d’estimer (1) localement, le risque de dépassement d’un seuil de réhabilitation sur chaque maille de l'estimation (carte de probabilité de dépassement du seuil) et (2) de déterminer globalement le niveau de contamination du site (calcul de volumes de contamination par quantiles). Plus l’estimation est précise, plus ces deux calculs, locaux et globaux, seront rapprochés. Dans cette étude, la carte de probabilité du dépassement du seuil de 70 mg/kg (figure 5) est illustrée pour les zones les plus incertaines, entre 40 % et 60 % de probabilité. Localement, le modèle sans variables auxiliaires montre une dispersion du phénomène très influencée par la présence des valeurs fortes. Cela implique la présence d’un grand nombre de mailles montrant une incertitude de l’estimation. L'utilisation du modèle tenant compte des variables auxiliaires permet une structuration du phénomène qui se traduit par une diminution des zones d'incertitude focalisées autour des trois sources de pollution.
Les différences entre les deux modèles s'expriment également lorsque l'on compare les volumes issus de la carte de probabilité et le calcul des volumes par quantiles. Globalement, les volumes de terres contaminées calculés, ciblés sur les zones polluées, et l’écart entre le P5 et P95 (figure 6) sont significativement supérieurs pour le modèle sans variables auxiliaires, traduisant...
présentant une estimation moins précise. Pour le modèle avec les variables auxiliaires, le volume des terres contaminées le plus probable est de 10 492 m³, correspondant à la médiane (P50) de l'ensemble des volumes calculés à partir des 300 simulations. Pour ce même modèle, le volume est proche de celui calculé via la carte de probabilité de dépassement de seuil (10 603 m³).
Conclusions
Face aux constats actuels sur les limites posées par les diagnostics conventionnels de sites contaminés (faible nombre d’analyses, méthode d'interpolation empirique ou déterministe), cette étude s’inscrit dans une volonté d’amélioration et de développement des outils et méthodologies de caractérisation. La géostatistique présente deux avantages majeurs : l'évaluation des incertitudes liées à l'estimation et l'intégration possible d’informations complémentaires. Cependant, le faible nombre de données disponibles pour les études géostatistiques reste actuellement un handicap important car cette situation entraîne des incertitudes associées à l'estimation des teneurs élevées. Cette étude a montré que l’apport de mesures sur site telles que le PID et les kits colorimétriques, moins coûteuses et plus rapides que des mesures laboratoires, améliorait l’estimation des teneurs. En effet, l’utilisation des données auxiliaires s'est traduite par (1) une réduction de l’incertitude dans l'estimation des teneurs en 16 HAP ; (2) une meilleure connaissance du phénomène dans les sols et donc une meilleure prise de décisions pour les futurs travaux de décontamination. Néanmoins, la nécessité de disposer de variables auxiliaires fiables en routine est une difficulté qui pose la question de l’optimisation des protocoles mais aussi des méthodes d'intégration des données auxiliaires en géostatistique.
Références bibliographiques
- - ANTEA (1994). Test d’applicabilité à la mesure en environnement de 3 techniques de mesure rapides sur site. Rapport technique, France, 10 p.
- - Demougeot-Renard, H., E. Seyer, M. Garcia, D. D’Or, et A. Laboudigue. (2006) Apport des techniques de mesure sur site à la caractérisation et la gestion des grands sites contaminés. Le cas du site Metaleurop Nord. Diplômine Conférence Quel devenir pour les grands sites pollués par des métaux ? Montpellier, France, p. 1-9.
- - EPA. (1997). Chapter VI: Field methods for the analysis of petroleum hydrocarbons. Rapport technique, États-Unis, 52 p.
- - GeoSiPol. (2005). Géostatistique appliquée aux sites et sols pollués – Manuel méthodologique et exemples d’applications. Rapport technique, France, 139 p.
- - Jeannee, N. (2001). « Caractérisation géostatistique de pollutions industrielles de sol, cas de pollutions par des hydrocarbures aromatiques polycycliques sur anciens sites de cokeries ». Thèse de l’École des Mines de Paris.
- - Jeannee, N., et C. de Fouquet. (2003). « Apport d'informations qualitatives pour l'estimation des teneurs en milieux hétérogènes : cas d’une pollution de sols par des hydrocarbures aromatiques polycycliques (HAP) ». C. R. Geoscience, 335, p. 441-449.
- - Wackernagel, H. et W. Tabara. (2009) « Techniques géostatistiques pour l'interpolation spatiale à partir d’observations et de simulations numériques ». Revue de l'électricité et de l’électronique.