Grootste fijn stof-onderzoek ooit

In de VS is het (bij mijn weten) grootste onderzoek ooit gepubliceerd over het verband tussen PM2.5 – blootstelling enerzijds en sterfte anderzijds.

Het onderzoek is opgezet onder verantwoordelijkheid van professor Francesca Dominici van de Harvard T.H. Chan School of Public Health. Mevrouw Dominici is een toonaangevend expert in de biostatistiek. “Her life’s work has focused broadly on developing and advancing methods for the analysis of large, heterogeneous data sets to identify and understand the health impacts of environmental threats and inform policy”  aldus de website van de Harvard T.H. Chan-school. Het PM2.5-onderzoek laat zien dat daar geen woord teveel aan gezegd is.
De overige auteurs zijn X.Wu, D.Braun, J.Schwartz, en M.A. Kioumourtzoglou.

Het onderzoek is Open Access en te vinden op https://scholar.harvard.edu/xiaowu/publications .

Voor het onderzoek zijn de gegevens gebruikt van ruim 68.5 miljoen mensen die afhankelijk waren van Medicare. Ze zijn dus in de leeftijd >=65 jaar en de uitspraken van het onderzoek beperken zich dan ook tot deze doelgroep.
Elke persoon leverde per levensjaar een observatie’.’Men kwam tot 573.370.257 ‘persoon-jaren’, dus observaties. De persoon-jaren startten in 2000 als de persoon toen al in Medicare zat en anders in het jaar dat hij daarin kwam, en eindigden bij de dood en anders op 31 december 2016.
De Medicare-gegevens zijn aangevuld met Censusgegevens uit 2000 en 2010, gegevens van de CDC (Center for Disease Control) en van het Prevention’s Behavioral Risk Factor Surveillance System (BRFSS), alsmede meteorologische data. Men kan het met recht een heterogene dataset noemen.
Een en ander was bekend tot op postcodeniveau.

Een permanente discussie bij dit soort onderzoek is of een gevonden verband een correlatie is of een oorzakelijk verband.
Bij een correlatie treden twee grootheden X en Y samen op, maar je kunt niet zeggen of X Y veroorzaakt, of Y X, of dat beide het gevolg zijn van een onbekende oorzaak Z.
Bij een causaal verband kun je ondubbelzinnig zeggen dat X de oorzaak is van Y. Een causaal verband aantonen vraagt dus veel meer dan een correlatie aantonen. Eigenlijk moet je dan bewust aan experimenteren met dubbelblind proeven (groepen mensen wel en niet blootstellen aan PM2.5), maar dat kan uiteraard niet.

De dataset is echter zo omvangrijk, dat hij op allerlei manieren gekneed kon worden.
Dominici koos ervoor om vijf verschillende statistische methodieken naast elkaar toe te passen, twee traditionele regressietechnieken en drie ‘causal inference’-technieken.
Als je wilt bewijzen dat X (in casu de PM2.5-blootstelling) de oorzaak is van Y (het sterftecijfer per jaar), moet je X apart houden van allerlei andere mogelijke sterfteoorzaken zoals hoe dik mensen zijn, of ze roken, of ze arm zijn of zwart, enz – alle eveneens levensduur verkortend maar iets anders dan PM2.5 . Dat noemen ze ‘confounders’.

Hieronder staat vertikaal een lijst van meegenomen ‘confounders’ . Het diagram geeft voor de hele doelgroep en voor de drie ‘causale’ technieken aan hoe goed men die confounders apart heeft kunnen zetten. Links van 0,1 is heel goed en nog verder naar links nog beter.
Let wel dat de 0 dus niet betekent dat er geen verband is (uiteraard is er verband tussen armoede en sterfte), maar dat men dat verband apart heeft kunnen zetten van het hoofddoel – de PM2.5 – invloed. Elke onderzoekskikker heeft zijn eigen kruiwagen.

Vervolgens is het artikel één grote techniek- en statistiekoefening, onderbroken door de uitkomst – interessant als oefenstof voor wie er tentamen in moet doen, maar ik laat het hier verder buiten beeld. Bij het artikel hoort een enorme smak hulpmateriaal, via de site te bekijken.

Die uitkomst ziet er voor alle onderzochte personen samen zo uit:

Dit vraagt enige uitleg.
Dit diagram geeft aan hoe het jaarlijkse sterftecijfer reageert in het denkbeeldige geval dat de blootstelling aan PM2.5 10µgr/m3  lager zou zijn.
De linkse twee zijn de uitkomsten volgens de traditionele regressiemethodes, de rechtse drie volgend de drie ‘causal inference’-methodes. De stip is de meest waarschijnlijke waarde en het balkje de 95%-onzekerheidsgrens.
Als er op de vertikale as 1.06 staat (meest linkse kolom), betekent dat het sterftecijfer 1 – 1/1.06) * 100% = afgerond 6% groter is.

Dit alles in lopende tekst: als de concentratie PM2.5 in een gebied (dat groot genoeg is voor statistiek) 10µgr/m3  lager zou zijn, zou het algemene sterftecijfer volgens de Cox-methode 6% omlaag gaan (en volgens de andere methodes  ook zoiets, want ze zitten dicht bij elkaar).

Het WHO-advies
Volgens de WHO zou de PM2.5-concentratie op <=10µgr/m3  moeten zitten. Ook daaronder bestaat overigens nog steeds gevaar, maar elke norm is bijna altijd een compromis.
Als extraatje hebben Dominici e.a. de volgende hypothetische situatie doorgerekend: stel dat in de VS alle postcodegebiedjes die boven de 10µgr/m3  zitten op 10µgr/m3  gezet worden, en dat alle postcodegebiedjes die onder de 10µgr/m3  zitten, op dat niveau blijven. Hoeveel doden zou dat schelen?
Het antwoord is ruim 143.000, opgeteld over tien jaar (de 95% – grenzen liggen bij 115.581 en 170.645 ). Dus meer in normale mensen aanduidingen zo’n dikke 14000 per jaar.

Trump en de olie
De Chan-studie praat slechts in indirecte termen over politiek.
Deze studie is er een (zij het veruit de grootste) in een lange rij die allemaal ongeveer hetzelfde zeggen. Krachten in de VS, die het minder goed voorhebben met het milieu, proberen de studies en de interpretatie daarvan tegen te werken door in te perken van wat mee mag tellen. Bijvoorbeeld alleen causale relaties accepteren (wetende dat die op dit terrein als regel niet te leveren zijn), of eisen dat alle informatie over deelnemende personen openbaar gemaakt worden (dus bijvoorbeeld hoe dik iemand is of hoe arm zij is). Dit zijn in essentie sabotagetechnieken.  Dominici e.a. spreken zich hier fel tegen uit.
verdre vindt Dominici dat de norm (in de VS 12µgr/m3 , de EU-grenswaarde is overigens 20µgr/m3)  onvoldoende bescherming biedt en omlaag moet.

De onlineversie van de Scientific American (29 juli 2020), via welke ik van het Dominici-onderzoek hoorde, spreekt zich veel explicieter uit. De mening dat luchtverontreiniging schadelijk is wordt door medici breed gedeeld, en ook de EPA (de Milieudienst van de VS) vindt dat eigenlijk. Maar een politieke benoeming van Trump in de EPA, gesteund door politieke consultants uit de olie- en gasindustrie, dwong de uitspraak af dat al die luchtkwaliteitsonderzoeken geen oorzakelijk verband aan toonden.

Dominici gaf op haar brute kracht-manier antwoord. Als mogelijk de voornaamste deskundige op biostatistisch gebied in de VS stelde ze expliciet dat de lange termijn-blootstelling aan PM2.5 een causaal verband heeft met de sterfte.

Voor een eerder grootschalig onderzoek in Nederland van het RIVM zie op deze site https://www.bjmgerard.nl/?p=715 .

Voor een eerder artikel op deze site over de effecten van kortdurende blootstelling aan PM2.5 en ozon zie https://www.bjmgerard.nl/?p=6088.