Bias door gebruik van % voorspeld bij volwassenen
Neem het volgende voorbeeld van twee mannen:
| Lengte (m) |
Leeftijd (jr) |
Voorspelde FEV1 (L) |
80%voorspeld (L) |
Gemeten FEV1 (L) |
SDS (Z-score) |
| 1,70 m | 70 | 3,01 L | 2,41 L | 2,35 | -1,29 |
| 1,85 m | 25 | 5,12 L | 4,10 L | 4,10 | -2,00 |
Bij de jongste van de twee zou een FEV1 van 4,10 liter bij de vuistregel “meer dan 80% voorspeld is goed” tot de conclusie leiden dat dit een goede waarde was, terwijl een dergelijke waarneming slechts in circa 2% (zie berekening 1 hieronder) van een gezonde populatie wordt gedaan. Bij de oudere man zou een FEV1 van 2,35 L als passend bij pathologie (berekening 2) worden geduid, terwijl dit eigenlijk in een gezonde populatie een hele normale waarneming is (immers, bij een normale verdeling wordt het 5 percentiel bepaald door SDS = -1,64). Voor vrouwen bestaat een analoge situatie, zoals in onderstaande figuur is te zien.
Bij wetenschappelijk onderzoek kan dit probleem meespelen. Kijk eens naar het volgende voorbeeld:
| Vraagstelling | het effect van medicament X op het FEV1 bij luchtwegobstructie |
| Methode | dubbelblind interventie-onderzoek van medicament X en placebo |
| Personen | mensen met luchtwegobstructie, d.i. FEV1 < 80% voorspeld |
| Resultaat | in het algemeen is het effect van medicament X gemiddeld kleiner bij de groep ouderen |
| Conclusie | bij ouderen is er “minder reversibiliteit” van de luchtwegobstructie; dit lijkt u plausibel, het medicament is vooral geïndiceerd bij jongeren, minder bij ouderen. |
Commentaar:
de onderzoeksgroepen worden door hanteren van het “80% voorspeld criterium” “verontreinigd” door oudere en kleinere mensen, bij wie eigenlijk niet van luchtwegobstructie gesproken mag worden, en u mist er vooral jongere, wat langere mensen in bij wie dat wel zou mogen. Misschien komt u bij een juister selectiecriterium wel tot dezelfde conclusie, maar door het huidige selectiecriterium hebt u een bias in het onderzoekmateriaal aangebracht die de bevindingen (deels) kan verklaren.
We kunnen grafisch uitbeelden hoe de ondergrens van
‘normaal’ loopt als we een vast percentage (bijv. 80%) van de
voorspelde waarde aanhouden of de echte 5 percentielgrens.
Zij leiden tot een verschillend oordeel, dat mede afhankelijk is
van leeftijd en lengte, maar ook van geslacht en etnische groep.
Hiermee geheel in overeenstemming lieten Hardie et al. [1] zien dat toepassing van de GOLD (Global Initiative for Chronic Obstructive Lung Disease) criteria voor de definitie van stadium I van COPD (FEV1%FVC < 70% and FEV1 % voorspeld > 80% er toe leidt dat 35% van gezonde, oudere niet-rokers ten onrechte wordt geklassificeerd in de groep COPD stadium I. Boven de 80 jaar nam dit toe tot 50%, terwijl ongeveer een-derde werd geklassificeerd als stadium II COPD. Zoals boven werd uitgelegd zijn deze resultaten volkomen voorspelbaar en komen zij voort uit een arbitraire en niet wetenschappelijk gefundeerde definitie van een ondergrens. Van dat laatste heeft alleen de farmaceutische industrie profijt.
1. Hardie JA, Buist AS, Vollmer WM, Ellingsen I, Bakke PS, Mokve O. Risk of over-diagnosis of COPD in asymptomatic elderly never-smokers. Eur Respir J 2002; 20: 1117-1122.
Berekening ondergrens 1: Standaarddeviatiescore = SDS = (gemeten waarde - voorspelde waarde)/RSD, in dit geval (2,35 - 3,01)/0,51 = -1,29. Bij een normale verdeling wordt de ‘ondergrens van normaal’ bepaald door een SDS van –1,64 (dus voor deze man bij 3,01 – 1,64·0,51 = 2,17 L), en komt maar 5% van gezonde mannen een waarde onder –1,64 voor.
Berekening ondergrens 2: De standaarddeviatiescore is in dit geval (4,10 - 5,12)/0,51 = -2,00. Bij een normale verdeling wordt de ‘ondergrens van normaal’ bepaald door een SDS van –1,64 (dus voor deze man bij 5,12 – 1,64·0,51 = 4,28 L), en komt er maar 5% van gezonde mannen een waarde onder –1,64 voor.