5 dingen waar zelfverklaarde COVID-19 ‘experts’ het verkeerd hebben over statistieken

Sep 21, 2020

Als we statistieken niet analyseren voor de kost, wordt het gemakkelijk meegenomen door verkeerde informatie over COVID-19-statistieken op sociale media, vooral als we niet de juiste context hebben.

We kunnen bijvoorbeeld statistieken uitkiezen die ons standpunt ondersteunen en statistieken negeren die aantonen dat we ongelijk hebben. We moeten deze statistieken ook nog steeds correct interpreteren.

Het is gemakkelijk voor ons om deze verkeerde informatie te delen. Veel van deze statistieken hangen ook met elkaar samen, waardoor misverstanden snel kunnen toenemen.

Hier lees je hoe we vijf veelvoorkomende fouten kunnen voorkomen en indruk kunnen maken op vrienden en familie door de juiste statistieken te verzamelen.

1. Het is het besmettingspercentage dat beangstigend is, niet het sterftecijfer

Posts op sociale media waarin COVID-19 wordt vergeleken met andere doodsoorzaken, zoals griep , suggereren dat COVID-19 niet echt dodelijk is .

Maar deze berichten missen de besmettelijkheid van COVID-19. Daarvoor moeten we kijken naar het sterftecijfer voor infectie (IFR) – het aantal COVID-19-sterfgevallen gedeeld door alle geïnfecteerden (een aantal dat we in dit stadium alleen kunnen schatten, zie ook punt 3 hieronder).

COVID-19 heeft een hogere IFR dan griep. Berichten die een lage IFR voor COVID-19 impliceren, onderschatten dit zeker. Ze missen ook twee andere punten.

Ten eerste, als we de typische IFR-griep van 0,1% vergelijken met de meest optimistische schatting van COVID-19 van 0,25%, dan blijft COVID-19 meer dan twee keer zo dodelijk als de griep.

Ten tweede, en nog belangrijker, moeten we voor elk virus kijken naar het basisreproductienummer (Die welkbekende R van Epidemioloog Ori ). Dit is het aantal extra mensen dat een besmette persoon naar schatting besmet.

Een normale griepje *flu) heeft een R₀ van ongeveer 1,3. Hoewel de COVID-19-schattingen variëren, ligt de R wereldwijd rond een mediaan van 2,8 (in Suirname staan wij nu gelukkig wat lager). Vanwege de exponentiële groei van infecties, betekent de sprong van 1,3 naar 2,8 dat COVID-19 veel besmettelijker is dan griep.

Als je al deze statistieken combineert, kun je de motivatie achter onze volksgezondheidsmaatregelen zien om ‘de verspreiding te beperken’. COVID-19 is niet alleen zo dodelijk, maar ook dodelijk en zeer besmettelijk.

2. Exponentiële groei en misleidende grafieken

Een eenvoudige grafiek kan het aantal nieuwe COVID-gevallen in de loop van de tijd uitzetten. Maar aangezien nieuwe gevallen onregelmatig kunnen worden gerapporteerd, zijn statistici meer geïnteresseerd in de snelheid waarmee het totale aantal gevallen in de loop van de tijd groeit. Hoe steiler de opwaartse helling in de grafiek, hoe meer we ons zorgen moeten maken.

Voor COVID-19 proberen statistici de exponentiële groei in gevallen te volgen. Simpel gezegd: ongeremde COVID-gevallen kunnen leiden tot een steeds groter aantal gevallen. Dit geeft ons een grafiek die in het begin langzaam volgt, maar dan met de tijd scherp naar boven buigt. Dit is de curve die we willen afvlakken, zoals hieronder weergegeven.

‘De curve afvlakken’ is een andere manier om ‘de spread te vertragen’. De epidemie wordt langer, maar we verminderen het aantal ernstige gevallen, waardoor de volksgezondheidsstelsels minder worden belast. The Conversation / CC BY ND

In posts op sociale media worden de COVID-19-cijfers echter routinematig vergeleken met die van andere doodsoorzaken, waaruit blijkt:

Zelfs als onderzoekers het hebben over exponentiële groei, kunnen ze nog steeds misleiden.

De veel gedeelde analyse van een Israëlische professor beweerde dat de exponentiële groei van COVID-19 “na acht weken afneemt”. Nou, hij had duidelijk ongelijk. Maar waarom?

Zijn model ging ervan uit dat COVID-19-gevallen exponentieel groeien over een aantal dagen, in plaats van over een opeenvolging van transmissies, die elk enkele dagen kunnen duren. Dit bracht hem ertoe alleen de grillige groei van de vroege fase van de uitbraak in kaart te brengen.

Betere visualisaties kappen die grillige eerste gevallen af, bijvoorbeeld door te beginnen bij het 100ste geval. Of ze gebruiken schattingen van het aantal dagen dat het duurt voordat het aantal gevallen is verdubbeld (ongeveer zes tot zeven dagen).

3. Niet alle infecties zijn cases

Dan is er de verwarring over COVID-19-infecties versus gevallen. In epidemiologische termen is een “geval” een persoon bij wie de diagnose COVID-19 wordt gesteld, meestal door een positief testresultaat.

Maar er zijn veel meer infecties dan cases. Sommige infecties vertonen geen symptomen, sommige symptomen zijn zo onbeduidend dat mensen denken dat het gewoon verkouden is, testen is niet altijd mogelijk voor iedereen die het nodig heeft, en testen pikt niet alle infecties op .

Infecties “veroorzaken” gevallen, testen ontdekt gevallen. De Amerikaanse president Donald Trump was dicht bij de waarheid toen hij zei dat het aantal gevallen in de VS hoog was vanwege het hoge aantal tests. Maar hij en anderen hadden het nog steeds helemaal mis.

Meer testen leidt niet tot meer gevallen, het maakt een nauwkeurigere schatting van het werkelijke aantal gevallen mogelijk.

De beste strategie, epidemiologisch gezien, is niet om minder te testen, maar om zo breed mogelijk te testen, waarbij de discrepantie tussen gevallen en algehele infecties tot een minimum wordt beperkt.

4. We kunnen sterfgevallen niet vergelijken met gevallen van dezelfde datum

De schattingen lopen uiteen , maar de tijd tussen infectie en overlijden kan wel een maand bedragen. En de variatie in tijd tot herstel is zelfs nog groter. Sommige mensen worden erg ziek en hebben veel tijd nodig om te herstellen, sommige vertonen geen symptomen.

Sterfgevallen die op een bepaalde datum zijn geregistreerd, weerspiegelen dus sterfgevallen uit gevallen die enkele weken eerder zijn geregistreerd, terwijl het aantal gevallen mogelijk minder was dan de helft van het aantal huidige gevallen.

De snelle verdubbelingstijd en langdurige hersteltijd zorgen ook voor een grote discrepantie tussen het aantal actieve en herstelde gevallen . Alleen achteraf weten we de echte cijfers.

5. Ja, de gegevens zijn rommelig, onvolledig en kunnen veranderen

Sommige gebruikers van sociale media worden boos als de statistieken worden aangepast, wat samenzweringstheorieën aanwakkert. Soms zelfs fake news. Of vaak fake news? Any way. Weinigen beseffen echter hoe gigantisch, chaotisch en complex de taak is om statistieken bij te houden over een ziekte als deze.

Landen en zelfs staten kunnen gevallen en sterfgevallen anders tellen. Het vergt ook tijd om de gegevens te verzamelen, waardoor aanpassingen achteraf worden doorgevoerd.

Pas achteraf weten we wat de echte cijfers van deze pandemie zijn. Evenzo waren vroege modellen niet per se verkeerd omdat de modelbouwers bedrieglijk waren, maar omdat ze onvoldoende gegevens hadden om mee te werken.

Welkom in de wereld van gegevensbeheer, gegevensopschoning en gegevensmodellering, die veel statistici niet altijd op prijs stellen. Tot nu.