Uitleg over onze methodologie achter de E-nummerlijst

De meeste E-nummerlijsten op internet zijn simpel: groen of rood, veilig of gevaarlijk. Vaak gebaseerd op één bron, soms op niet meer dan een mening. Wij doen het fundamenteel anders. In elke E-nummerbeoordeling zitten vele uren werk. Niet enkele minuten, niet een snelle zoekactie. Uren. Per stof doorzoeken we de volledige internationale wetenschappelijke literatuur, selecteren we met de hand de beste studies, controleren we wie het onderzoek heeft betaald, en laten we het resultaat keer op keer nakijken, zowel door kunstmatige intelligentie als door mensen, tot we er zeker van zijn dat het klopt. Dit is niet een louter automatisch gegenereerde lijst, maar een lijst dat vele handmatige iteraties heeft ondergaan.

Wat er voorafgaat aan één score
Voor elk E-nummer doorzoeken we systematisch de grootste wetenschappelijke databases ter wereld: PubMed (de biomedische database van het Amerikaanse National Institutes of Health), Semantic Scholar, OpenAlex en Google Scholar. We maken gebruik van databases van de EFSA (European Food Safety Authority), het IARC (International Agency for Research on Cancer) en de WHO. Per stof voeren we tientallen gerichte zoekstrategieën uit: van brede veiligheidszoekopdrachten tot specifiek onderzoek naar effecten op kinderen, darmgezondheid, hormoonverstoring en cocktaileffecten bij gecombineerde blootstelling. Dit levert per E-nummer honderden tot soms meer dan duizend wetenschappelijke publicaties op. Over ons volledige bestand zijn tot nu toe meer dan honderdduizend studies doorzocht en beoordeeld.

De meeste studies vallen af
Van die honderden publicaties per stof selecteren we uiteindelijk de beste dertig tot vijftig. De rest valt af: te klein, te indirect, niet relevant genoeg, of inmiddels ingetrokken door het wetenschappelijke tijdschrift. Die selectie is geen automatisch filter. Het is een proces waarin relevantie, bewijskracht en wetenschappelijke impact tegen elkaar worden afgewogen, en waar een redacteur het laatste woord heeft. Wat overblijft is het beste van het beste, de kern van het beschikbare bewijs.

Niet elke studie is gelijk
Een meta-analyse van tienduizend deelnemers is niet hetzelfde als een laboratoriumproef met twintig ratten. Een EFSA-evaluatie op basis van jarenlang onderzoek is niet hetzelfde als een enkele expert-opinie. Ons algoritme weet dat.

Elke studie wordt gewogen op meerdere factoren:

  • Bewijskracht – Meta-analyses en evaluaties van de EFSA en WHO wegen het zwaarst. Dier- en laboratoriumstudies dragen bij, maar met een bescheidener gewicht.
  • Actualiteit – Recenter onderzoek telt zwaarder. Een studie uit 2024 reflecteert de huidige stand van kennis beter dan een uit 2005. Maar gezaghebbende evaluaties behouden hun waarde, ook als ze ouder zijn.
  • Omvang en wetenschappelijke impact – Een studie met duizenden deelnemers en honderden citaties draagt meer bij dan een kleinschalig experiment dat nauwelijks navolging heeft gekregen.
  • Wie heeft het betaald? – Dit is misschien wel het meest onderscheidende element van onze aanpak. Via meerdere bronnen achterhalen we wie het onderzoek heeft gefinancierd. We beschikken over een uitgebreide, met de hand samengestelde database van producenten, lobbygroepen en consultancybureaus in de additievenindustrie. Onderzoek betaald door de producent van een stof wordt anders gewogen dan onafhankelijk onderzoek. Niet omdat industrie-onderzoek per definitie onbetrouwbaar is, maar omdat de wetenschappelijke literatuur aantoont dat financieringsbron een meetbare invloed heeft op onderzoeksuitkomsten.

Zes vaste controlelagen
Voordat een score op deze website verschijnt, doorloopt elke beoordeling zes afzonderlijke controles. Dat is niet uit luxe. Het is omdat we vinden dat je bij gezondheidsbeoordelingen niet voorzichtig genoeg kunt zijn.

  1. Relevantiefiltering – Per studie wordt beoordeeld of deze daadwerkelijk relevant is voor de voedselveiligheid van de specifieke stof. Dierstudies met irrelevante toedieningsroutes, studies over een ander additief met een vergelijkbare naam, onderzoek met niet-realistische doseringen: het wordt hier uitgefilterd.
  2. Gestructureerde extractie – Uit elke geselecteerde studie worden de kernbevindingen gehaald: wat was de conclusie, hoe sterk is het bewijs, hoe groot was de studie, en in welke context zijn de effecten waargenomen?
  3. Automatische dubbelcheck – Elke extractie wordt opnieuw beoordeeld. Klopt de conclusie? Is het label correct? Studies waar twijfel over bestaat worden gemarkeerd.
  4. Eindreview door Claude Opus – Het volledige dossier wordt voorgelegd aan Claude Opus, op dit moment het meest geavanceerde en betrouwbaarste AI-model dat beschikbaar is. Opus beoordeelt het geheel kritisch: signaleert gemiste context, identificeert tegenstrijdigheden, controleert of de score aansluit bij het bewijs. We hebben bewust gekozen voor het duurste model dat er is, omdat we bij gezondheidsbeoordelingen vinden dat het beste niet goed genoeg is, het is het minimum.
  5. Menselijke beoordeling – Een redacteur doorloopt het volledige dossier, controleert twijfelgevallen en valideert het eindresultaat. Geen enkel E-nummer verschijnt op de website zonder dat een mens het gezien, beoordeeld en goedgekeurd heeft.
  6. Feedback-integratie – Alle bevindingen uit de eerdere vijf lagen worden gewogen en waar nodig doorgevoerd. Handmatige correcties van de redacteur worden structureel verwerkt, zodat het systeem er bij toekomstige analyses van leert.

Elke laag kan de voorgaande corrigeren. Samen vormen ze een vangnet dat niet één, niet twee, maar zes keer controleert of het eindresultaat klopt.

Elk E-nummer is met de hand doorgenomen
Dit willen we benadrukken, want het is de kern van onze aanpak: geen enkel E-nummer op deze website is puur machinaal tot stand gekomen. Elke beoordeling is individueel door een redacteur doorgenomen. Dat kost tijd, heel veel tijd.

Harde veiligheidsgrenzen
Voor stoffen die door het International Agency for Research on Cancer (IARC) als (mogelijk) kankerverwekkend zijn geclassificeerd, hanteren wij harde bovenlimieten die we rechtstreeks uit de IARC-database overnemen. Geen enkel algoritme, geen enkele AI-review en geen enkele andere factor kan deze grenzen doorbreken. Als het IARC een stof als kankerverwekkend beschouwt, reflecteert onze score dat. Altijd.

De score op de website
De score die je op de website ziet is een relatieve score: deze laat zien hoe een E-nummer zich verhoudt tot alle andere E-nummers die wij geanalyseerd hebben. We hebben bewust gekozen voor deze aanpak. De reden is dat de meeste E-nummers bij normaal gebruik redelijk veilig zijn. Met een absolute score zou het meeste oranje of groen kleuren en zou je als consument te weinig verschil zien. De relatieve score maakt direct zichtbaar welke stoffen er positief uitspringen en bij welke de meeste aanwijzingen voor mogelijke gezondheidsproblemen bestaan. Zo kun je als consument gemakkelijk vergelijken en een weloverwogen keuze maken.

Wat de kleuren betekenen

Kleur Score Betekenis
Groen 60 of hoger Dit E-nummer scoort in de bovenste groep. Het wetenschappelijke bewijs is overwegend gunstig. Bij normaal gebruik zijn er geen noemenswaardige zorgen gevonden in de literatuur.
Oranje 40 tot 60 De middengroep. Het bewijs is gemengd, onvoldoende of tegenstrijdig. Er zijn geen ernstige alarmsignalen, maar er zijn kanttekeningen of open vragen. Met mate gebruiken is verstandig.
Rood Onder 40 Dit E-nummer scoort in de onderste groep. Er zijn serieuze aanwijzingen voor mogelijke gezondheidsproblemen, of er is te weinig onderzoek om de veiligheid te onderbouwen.

Onze software
De wetenschappelijke analysesoftware achter deze beoordelingen is volledig in-house ontwikkeld. Het is geen bestaand product dat we van de plank hebben gehaald, maar een op maat gebouwd platform dat specifiek is ontworpen voor grootschalige, systematische literatuuranalyse met menselijke supervisie.

Organisaties die geïnteresseerd zijn in het gebruik van onze technologie voor eigen onderzoeksdoeleinden, zoals universiteiten, onderzoeksinstituten, toezichthouders of bedrijven in de voedingsindustrie, kunnen contact met ons opnemen om de mogelijkheden te bespreken. Onze software is beschikbaar onder een commerciële licentie.

Eerlijk over onze beperkingen
Onze scores zijn geen gezondheidsadviezen. Een hoge score betekent niet dat je een stof onbeperkt kunt consumeren. Een lage score betekent niet dat je ziek wordt van een enkel product. Wat onze score wél doet: je een eerlijk, wetenschappelijk onderbouwd beeld geven van wat de wetenschap op dit moment weet over een additief.

Wetenschap staat niet stil, en wij ook niet. Ons algoritme wordt doorlopend verfijnd en scores worden herberekend wanneer nieuwe inzichten daar aanleiding toe geven. We streven niet naar perfectie, die bestaat niet. Maar we beloven je wel dat elke score op deze website het resultaat is van een zorgvuldig, meervoudig gecontroleerd proces waar uren menselijk werk in zit.

Vragen over onze methodologie of interesse in onze software? Neem contact met ons op via het contactformulier.