Voor de beste ervaring schakelt u JavaScript in en gebruikt u een moderne browser!
Je gebruikt een niet-ondersteunde browser. Deze site kan er anders uitzien dan je verwacht.
Wetenschappers, waaronder alumnus Biological Sciences Thijs van den Burg, hebben een standaard werkwijze gepubliceerd waarmee de kwaliteit van data in de wereldwijde genetische databank, GenBank, kan worden gecontroleerd. Met amfibieën als casestudy bekeken zij meer dan 39.000 records, waarvan er ruim 2.300 incorrect bleken te zijn. Het artikel is gepubliceerd in Scientific Data.
Verschillende soorten amfibieën: 1) Boophis in Madagaskar; 2) Dendropsophus anceps in Brazilië, 3) Dendropsophus bipunctatus in Brazilië en 4) de gewone pad (Bufo bufo) in Nederland. Foto’s: Matthijs van den Burg.

Wetenschappers in veel verschillende biologische disciplines gebruiken genetische informatie (DNA) binnen hun onderzoek. Wanneer zij resultaten publiceren in wetenschappelijke tijdschriften wordt gevraagd om nieuwe genetische informatie vrij toegankelijk te maken via een genetische databank. De bestanden die zij aanbieden worden echter zelden meer aangepast.

Binnen de taxonomie beschrijven biologen nieuwe soorten en de wereldwijde soortenrijkdom. Dit vakgebied staat niet stil en met nieuwe data kunnen de grenzen tussen soorten dan ook veranderen. Zo kan één soort worden gesplitst in meerdere soorten, maar ook omgekeerd, en kunnen soorten binnen een ander geslacht (genus) worden geplaatst.

Oorsprong van fouten

Thijs van den Burg is eerste auteur van het artikel en voerde het onderzoek uit als onderdeel van zijn MSc Biological Sciences aan masteropleiding Biological Sciences aan de Universiteit van Amsterdam: ‘Doordat de taxonomie verandert, maar de bestanden op GenBank zelden worden aangepast, ontstaan er fouten. Door een recente update van GenBank worden taxonomische synoniemen nu samengevoegd, maar het identificeren en verwijderen van foutieve records blijft belangrijk om te voorkomen dat verkeerde onderzoekconclusies getrokken worden.’

Gecorrigeerde database voor amfibieën

Met amfibieën en één enkel gen (cytochrome b) als casestudy, hebben onderzoekers nu gevonden dat van de 39.000 beschikbare records, 13% taxonomisch verouderd is. Na deze correcties zijn met behulp van DNA verschillen de potentiele fouten geïdentificeerd, waarvan >2.300 records (6%) ook foutief bleken; hoofdzakelijk door dieren die incorrect zijn geïdentificeerd. De onderzoekers hebben hun resultaten en automatische werkwijze (in R-programmeertaal) vrij toegankelijk gemaakt. Andere onderzoekers kunnen daarmee data van hun eigen studiesoorten onderzoeken.

Het identificeren van incorrecte records is van belang om de wereldwijde soortenrijkdom van amfibieën beter te begrijpen, en nog onbekende soorten te kunnen geïdentificeerd. ‘Dit is met name van belang omdat amfibieën de meest bedreigde groep van gewervelden dieren zijn, en vele soorten op de rand van uitsterven staan door verspreiding van dodelijke schimmelziektes, klimaatverandering en habitatvernietiging,’ benadrukt Van den Burg.

Publicatiegegevens

https://doi.org/10.1038/s41597-020-00598-9

Contactpersoon

Thijs van den Burg
thijs.burg@gmail.com