Blogi: Tieto käyttöön!

Miten pysyä kartalla koronatutkimuksesta?

Antti Pelkonen Julkaisupäivä 15.6.2020 9.50 Blogit

3D-mallinnus SARS-CoV-2-viruksestaGlobaali tiedeyhteisö on vastannut koronaviruspandemiaan nopeasti ja voimakkaasti, mikä on johtanut ennennäkemättömään tutkimusvolyymin kasvuun. Vaikka myös aiemmissa 2000-luvun epidemioissa (SARS, H1N1, Ebola, Zika) tutkijat ovat reagoineet nopeasti ja tieteellisten julkaisujen määrä on kasvanut jyrkästi pian epidemian puhkeamisen jälkeen (Zhang ym. 2020), nyt käynnissä olevassa pandemiassa reaktion nopeus ja volyymi on ollut ennen kokematonta.

Esimerkiksi COVID-19 -tutkimusta koostavassa LitCovid-palvelussa on nyt kesäkuun alussa, vajaa puoli vuotta kriisin alun jälkeen, on yli 21 000 julkaisua. Uutta tutkimustietoa julkaistaan jatkuvasti, ja esimerkiksi Dimensions-tietokantaan tuli toukokuun 2020 aikana päivittäin yli 650 uutta julkaisua (Porter 2020). Globaalin tutkimusponnistuksen seurauksena ymmärrys uudesta koronaviruksesta on lyhyessä ajassa lisääntynyt valtavasti.

Koronatutkimuksen suuren volyymin ohella huomionarvoista ovat myös siihen kytkeytyvät laadulliset muutokset. Pandemia on jo mm. vaikuttanut tapoihin, jolla tieteellistä tietoa välitetään ja julkaistaan. Merkittävää on preprint-julkaisujen eli ns. esijulkaisujen rooli koronapandemiaan liittyvässä tutkimuksessa. Huomattava osa COVID-19-tutkimuksesta julkaistaan esijulkaisuina, käytännössä siis vertaisarvioimattomina artikkelikäsikirjoituksina: huhtikuun loppuun mennessä lähes 40 prosenttia kaikista COVID-19 julkaisuista oli preprinttejä ja toukokuun loppupuolella niiden lukumäärä oli jo ylittänyt 10 000 julkaisun rajan (Fraser 2020). Tilanne on uudenlainen, sillä esimerkiksi Zika- ja Ebola-epidemioiden kohdalla alle 5 prosenttia tieteellisissä lehdissä julkaistuista artikkeleista oli ilmestynyt esijulkaisuina ennen julkaisua tieteellisessä lehdessä (Johansson ym. 2018).

Esijulkaiseminen ja nopeutettu vertaisarviointi

Esijulkaiseminen mahdollistaa tutkimustiedon nopeamman kommunikoinnin. Esimerkiksi Ebola- ja Zika-epidemioiden kohdalla on havaittu, että useimmissa tapauksissa preprintteinä julkaistiin analyysejä ja dataa, jotka ilmestyivät tieteellisissä julkaisuissa vasta yli 100 päivää myöhemmin (Johansson ym. 2018). Tieteellisen tiedon nopea julkaiseminen erityisesti pandemioiden olosuhteissa on hyvä asia. Toisaalta olennaista on, että esijulkaisut eivät ole läpikäyneet tieteellisille artikkeleille kuuluvaa vertaisarviointia, joten niissä esitettyihin tuloksiin liittyy huomattavasti julkaisuprosessin läpikäyneitä artikkeleita enemmän epävarmuutta.

Esijulkaisujen tulokset saavat osakseen runsaasti huomiota, myös uutismediassa: Fraser ym. (2020) mukaan COVID-19 preprinttien abstrakteja luetaan 15 kertaa enemmän kuin muita preprinttejä, niitä ladataan 30 kertaa enemmän, siteraataaan ja jaetaan Twitterissä enemmän ja niillä on lähes 200 kertaa suurempi todennäköisyys tulla jaetuksi printti- tai verkkouutismediassa. Pandemia onkin synnyttänyt tilanteen, jossa kiinnostus ja yhteiskunnallinen tarve tutkittuun tietoon on suuri, tutkijoilla halu tuoda tutkimustuloksiaan nopeasti julki, ja media tarttuu tuloksiin nopeasti. Ongelmia voikin syntyä, jos preprint-julkaisuissa esitettyjä tuloksia tulkitaan ilman, että niihin sisältyvää epävarmuutta otetaan huomioon. Tärkeää olisikin, että tuloksiin liittyvä epävarmuus ja referoitavan tutkimuksen status tuotaisiin aina uutisoinnissa esiin.

Oma kysymyksensä on, minkälaista painetta tilanne synnyttää tieteellisten lehtien vertaisarviointikäytännöille ja miten lehtien toimitukset asiaan reagoivat. Ensimmäiset tutkimushavainnot viittaavat siihen, että ainakin lääketieteelliset lehdet ovat selvästi nopeuttaneet julkaisuprosesseja COVID-19-artikkelien osalta: arviointi- ja julkaisuprosessin kesto on lyhentynyt keskimäärin 49 prosentilla ja suurelta osin lyhentyminen on koskenut nimenomaan vertaisarviointiin käytettyä aikaa (Horbach 2020). Tämä herättää luonnollisesti kysymyksiä sekä vertaisarvioinnin että julkaistujen artikkelien laadun osalta. Pandemian aikana ainakin jo 15 korona-aiheista artikkelia onkin jo vedetty jälkikäteen pois tiedejulkaisuista.

Julkaisuja hyvin saatavilla, tutkimushankkeista tietoa huonommin

Mutta miten on mahdollista pysyä perillä siitä, mitä COVID-19 -tutkimuksen osalta tieteen kentällä tapahtuu, kun tutkimustietoa on paljon ja se myös kasvaa huimalla vauhdilla? Hyvä asia on, että suuri osa tutkimustiedosta on avoimesti saatavilla: monet tieteelliset lehdet ja kustantajat ovat avanneet aineistojaan laajasti saataville. Useat organisaatiot ovat myös luoneet COVID-19-tutkimusta koostavia tietokantoja, kuten esimerkiksi edellä mainittu US National Center for Biotechnology Information -keskuksen ylläpitämä LitCovid-palvelu ja Maailmanterveysjärjestö WHO:n globaali COVID-19 tutkimustietokanta. Näistä LitCovid ei sisällä esijulkaisuja päinvastoin kuin WHO:n tietokanta. Yksinomaan preprinttejä sisältävät puolestaan eri tieteenalojen tietovarastot, kuten esim. terveystieteiden medRxiv tai laajemmin luonnontieteitä ja mm. taloustieteitä arkistoiva arXiv. Myös monet tiedelehdet ja -kustantajat ovat koostaneet omille sivustoilleen COVID-19-tiedon ”hubeja”.

Julkaisuja huomattavasti vaikeampaa on saada kuvaa käynnissä olevista tutkimushankkeista. Tämä pitää paikkansa ns. normaalioloissakin mutta korostuu aikana, jolloin pandemiaan kohdistuvaa uutta tutkimusta käynnistetään laajasti, ja myös jo käynnissä olevaa tutkimusta uudelleensuunnataan COVID-19-aiheisiin. Joitain yrityksiä tutkimushankkeiden koostamiseen on olemassa. EU:n komissio on hiljattain avannut European Research Area (ERA) Corona Platformin, josta saattaa ajan myötä muodostua sekä EU:n että kansallisesti rahoitettujen koronatutkimusten tietopankki. On myös mielenkiintoista nähdä tuoko 9. kesäkuuta 2020 avattu tiedejatutkimus.fi-portaali tähän kysymykseen kansallisesti parannusta. Melko suuri osa suomalaisista yliopistoista listaa omilla verkkosivuillaan pandemiaan liittyvää asiantuntijoitaan ja osa myös tutkimustoimintaansa. Tutkimuslaitoksista näin tekee huomattavasti pienempi osa. Kokonaiskuvaa meneillään olevan koronapandemian eri ulottuvuuksin liittyvästä tutkimustoiminnasta ja -hankkeista kuitenkin hyvin vaikea, ellei mahdoton, muodostaa.

Valtaosa koronaan liittyvästä tutkimuksesta on lääketieteellistä tutkimusta, mutta myös muilla tieteenaloilla tehdään yhä enenevässä määrin teemaan liittyvää tutkimusta. Hyvä niin, koska tarvitsemme laajasti tutkittua tietoa kriisistä ja sen vaikutuksista eri yhteiskunnan osa-alueilla. Muiden tieteenalojen julkaisuja löytyy mm. edellä mainituista hakupalveluista, mutta myös tieteenalakohtaisilta alustoilta. Esimerkiksi yhteiskuntatieteellistä tutkimusta voi spesifimmin etsiä vaikkapa SocArxivista (preprinttejä) tai githubiin perustetusta Covid-19-social-science-research -tietokannasta (julkaisut, hankkeet, preprintit). Taloustieteen osalta tutkimusartikkeleita koostaa esimerkiksi Centre for Economic Policy Research (CEPR) keskuksen Covid Economics -sivusto. Laajempaa näkökulmaa pandemiaan haetaan myös esimerkiksi Leidenin yliopiston Centre for  Science and Technology Studies -keskuksen Broadening the Perspective on COVID-19 -aloitteessa, joka on tuottanut mielenkiintoisen kokoelman muiden kuin biolääketieteen tieteenalojen koronatematiikkaan liittyvästä tutkimuskirjallisuudesta ja kommentaareista.

Evidenssikartat ja tekoälyn hyödyntäminen

Yksi mielenkiintoinen tapa yrittää jäsentää COVID-19 -tutkimusta ovat myös temaattiset evidenssikartat, jotka koostavat uusinta tutkimustietoa aihealueittain. Tällaisia ylläpitävät mm. EPPI-Centre Isossa-Britanniassa ja  Norjan kansanterveysinstituutti Norwegian Institute of Public Health. Nämä evidenssikartat keskittyvät valtaosin lääketieteellisiin osa-alueisiin, mutta kumpikin huomioi myös sosiaaliset, taloudelliset ja poliittiset vaikutukset ja niihin liittyvän kirjallisuuden. Norjan kansanterveysinstituutin ylläpitämä palvelu erottelee myös artikkelien eri tyypit, eli palvelussa on esimerkiksi mahdollista hakea kaikki systemaattiset katsaukset tiettyyn temaattiseen kategoriaan liittyen.

Oma kysymyksensä on luonnollisesti se, miten suuresta tutkimusjulkaisujen määrästä voi erottaa merkityksellisimpiä ja relevanteimpia artikkeleita ja tutkimustuloksia. Eräänä vastauksena tähän kysymykseen ovat tekoälyä hyödyntävät sivustot, joita on kehitetty louhimaan eksponentiaalisesti kasvavaa COVID19-tutkimuskirjallisuutta. Kehityksen taustalla on vahvasti Yhdysvaltain White House Office of Science and Technology Policyn 16.maaliskuuta julkistettu pyyntö teköälyn kehittäjille luoda työkaluja kirjallisuuden louhimiseen. Monet työkaluista hyödyntävät koneluettavaa CORD-19 - COVID-19 Open Research Dataset -tietokantaa, joka sisältää noin 130 000 artikkelia.

Tekoälyä hyödyntäviä työkalujakin on monenlaisia. Esimerkiksi COVID-19 Primer ja BIP4COVID19 -sivustot yhdistävät COVID-19-kirjallisuutta muihin tietolähteisiin ja pyrkivät arvioimaan artikkeleiden merkittävyyttä tai suosiota mm. tarkastelemalla mm. viittauksia ja huomiota sosiaalisessa median ja uutissivustoilla. COVID-19 Primer lisäksi mm. jäsentää tutkimusta eri kategorioihin ja tuottaa niistä yhteenvetoja. Myös Pandemia.fi-sivuston tutkimustietokanta tarjoaa vastaavaa näkökulmaa ja kytkee tarkasteluun myös esimerkiksi lehden vaikuttavuusindikaattorit. Artikkeleiden merkittävyyden arvioiminen on luonnollisesti vaikeaa, ja nämä näkökulmat ovat toki vain yksi tapa tarkastella asiaa. COVID-19-tutkimuksella näyttäisi olevan tässä suhteessa yksi mielenkiintoinen piirre: sosiaalisen median huomion on havaittu ennustavan hyvin julkaisun saamia myöhempiä sitaatteja (Thelwall 2020).

Tekoälyä hyödynnetään myös perinteisemmillä hakusivustoilla. Esimerkiksi COVIDScholar-sivustolla tekoälyä käytetään haun tulosten filteröintiin ja katerorisointiin. COVID-19 Research Explorer on puolestaan työkalu, jossa tietokannalle on mahdollista esittää monimutkaisia tieteellisiä kysymyksiä kysymysmuodossa. Työkalu tuottaa listauksen artikkeleista jotka vastaavat kysymykseen siten, että keskeiset tekstikohdat ovat korostettuina.

Jatkossa on mielenkiintoista nähdä, minkälaisen roolin tekoälyavusteiset työkalut saavat yhtäältä COVID-19-tutkimuskirjallisuuden hyödyntämisessä ja toisaalta laajemmin tieteellisen tutkimuskirjallisuuden louhimisessa. Tässä vaiheessa näyttää siltä, että koronakriisi on ainakin antanut tämän alueen kehitykselle vahvan kehitysruiskeen. Se lienee joka tapauksessa varmaa, että COVID-19-kirjallisuuden, ja laajemmin koronapandemiaan liittyvä tutkimuskirjallisuuden, määrä jatkaa vahvaa kasvuaan.

Tämän blogitekstin liitteeksi olen laatinut koosteen COVID-19 –tutkimusta kokoavista verkkosivustoista ja tiedon lähteistä, joista osaan tekstissä on viitattu. Koosteen tarkoitus ei ole olla tyhjentävä listaus vaan pikemminkin esimerkinomainen kokoelma erilaisia ja erityyppisiä tietokantoja, jotka tutkimusta koostavat. Blogin kommenttikenttään toivoisin kommentteja ja huomioita mahdollisista muista hyvistä tiedonlähteistä, jotka täydentävät listausta.

Viitteet

Fraser, Nicholas (2020) Tracking the growth of COVID-19 preprints. Esitelmä Doing science in times of crisis: Science studies perspectives on COVID-19 -webinaarissa, 20.5.2020, Centre for Science and Technology Studies (CWTS), Leiden University.

Fraser, Nicholas, Liam Brierley, Gautam Dey, Jessica K Polka, Máté Pálfy, Jonathon Alexis Coates (2020) Preprinting a pandemic: the role of preprints in the COVID-19 pandemic. https://www.biorxiv.org/content/10.1101/2020.05.22.111294v1.article-metrics

Horbach, Serge (2020) Pandemic Publishing: Medical journals drastically speed up their publication process for Covid-19. https://www.biorxiv.org/content/10.1101/2020.04.18.045963v1.full.pdf

Johansson MA, Reich NG, Meyers LA, Lipsitch M (2018) Preprints: An underutilized mechanism to accelerate outbreak science. PLoS Med 15(4): e1002549. https://doi.org/10.1371/journal.pmed.1002549

Porter, Simon (2020) COVID-19 and preprint publishing culture. Esitelmä Doing science in times of crisis: Science studies perspectives on COVID-19 –webinaarissa, 20.5.2020, Centre for Science and Technology Studies (CWTS), Leiden University.

Thelwall, Mike (2020) COVID-19 publications: Citation indexes and altmetrics. Esitelmä Doing science in times of crisis: Science studies perspectives on COVID-19 –webinaarissa, 20.5.2020,  Centre for Science and Technology Studies (CWTS), Leiden University.

Zhang, L., Zhao, W., Sun, B., Huang, Y. and Glänzel, W. (2020) How scientific research reacts to international public health emergencies: A global analysis of response patterns. Scientometrics (forthcoming), published online June 9, 2020.

Teksti: tiedeasiantuntija Antti Pelkonen, valtioneuvoston kanslia
Kuvituskuva SARS-CoV-2-viruksesta: Wikimedia Commons

Lisää kommentteja