Tartu Ülikooli teadlased tegid uuringu, milles võeti esimest korda kokku Eesti e-tervise andmebaasi kogutud info naiste emakakaela koeproovide (PAP-test) ja suure riskiga HPV testide tulemuste kohta. Uuringus kasutati populatsioonipõhist juhuvalimit, kuhu kuulusid veidi üle 66 000 naise anonüümsed andmed. See on Euroopas seni teadaolevalt suurima valimiga taoline uuring.
Emakakaelal vähieelseid muutusi ja vähki põhjustavate HPV tüvede kindlakstegemine Eestis on uuringu juhtautori, Tartu Ülikooli peremeditsiini ja rahvatervishoiu instituudi professori Anneli Uusküla sõnul oluline seepärast, et vaktsiine arendatakse välja kindlatest viirusetüvedest lähtuvalt. Tüvede levik võib aga olla piirkonniti erinev. Nii selgub uuringust, et Eestis kasutusel oleva vaktsiini toimel langeb vähieelsete raske astme muutuste esinemissagedus poole võrra ja üle 60% emakakaelavähi juhtudest oleksid ennetatavad.
„Seda on veidi vähem, kui näiteks USA-s või Austraalias, kus neid vaktsiine arendatakse. Emakakaelavähi sõeluuringuga on vaja seepärast kindlasti regulaarselt jätkata,“ ütles Uusküla.
Andmeteadus tervishoiu teenistuses
Uuringu teine eripära seisneb selles, et terviseandmetel rakendati andmekaeve ja masinõppe meetodeid. Terviseandmeid kogutakse digitaalsel kujul paljudes riikides, kuid paraku on need andmed 80 protsendil juhtudest struktureerimata. Muuhulgas hõlmavad need nii patsiendi sümptomite kirjeldusi, arsti antud ravisoovitusi kui ka haigusloo lähemat kirjeldust. Kuna viimane on aga sageli esitatud vaba tekstina, pole võimalik kuigi hõlpsalt eri analüüside tulemusi kokku viia ja suure pildi kokkupanemine muutub keeruliseks.
Tartu Ülikooli arvutiteaduste instituudis on terviseandmete standardiseerimise teemaga tegeletud juba aastaid. Eesti e-tervise süsteem, kuhu jookseb kokku kogu riigi terviseinfo, pakub selleks rikkalikult lähtematerjali. Teadlased on loonud info põhjal standardiseeritud andmebaasi, mis hõlmab umbes 10% Eesti elanikkonnast. Andmekogu üks kasutusviise ongi just masinõppemeetoditega terviseriske prognoosivate algoritmide loomine.
Terviseinformaatika kaasprofessori Raivo Kolde sõnul on andmestiku eripära see, et tegu on Eesti elanikkonna juhusliku läbilõikega, mis pole piiritletud kindla haigla või perearstikeskusega. Seepärast sobib andmestik hästi kogu populatsiooni haaravate analüüside tegemiseks. „Oleme viinud andmed rahvusvahelisele standardile vastavale kujule, et hõlbustada Eesti andmete sidumist rahvusvaheliste andmekogudega ja võimaldada osalemist eri riike hõlmavates terviseuuringutes,“ selgitas Kolde.