Tekoäly auttaa luokittelemaan poikkeavaa dataa

ByDigiNyt.fi

touko 11, 2022

Koneoppimisen perinteiset luokitusalgoritmit pyrkivät oppimaan luokittelumallin useille ennalta määritetyille luokille. Tietyissä tilanteissa tietojen kerääminen joistakin luokista voi kuitenkin olla haastavaa. Väitöskirjassaan DI Fahad Sohrab kehitti lähestymistavan, jossa aliavaruuden optimointi ja yhden luokan luokittelumallin oppiminen täydentävät toisiaan mallin luokittelukyvyn parantamiseksi.

Lääketieteellisessä diagnoosissa tietoja ei-terveiltä henkilöiltä on joko vaikea tai yksinkertaisesti mahdotonta saada. Esimerkiksi mammografiassa syövän havaitsemiseksi, kognitiivisten aivojen toimintojen spesifisen kohdeluokan tunnistamisessa, interstitiaalisten keuhkosairauksien luokittelussa tai sairaalainfektioiden havaitsemisessa kliinisen tiedon avulla on haastavaa kerätä edustava koulutusaineisto, joka sisältää myös riittävästi ei-terveitä tapauksia. Tällaisissa tapauksissa mallin luomiseen käytetään yhden luokan luokittelumenetelmiä.

Sohrabin kehittämässä aliavaruuden optimoinnissa yhden luokan luokitteluun tavoitteena on muuttaa tietyn avaruuden piirteet alempiulotteiseen avaruuteen, joka on optimoitu paremman luokittelutarkkuuden saavuttamiseksi. Sohrab kehitti myös menetelmän aliavaruuden optimoimiseksi multimodaalisen datan tapauksessa, jossa samaa kohdetta kuvaa useampi erilainen piirrevektori (esim. kuva ja ääninäyte).

Väitöskirjassaan hän osoittaa myös kokeellisesti yhden luokan luokitusmenetelmien kyvyn parantaa syväkonvoluutioneuroverkon suorituskykyä harvinaisten pohjaeläinten tunnistamisessa.

– Yhden tai useamman luokan datan puuttuminen johti sellaisten koneoppimismenetelmien syntymiseen, jotka vaativat tietoja vain yhdestä luokasta koulutusprosessin aikana. Yhden luokan luokittelumenetelmiä käytetään mallin luomiseen sen ennustamiseksi, tuleeko uusi näyte tästä kiinnostuksen kohteena olevasta luokasta. Esimerkiksi poikkeamien havaitsemisen mallin kouluttamiseen on yleensä haastavaa kerätä poikkeavaa dataa koulutusta varten, mutta normaalia dataa on saatavilla runsaasti, Sohrab toteaa.

Fahad Sohrabin väitöskirja tarjoaakin uuden tavan luoda yhden luokan luokitusmalleja, joita voidaan käyttää tilanteissa, joissa on tärkeää tunnistaa jokin poikkeava kategoria, mutta esimerkkejä kyseisestä kategoriasta on vähän.

Lähteet: STT / Tampereen yliopisto

Tekoäly auttaa luokittelemaan poikkeavaa dataa

ByDigiNyt.fi

By DigiNyt.fi

Missasitko nämä?

Livetulokset: Seuraa urheilutapahtumia reaaliajassa

Nextory: Sukella äänikirjojen ja e-kirjojen maailmaan

Podimo: Upea maailma podcasteja ja äänikirjoja odottaa sinua!

Jääkiekko Tulospalvelu: Tulokset ja tilastot verkossa