Shi-kansikuva-1024x657.jpg

Värien luokittelua koneoppimisen avulla

Shi Cheng tutki pro gradu –tutkielmassaan hermoverkkopohjaista biovärien ja synteettisten värien luokittelua heijastusspektridatan perusteella. Cheng toteutti tutkielmansa Itä-Suomen yliopistossa ja BioColour-projektissa.

Värejä karakterisoidaan ja ryhmitellään biopohjaisten tai synteettistä alkuperää olevien värien ryhmiin perinteisesti erilaisilla fysikaalisilla ja kemiallisilla menetelmillä. Opiskellessani tietojenkäsittelytiedettä halusin testata uusia ja perinteisestä poikkeavia tapoja luokitella värejä. KNN- ja SVM-mallit ovat yleisiä luokittelualgoritmeja, joita käytetään koneoppimisen alalla kohdeobjektien erottamiseksi toisistaan. Myös BP-verkko palvelee samaa tarkoitusta. Tein tutkimuksessani kokeita näillä kaikilla kolmella lähestymistavalla ja yritin löytää parhaan menetelmän.

Tutkimustyöni tavoitteena oli löytää tarkka menetelmä biovärien ja synteettisten värien luokitteluun niiden spektritietoihin perustuen vertaamalla BP (Back Propagation) -verkkoa KNN (K-Nearest Neighbors) – ja SVM (Support Vector Machine) -malleihin. Ensin keräsin ja esikäsittelin heijastusspektritietojoukon, joka sisälsi 219 bioväriä ja 803 synteettistä väriä. Aallonpituusväli oli 400 – 700 nm välillä ja aallonpituuden resoluutio oli 10 nm. Sitten tietojoukko käsiteltiin erikseen BP-verkostossa, KNN-mallissa ja SVM-mallissa. Sovelsin erilaisia ​​parametreja ja käytin PCA-analyysiä (pääkomponenttianalyysi) jokaisen menetelmän kohdalla löytääkseni parhaan ja tarkimman menetelmän.

Vertaamalla kolmesta kokeesta saatuja tuloksia voidaan päätellä, että kaikilla testatuilla menetelmillä on mahdollista saavuttaa tarkka tulos optimoinnin jälkeen. BP-verkon tarkkuus oli 98,35%, KNN-mallin 95,43% ja SVM-mallin 92,22%.  BP-verkostolla oli siten paras suorituskyky tämän aineiston analysoinnissa ja biovärien erottamisessa synteettisistä väreistä.

Tässä pro gradu -tutkielmassa saavutetut luokitustulokset ovat osa suurempaa tutkimuskokonaisuutta, jossa tutkitaan värien, erityisesti biovärien, luokittelua ja klusterointia. Toisiinsa linkittyvien aiheiden parissa työskentelee useita opinnäyteyöntekijöitä, joita ohjaa datatieteen professori Xiao-Shi Gao. ”BioColour-projekti tarjoaa meille erittäin kiinnostavan sovellusalueen, jossa opimme paljon muusta konsortiosta”, sanoo professori Markku Hauta-Kasari, BioColour-hankkeen laskennallisen spektrikuvantamisen tutkimusryhmän johtaja Itä-Suomen yliopistosta.

Kirjoittaja: Shi Cheng, Filosofian maisteri, Itä-Suomen yliopisto

Jaa
FacebookTwitter