Välja on töötatud uus algoritm: kuidas leida üles kõige atraktiivsemad reisisihtkohad just sinu jaoks?
Inimesed kurdavad tihti, et põhjus, miks nad ei järgi automaatsüsteemide soovitusi, on see, et enamik nendest süsteemidest ei ole küllalt intelligentsed või ei paku piisavalt infot. Kui seni on turismi- või reisisüsteemide automaatsoovitused keskendunud peamiselt kaubanduslikele eesmärkidele, pakkudes näiteks kõige soodsamaid hotelle, restorane ja reisipileteid jms, siis Lubergi tähelepanu köitsid visuaalselt atraktiivsed ja huvitavad kohad. Oma doktoritöös vaatleb ta „automaatse turismisoovitaja” loomise erinevaid aspekte.
Kasutas Panoramio andmeid
Nii tegeles autor doktoritöö käigus erinevate soovitussüsteemide (nt Sightsplanner, Sightsmap ja Visit Estonia veebilehe soovitussüsteem) disainimise ja arendamisega ning nende jaoks andmete kogumise, töötlemise ja integratsiooniga. Eesmärk oli uurida viise, kuidas parandada erinevate automaatsüsteemide n-ö nõrkusi ja luua senisest täiuslikumaid süsteeme.
„Meil oli algusest peale plaan, et meie tulemust peab saama rakendada üle terve maailma,“ avaldas Ago Luberg. Lokaalseid soovitussüsteeme on tema sõnul loodud aga palju. „Üldiselt on lihtne leida infot Tallinna või Riia turismobjektide kohta, aga kui soovida teha midagi sellist, mis kataks kohe automaatselt suurema osa maailmast, peab mõtlema suuremalt. Seega oli meil kriteerium, et andmed peavad olema globaalsed. Selliseid andmehulki, mis oleks kättesaadavad ja kataks väga suurt ala, polnud väga palju. Panoramio andmed olid ühel ajahetkel kättesaadavad ja seda me oma töös oleme kasutanud,“ selgitas Luberg.
Tulemus on siiski oluline
Ühe olulise tulemusena näitas Ago Lubergi töö, kuidas saab turismiobjektidele sobivushinde arvutamisel rakendada tõenäosuslikku ja hägusloogikat, kasutades selleks ebakindlaid kategooriaid, ontoloogiaid ning tõestajapõhiseid algoritme. Teiseks töötati masinõppemeetodite põhjal välja süsteem, mille abil saab tuvastada samu reaalseid objekte kirjeldavad kirjeid, mis on aga pärit erinevatest andmeallikatest. Näiteks tuvastati loodud algoritmiga Tallinna söögikohtade andmestiku pealt õppides Riia turismiobjektide, sh muuseumid ja kunstigaleriid jms, kattuvus täpsusega 98%. Võrdluseks — eelnevalt oli see täpsus käsitsi seadistatud parameetritega märksa väiksem ehk 85%.
Kolmandaks lõi autor algoritmi, millega tuvastatakse turismiobjektide nimi ja kategooria — aluseks on võetud kasutajate sisestatud kirjeldusi objektide kohta, kusjuures saadud andmete põhjal on võimalik integreerida andmed erinevatest andmeallikatest. Näiteks Panoramio piltide allkirju kasutades suutis algoritm leida üles umbes 56% Suurbritannia ja Prantsusmaa Wikipedias esinenud turismiobjektidest.
Luberg hindab seda, et tema loodud soovitusalgoritm pakub turistile võimaluse kogeda visuaalselt atraktiivseid paiku üle maailma. „Kui reisi eesmärk on saada vinge elamus, siis just sellised paigad võiksid seda pakkuda. Tuhanded turistid üle maailma on loonud ühisteadmise sellest, mis läheb inimestele korda. Kui mõne soovituse puhul võetakse aluseks mõne eksperdi arvamust, siis meie jaoks ekspert ongi tavaline inimene. Ja me leiame, et tavaline inimene on just see, kes oskab meie soovitusi hinnata,“ selgitas Luberg.
Seda tüüpi töö puhul on Lubergi sõnul keeruline andmete vähesus. „Meil küll olid Panoramio andmed, aga tegelikult oleks tahtnud veel erinevaid allikaid saada, et neid siis omavahel kokku sobitada. Ühtlasi kurb on see, et kuna Panoramio on tegevuse lõpetanud, siis pole meil ka võimalik suuresti oma tulemusi sellisel kujul enam näidata. Küll aga loodan, et tehtud tööd saab rakendada teiste pildi- ja tekstiallikate peal ning see võib taas uusi ja põnevaid tulemusi anda.“
Taustainfoks — Panoramio oli 2005-2016 toiminud keskkond, kuhu oli võimalik pilte üles laadida ning ühtlasi märkida objekti asukoht. Saidile üles laaditud fotod olid saadaval Google Earthis ja Google Mapsis.