PERSONALIZIRANO UČENJE
22 Govorica UI: Kako vas YouTube spoznava – 1. del
Modeli in priporočila
AKTIVNOST
Na sliki so prikazane kartične transakcije dveh oseb, ki živita v Nantesu. Razmišljata o tem, kaj bi počela naslednji konec tedna. Kaj bi priporočili Johnu Doeju in kaj Tomu Harrisu?
Izbirate lahko med naslednjimi možnostmi:
- Obisk nove poslovalnice Burger King-a
- Degustacija oljčnega olja
- Obisk spletne trgovine s potovalno opremo
- Koncert ob reki
- Tečaj plavanja za otroke
Sistemi priporočil obstajajo vsaj tako dolgo kot turistični vodniki ali seznami tipa “deset najboljših”. No, medtem ko izbor časnika The Guardian – Best Books of 2022 vsem priporoča isti seznam knjig, bi ga vi sami verjetno prilagodili, če bi izbirali zase: izbrali bi jih le nekaj in spremenili bi vrstni red branja glede na svoje osebne preference.
Kako pa priporočiti nekaj nekomu, ki ga ne poznamo? Pri zgornji aktivnosti ste si verjetno poskušali predstavljati Johnove in Tomove osebnosti na podlagi danih informacij: uporabili ste lastno presojo in vsaj nezavedno so na vas vplivali tudi stereotipi. Nato ste na podlagi ustvarjene predstave o tipu njunih osebnosti s seznama izbrali tiste možnosti, ki bi lahko bile (ali pa tudi ne) pomembne zanju. Priporočilni sistemi podjetij, kot so Amazon, Netflix ali YouTube, se poslužujejo podobnega postopka.
Ko danes iščemo informacije ali želimo poiskati določene vsebine na spletu, vsi uporabljamo določeno vrsto personaliziranih sistemov priporočil1,2. Ena od glavnih funkcij YouTuba je, da uporabnikom predlaga, kaj naj si ogledajo izmed vseh videoposnetkov, ki so na voljo na platformi. Pri vpisanih (prijavljenih) uporabnikih se zanaša na njihove pretekle aktivnosti, na podlagi katerih ustvari “model” ali tip osebnosti. Ko ustvari model za Johna, lahko prepozna druge s podobnim modelom. Johnu zato priporoči videoposnetke, podobne tistim, ki jih je že gledal, in videoposnetke, podobne tistim, ki so si jih ogledali drugi, njemu podobni uporabniki.
Kaj pomeni “model”?
Modeli se uporabljajo za posnemanje česarkoli, od uporabnikov in videoposnetkov do vsebin, ki se jih mora naučit otrok ali učenec. Model je poenostavljena reprezentacija sveta, zaradi katere se lahko stroj “pretvarja”, da razume svet okrog sebe:
Kako vas YouTube spoznava
Vsi sistemi priporočil vključujejo podvprašanja. Najosnovnejše vprašanje, kaj priporočiti? – je nekoliko preveč splošno in nenatančno za algoritem. Netflix je razvijalce vprašal, kakšno oceno bi uporabnik A dal videu B glede na njegove ocene drugih videov. YouTube sprašuje po času (trajanju) gledanja za določenega uporabnika v določenem kontekstu. Izbira tega, kaj vprašati (in kaj napovedati), ima velik vpliv na to, kakšno priporočilo bo prikazano3. Ideja v ozadju je, da bo pravilna napoved pripeljala do dobrega priporočila. Sama napoved pa temelji na drugih uporabnikih z zgodovino podobnih iskanj4, torej na uporabnikih, ki jih reprezentirajo podobni modeli.
Uporabniški modeli
YouTube sistem priporočanja razdeli na dva koraka in za vsakega uporablja različne modele3. Mi pa v tem priročniku ostajamo pri nekoliko preprostejši razlagi.
Za izdelavo uporabniškega modela se morajo njegovi razvijalci vprašati, kateri podatki so pomembni za priporočanje videoposnetkov. Kaj si je uporabnik že ogledal? Kakšne ocene je podal in kakšne preference je izrazil? Kaj je iskal? Veliko bolj kot takšne eksplicitne informacije YouTube uporablja tiste bolj implicitne, saj so lažje dostopne3. Ali je uporabnik samo kliknil na videoposnetek, ali si ga je dejansko ogledal? Če si ga je ogledal, kako dolgo je trajal ogled? Kako se je odzval na pretekla priporočila1? Ali je katera od priporočil prezrl? Poleg odgovorov na ta vprašanja so pomembni tudi demografski podatki, kot so spol, jezik, lokacija in vrsta naprave, če je uporabnik nov ali ni prijavljen/vpisan3.
Ko je za vsakega uporabnika izdelan model, postane razvidno, kateri uporabniki so si med seboj podobni, in te informacije so uporabljene za oblikovanje priporočil.
Video modeli
Na podoben način kot pri uporabnikih YouTube označuje videoposnetke, ki so si med seboj podobni (ali različni). Za vsak videoposnetek pregleda njegovo vsebino, naslov in opis ter kakovost posnetka, število ljudi, ki si ga je ogledalo (število ogledov), ga všečkalo, ga dodalo med priljubljene, ga komentiralo ali delilo, čas, ko je bil naložen in število uporabnikov, ki spremljajo dotični kanal1.
Kaj si bo uporabnik ogledal po izbranem posnetku je odvisno tudi od tega, ali je videoposnetek element obsežnejše serije in ali je morda del seznama predvajanja (playlist). Če uporabnik, na primer, šele odkriva določenega glasbenega izvajalca, bo morda nadaljeval od najbolj priljubljene skladbe k manj znanim. Verjetno je tudi, da uporabniki ne bodo kliknil na videoposnetke, ki so opremljeni s sličicami (thumbnails) slabe kakovosti1,3. Vse te informacije so vključene v proces ustvarjanja modela.
Eden od bistvenih elementov sistema priporočil je prehod od enega videoposnetka na seznam sorodnih videoposnetkov. V tem kontekstu velja, da so sorodni videoposnetki tisti, ki si jih bo uporabnik verjetno naslednje ogledal3. Namen sistemov priporočanja je iz podatkov izluščiti kar največ in tako ustvarjati boljša priporočila4.
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010.
2 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020.
3 Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016.
4 Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021.