Additional Content
Strojno učenje in AI s podatkovnimi eksperimenti v jeziku Orange
Blaž Zupan
Ali so delfini sesalci in če so, zakaj? Katera vrsta živali je kivi? Ali sta Atene in Rim v istem vremenskem območju?
Kdo je naslikal znano sliko z kričečo damo? Ali ta umetnik vedno naslika nebo v oranžni barvi?
Ali avtorja objave na družbenih omrežjih ugibamo samo po stilu pisanja? Ima Luka Dončič po stilu igre klona v ligi NBA?
Ali je mogoče vrsto drevesa uganiti po njegovih listih? Ali s fotografije njegovega lubja?
Kako se države sveta razvrščajo glede na njihove družbenoekonomske značilnosti? Ali je svet res socialno-ekonomsko razdeljen na sever in jug?
Ali sta Rim in Atene v istem vremenskem območju? Glavno mesto katere države je glede na vremenske vzorce najbolj podobno Berlinu?
Znanost o podatkih, zlasti metode strojnega učenja, služijo kot katalizatorji sprememb na različnih področjih, kot so znanost, inženiring in tehnologija, ki pomembno vplivajo na naše vsakdanje življenje. Računalniške tehnike, s katerimi je mogoče presejati obsežne nize podatkov, identificirati zanimive vzorce in konstruirati napovedne modele, postajajo vseprisotne. Vendar ima le nekaj strokovnjakov temeljno razumevanje znanosti o podatkih, še manj jih je aktivno vključenih v izgradnjo modelov iz svojih podatkov. V dobi, ko AI tiho oblikuje naš svet, se morajo vsi zavedati njenih zmogljivosti, prednosti in potencialnih tveganj. Vzpostaviti moramo metode za učinkovito komuniciranje in poučevanje konceptov, povezanih s podatkovno znanostjo, širokemu občinstvu. Načela in tehnike strojnega učenja, znanosti o podatkih in umetne inteligence morajo postati splošno znana.
Na vsa vprašanja, zastavljena na začetku tega poglavja, lahko odgovorimo z opazovanjem ustreznih podatkov. Predlagamo pristop k usposabljanju strojnega učenja tako, da začnemo z vprašanjem, poiščemo ustrezne podatke in nato odgovorimo na vprašanje z iskanjem ustreznih podatkovnih vzorcev in modelov. V projektu Pumice razvijamo izobraževalne aktivnosti, s katerimi lahko obogatimo različne šolske predmete. Uporabljamo podatke, povezane s predmetom, in jih raziskujemo z uporabo AI in pristopov strojnega učenja. V sodelovanju z učitelji smo razvili učne predloge in razlage ozadja za učitelje in učence.
Aktivnosti in usposabljanje Pumice podpira Orange, program za strojno učenje, ki ima intuitiven vmesnik, interaktivne vizualizacije in vizualno programiranje. Ključ do enostavnosti, ki je potrebna pri usposabljanju, in vsestranskosti za pokrivanje večine osrednjih tem in prilagajanje različnim področjem uporabe je konstrukcija analitičnih cevovodov, podobna kockam Lego, in interaktivnost vseh komponent (glejte sliko 1). Za nadaljnjo podporo poučevanju in osredotočenost na koncepte namesto na osnovno mehaniko, Orange izvaja enostaven dostop do podatkov, ponovljivost s shranjevanjem potekov dela z vsemi različnimi nastavitvami in izbirami, ki temeljijo na uporabniku, ter enostavno prilagajanje z oblikovanjem novih komponent. Kritični vidik usposabljanja vključuje pripovedovanje zgodb s pregledovanjem potekov dela in specializiranimi funkcijami za eksperimentiranje, kot je risanje nizov eksperimentalnih podatkov ali učenje o prekomernem prilagajanju polinomske linearne regresije. Orange je na voljo kot odprtokodna programska oprema in jo dopolnjuje jedrnat videoposnetek za usposabljanje.
Na sliki 1 prikazujemo netipičen potek dela raziskovanja podatkov Orange. Potek dela je sestavljen iz komponent, ki nalagajo podatke, izračunavajo razdalje, vizualizirajo podatke ali nastale modele ali izvajajo katero koli nalogo, potrebno za iskanje in vizualizacijo vzorcev podatkov. V tem poteku dela smo uporabili socialno-ekonomske podatke svetovnih držav. Zgornja veja poteka dela preučuje dve lastnosti in kaže, da sta pričakovana življenjska doba in leta, preživeta v šoli, povezani. Prav tako kaže, da obstajajo države, kot sta Zelenortski otoki in Maroko, kjer ljudje živijo dolgo, vendar ne preživijo preveč časa v šoli. Otroci v šolah lahko oblikujejo takšne mreže, da bi raziskali, katere države so si socialno-ekonomsko podobne in kje lahko ugotovijo, da je svet socialno-ekonomsko razdeljen na sever, osrednji del in jug ter da obstaja velik razkorak med razvitimi in nerazvitimi. deli sveta. Tega jim ni treba izrecno povedati, – z rudarjenjem podatkov v podjetju Orange bodo to storili in se v višjih razredih sami potopili v te delitve.
Razvoj podjetja Orange se je začel leta 2003 in od takrat je postal vse bolj izrazit. Z več kot 50.000 različnimi mesečnimi uporabniki se je Orange uveljavil kot široko sprejeta specializirana programska aplikacija. Približno polovica njegovih uporabnikov prihaja iz akademske sfere. Predvsem je Orange doživel opazen porast v sprejemanju v izobraževalnem sektorju, saj ga je več kot 500 univerz po vsem svetu vključilo v svoje tečaje znanosti o podatkih.
Če ste pedagog, ki se radi poglobi v področje strojnega učenja in znanost o podatkih, je tukaj zbirka virov, ki nudijo uvod v te discipline s praktičnim raziskovanjem podatkov z uporabo programa Orange:
- Orange, spletno mesto orodjarne
- Uvod v znanost o podatkih je niz kratkih videoposnetkov, ki prikazujejo izbrane metode vizualizacije in strojnega učenja s programom Orange. Poiščite videoposnetke na http:/ youtube.com/orangedatamining in pojdite na seznam predvajanja “Uvod v znanost o podatkih”.
- Pumice je spletno mesto za učitelje, kjer zbiramo primere uporabe, ki jih lahko vključite v svoj program usposabljanja.