S podatki do poslovnih inovacij

Forum podatkovne analitike, 20. aprila 2023 v Ljubljani, je bil osrednji dogodek leta, na katerem smo povezali vse poklice s področja podatkovne analitike. V ospredju je bilo šest glavnih področij znanj: podatkovna arhitektura, podatkovni inženiring, analiza podatkov, vizualizacija podatkov, podatkovna znanost in podatkovni management.

Vsebinsko smo se osredotočili na razvoj inovativnih in naprednih rešitev na podlagi inteligentne uporabe podatkov s katerimi želimo reševati poslovno izzive in izzive za skupno dobro. Naslovili smo dva krovna elementa za uspešno realizirane podatkovne inovacije:

  • Realne, pogumne in napredne ideje.
  • Moderno podatkovno platformo z zbranimi, kategoriziranimi in prečiščenimi podatki.

Letošnji program je s povezanimi vsebinami prikazal vse korake, ki so potrebni za uspešen projekt izrabe podatkov. Predstavili smo trike za povezovanje poslovnega in inženirskega sveta, znotraj področja umetne inteligence smo pogledali, kako pravilno okarakterizirati problem in se ga lotiti s pravo metodo, prikazali smo primere implementacije podatkovne platforme za masovne podatke, dotaknili smo se področja MLOps in prikazali pomen urejenih osnovnih podatkov, nismo pa pozabili niti na  odprte podatke (OPSI), pokazali smo tudi pomen podatkovnega kataloga (semantične interoperabilnosti).

Tudi letos je bil naš glavni namen, da povežemo različne vsebine, aktivnosti, procese s področja celovitega upravljanja s podatki. Vsebine smo strokovno komentirali in jih povezali z glavnim ciljem, da so udeleženci bolje razumeli celoten podatkovni ekosistem, hkrati zase našli konkretno vsebino.

Program

8.00  Sprejem in registracija

9.00  Otvoritev, Peter Ribarič, Direktor, Planet GV, d.o.o. , Jure Jeraj, Programski direktor

9.10  Pogled na podatke s strani inovatorja, Marin Vladović, Soustanovitelj in direktor, AutoBrief.io

9:40  Načrtovanje podatkovnih cevovodov v kontekstu vzpostavitve podatkovnega prostora, dr. Martina Šestak, Asistentka na Fakulteti za elektrotehniko, računalništvo in informatiko, UM

10.10  Različne definicije umetne inteligence, dr. Stevanče Nikoloski, Podatkovni znanstvenik, Result, d.o.o.

10.30  Hekaton #1: OPSI sprint  – Praktični primer podatkovnega projekta

10.40  Odmor

11.10  MLOps – ključ za uspešno uvajanje modelov strojnega učenja v produkcijo, dr. Boštjan Kaluža, Podatkovni znanstvenik, Evolven Software

11.35  Pasti vpeljave podatkovne znanosti v poslovanje, dr. Martin Možina, Vodilni podatkovni znanstvenik, Mercator, d.d.

12.00  Platforma za semantično interoperabilnost, dr. Karmen Kern Pipan in Miha Jesenko, soavtor: mag. Igor Tričkovič Rifelj, Ministrstvo za digitalno preobrazbo, Direktorat za digitalne rešitve in podatkovno ekonomijo

12.15  Hekaton #2: OPSI sprint  – Praktični primer podatkovnega projekta

12.25  Kosilo

13.15  Leto kasneje …, dr. Jure Bordon, Direktor analitike, Fundacija Login5

13.30  Triki za izboljšanje modelov , dr. Miha Mlakar, Soustanovitelj, ParetoAI

13.55  Izzivi upravljanja z masovnimi podatki, Leon Maruša, Vodja službe za napredno analitiko podatkov, Elektro Celje

14.20  Hekaton #3: OPSI sprint  – Praktični primer podatkovnega projekta

14.30  Odmor

15.00  Poslovni model s podatkovnimi inovacijami, Franci Zidar, Soustanovitelj in direktor, Bird Buddy

15.25  Pogovor: Širši pogled na podatke, Maria Anselmi, Group Director Data, Bisnode, Dun&Bradstreet, pogovor vodi Peter Ribarič.

15.50  Vroči stol: Pogovor ob kaminu – Kako do podatkovnega produkta?

16.10  Data networking  – Druženje

17.40  Zaključek

Predavanja

Pogled na podatke s strani inovatorja

Marin Vladović, Soustanovitelj in direktor, AutoBrief.io

Podatki so strateški resurs za poslovno inoviranje, s pomočjo katerih poskušamo ustvariti konkurenčno prednost. Podatkovna analitika nam omogoča pridobivanje vpogledov iz poslovanja in odločanje na podlagi podatkov. Zato je vlaganje v upravljanje podatkov in podatkovno infrastrukturo predpogoj za inoviranje na podlagi podatkov.

Načrtovanje podatkovnih cevovodov v kontekstu vzpostavitve podatkovnega prostora

dr. Martina Šestak, Asistentka na Fakulteti za elektrotehniko, računalništvo in informatiko, UM

Zanesljivo deljenje podatkov danes postaja vedno bolj zanimiva tema za eksperte, še posebej z vpeljavo koncepta podatkovnega prostora, ki predstavlja infrastrukturo za zagotavljanje le-tega. Za vzpostavitev podatkovnih prostorov je najprej potrebno poskrbiti za implementacijo učinkovitih podatkovnih cevodov, ki bodo na ustrezen način združili podatke iz več virov. Za pravilno načrtovanje in implementacijo podatkovnih cevovodov se v praksi uporabljajo različni vzorci in arhitekture, ki so sestavljene iz več tehnoloških rešitev na posameznem nivoju arhitekture. V predavanju bodo predstavljeni vzorci načrtovanja cevovodov ter nabor rešitev za njihovo implementacijo na splošno in  v kontekstu vzpostavitve podatkovnega prostora za agroživilski sektor.

Različne definicije umetne inteligence

dr. Stevanče Nikoloski, Podatkovni znanstvenik, Result, d.o.o.

Umetna inteligenca je že nekaj časa del našega vsakdanjika. Večina od nas se zaveda, da obstaja in da nam bo lahko olajšala in izboljšanje poslovanje ali celo samo življenje. Se pa dostikrat zatakne že pri samem vprašanju, kaj točno pa je umetna inteligenca? In kaj ni? Kaj pa strojno učenje – zakaj se dostikrat pojavlja kratica AI/ML? Kje je sploh meja med umetno inteligenco in zgolj algoritmi za napredno izrabo podatkov? Slabo razumevanje osnovnih razmejitev lahko tudi bistveno vpliva na vpeljavo metod umetne inteligence v samo poslovanje. S predavanjem želimo pokazati katere vse inteligentne možnosti uporabe podatkov in pokazati povezave med njimi ter tipične primere uporabe za te metode.

Hekaton #1-#3: OPSI sprint

Praktični primer podatkovnega projekta

Praktični primer podatkovnega projekta Podatkovni projekt sestoji iz zaporedja korakov, ki vodijo k uspešnim rezultatom. Prvi korak je opredelitev problema oziroma cilja. Nato moramo podatke zbrati in jih prečistiti, s čimer zagotovimo njihovo primernost. Raziskovanje in vizualizacija podatkov nam omogoča vpogled, ki nam pomaga pri gradnji prediktivnih modelov. Modele je potrebno analizirati in jih predstaviti vsem deležnikom, na katere bo uporaba modela vplivala. Implementacija rešitve in spremljanje njene uspešnosti je ključno za izpolnitev projektnih ciljev. Zadnji korak je izboljševanje rešitve na podlagi povratnih informacij in dopolnjevanja modela. Na tak način nam podatki omogočijo vpogled, izboljšujejo odločanje in omogočajo inovacije.

MLOps – ključ za uspešno uvajanje modelov strojnega učenja v produkcijo

dr. Boštjan Kaluža, Podatkovni znanstvenik, Evolven Software

Vse več podjetjih vključuje strojno učenje kot eno pomembnih komponent poslovanja. Na prvi pogled se precej prekriva z razvojem programske opreme, a vendar ima specifične zahteva in organizacijo dela. Učinkovit razvoj in uvajanje modelov strojnega učenja zahteva kompetence, ki jih pogosteje najdemo na različnih področjih kot so matematično modeliranje, programiranje in DevOps. To predavanje predstavi področje MLOps (Machine Learning Operations), ki obravnava kako načrtovati, zgraditi in vzdrževati projekt strojnega učenja. V nasprotju s standardnim ciklom strojnega učenja se morajo modeli strojnega učenja v produkcijskih integrirati z drugimi storitvami ali aplikacijami, delovati morajo neprekinjeno z največjo zmogljivostjo in minimalnimi stroški ter imeti sposobnost obvladovanja spreminjajočih se podatkov in poslovnih zahtev. V tem predavanju smo se seznanili z metodologijo, dobrimi praksami in nekaterimi orodji za učinkovito vpeljavo strojnega učenja v produkcijska okolja.

Pasti vpeljave podatkovne znanosti v poslovanje

dr. Martin Možina, Vodilni podatkovni znanstvenik, Mercator, d.d.

Pogosto se pri vpeljavi podatkovne znanosti v poslovanje ujamemo v past preozkega fokusa na metrike in algoritme in posledično zanemarimo človeško presojo in intuicijo. Stalno moramo imeti pred očmi, da so podatkovni modeli lahko le tako dobri kot podatki, na katerih smo jih učili. Ob slabi kakovosti in nepopolni množici učnih podatkov bo tudi model dajal napačne in diskriminatorne rezultate. Spoštovanje področja zasebnosti in varstva osebnih podatkov je nenazadnje tudi izredno pomembno, če se želimo izogniti izgubi zaupanja vseh deleženikov in znižanju ugleda podjetja. Pri vpeljavi podatkovne znanosti v poslovanje moramo zato preučiti vse možne pasti in k vpeljavi pristopiti celovito, z uporabo zdrave človeške presoje in s spoštovanjem podatkovne etike.

Platforma za semantično interoperabilnost

dr. Karmen Kern Pipan in Miha Jesenko, soavtor: mag. Igor Tričkovič Rifelj, Ministrstvo za digitalno preobrazbo, Direktorat za digitalne rešitve in podatkovno ekonomijo

Okolja, v katerih nastajajo in se izmenjujejo podatki, so lahko kompleksna ter vključuje številne ovire. Mednje spadajo tudi ovire na področju semantične interoperabilnosti. Ta predstavlja zmožnost različnih sistemov za izmenjavo podatkov z enotnim in nedvoumnim pomenom. Platforma za semantično interoperabilnost (PSI) je temeljno orodje za doseganja semantične interoperabilnosti v javni upravi. Sestavljajo jo med seboj povezani moduli centralni besednjak, register šifrantov in repozitorij podatkovnih modelov. S PSI zagotavljamo enotni repozitorij definicij temeljnih pojmov, doseganje višje stopnje standardizacije in interoperabilnosti na podatkovnem sloju, standardizacijo metapodatkov ter opredelitev razmerij med registri in evidencami javne uprave. Slednje omogoča lažjo preglednost, najdljivost in bolj učinkovito povezovanje podatkov ter posledično učinkovitejše zagotavljanje čezmejnih in medresorskih storitev, učinkovitejšo uporabo informacijskih virov, doslednost pri izkazovanju ter razumevanju podatkov in učinkovitejšo strojno berljivost podatkov. Z zagotavljanjem centraliziranih informacij o virih, izvoru in uporabi podatkov se izboljšuje tudi njihova kakovost in zanesljivost, s čimer se vzpostavlja tudi temelj celovitejšim in vsebinsko polnejšim podatkovnim analizam.

Leto kasneje …

dr. Jure Bordon, Direktor analitike, Fundacija Login5

Dr. Jure Bordon in Samo Login sta lani predstavila Fundacijo Login5 in njihov projekt Login Eko. Glavna vizija projekta je na podlagi podatkovne znanosti razviti nove trajnostne kmetijske prakse, ki jih bo možno izvajati v največjem obsegu. Dr. Jure Bordon bo na letošnjem Forumu predstavil napredek v enem letu ter z nami delil nove izkušnje pri vpeljevanju podatkovne znanosti v povsem nova področja kot je npr. kmetijstvo.

Triki za izboljšanje modelov

dr. Miha Mlakar, Soustanovitelj, ParetoAI

V čem se izkušeni podatkovni znanstveniki najbolj razlikujejo od manj izkušenih? To bo rdeča nit predavanja, kjer bo Dr. Miha Mlakar na podlagi svojih izkušenj predstavil izhodišča in nekaj trikov za izboljšanje napovednega modela. Pri tem pa bo upoštevan celoten krog upravljanja s podatki, saj lahko prav vsak element vpliva na izboljšanje. Zelo pomemben faktor so vhodni podatki in njihova kvaliteta. Zato se podatkovni znanstvenik ne ukvarja le z napovednimi modeli ali njihovimi treniranjem, temveč je zelo pomemben dejavnik določitev, iskanje in prečiščevanje ustreznih vhodnih podatkov, kjer pride do izraza tudi zmožnost komuniciranja tako s poslovnimi uporabniki kot podatkovnimi inženirji.

Izzivi upravljanja z masovnimi podatki

Leon Maruša, Vodja službe za napredno analitiko podatkov, Elektro Celje

Elektrodistribucijska podjetja se srečujejo z masovno količino podatkov. Vse večja uporaba pametnih števcev, naprednih sistemov vodenja omrežja in drugih virov podatkov narekuje uporabo Big Data tehnologij za pridobivanje dodane vrednosti iz zbranih podatkov. Elektro Celje bo predstavilo njihovo Big Data rešitev imenovano LAMBDA, ki jim omogoča podatkovne integracije, masovne obdelave, izvajanje analitike in prikaz BI vizualizacij. Poleg procesa vpeljave uporabljenih tehnologij bo predstavljen tudi pogled na netehnične izzive, ki so se pojavili pri implementaciji, konkretno dvig digitalne kulture zaposlenih, zavedanje pomembnosti o kakovosti podatkov in še mnogo več.

Poslovni model s podatkovnimi inovacijami

Franci Zidar, Soustanovitelj in direktor, Bird Buddy

Predstavili smo primer inovacije tradicionalnega izdelka – ptičje krmilnice – z uporabo tehnologije in podatkov. Pametna omrežena ptičja krmilnica ima namreč kamero za zajemanje “ptičjih selfijev”, ki jih ljubitelji ptic lahko zbirajo in si jih tudi izmenjujejo. S tem niso ustvarili samo inovativne uporabniške izkušnje, temveč so tudi prispevali k prizadevanjem za ohranjanje ptic.

Pogovor: Širši pogled na podatke

Maria Anselmi, Group Director Data v skupini Bisnode, Dun&Bradstreet, Pogovor vodi Peter Ribarič.

Podatki so vedno pomembnejši pri oblikovanje in implementaciji poslovne strategije. Z izkoriščanjem podatkov pridobijo organizacije dragocen vpogled v vedenje strank, tržne trende in notranje procese, kar omogoča bolje informirano in na podatkih osnovano odločanje. Pomena podatkov v poslovanju ni mogoče preceniti. Organizacije, ki prednostno vlagajo v podatke in podatkovno analitko, imajo bistveno večje možnosti za uspeh v sedanjem hitro spreminjajočem se poslovnem okolju.

Vroči stol: Pogovor ob kaminu – Kako do podatkovnega produkta?

Jure Jeraj, programski direktor Foruma in Jure Bordon, direktor analitike v Fundaciji Login5Jure Jeraj in Jure Bordon bosta soočila izkušnje in skupaj revidirala razvoj podatkovnega produkta na primeru Login Eko, na podatkih temelječega industrijskega ekokmetijstva.  Njuno vodilo v pogovoru bo kanvas za razvoj podatkovnega produkta (link: https://medium.com/@leandroscarvalho/data-product-canvas-a-practical-framework-for-building-high-performance-data-products-7a1717f79f0). Namen njunega pogovora je predstavitev priporočil in izkušenj pri razvoju produkta, ki temelji na podatkih.

Zaključek

Iz pozitivinih odzivov vseh prisotnih udeležencev, govorcev in partnerjev smo zaključili, da smo bili na Forumu zelo uspešni in koristni za vse prisotne. Zato z veseljem napovedujemo, da se bomo ponovno srečali 25. aprila 2024. Nadaljevali bomo z razvojem sedanjega formata Foruma, in se še naprej osredotočali na upravljanje podatkov, podatkovno inženirstvo in znanost, da še poglobimo in razširimo naša znanja na teh ključnih področjih.