Big Data – tietoisku Omnia AI Labissa

Espoon työväenopisto toteuttaa kevätkaudella luentosarjan, joka esittelee digitalisaation myötä tulleita uusia asioita tietoiskuina.

Ensimmäinen tietoisku Mitä on tekoäly toteutettiin tammikuussa. Helmikuussa vuorossa oli luento Mihin Big Dataa hyödynnetään yhteiskunnassamme?

Maaliskuussa kuullaan aiheesta Robotit tulevat!, huhtikuussa aiheena on Koneoppiminen – tulevaisuuden optimointia? ja toukokuussa kuullaan asioiden internetistä, Internet of Things.

Tietoiskut voi kuunnella myös etäyhteyden kautta. Luento striimataan etukäteen ilmoittautuneille.

Kaikkiin tietoiskuihin on vapaa pääsy. Tietoiskut järjestetään Omnia AI Labissa Otaniemessä osoitteessa Sähkömiehentie 4 G.

Mikä Big Data?

Luennoitsija Juha Vuorinen esitteli tietoiskussa Mihin Big Dataa hyödynnetään yhteiskunnassamme? aiheen taustaa ja kertoi, että termiä Big Data käyttivät ensimmäistä kertaa NASAn tutkijat Michael Cox ja David Ellsworth vuonna 1997 tieteellisessä artikkelissaan.

Datan kasvusta oli tulossa haaste nykyisille tietokonejärjestelmille, koska tietomäärät ovat niin suuria. Puhuttiin Big Datan aiheuttamasta ongelmasta. Vuonna 2008 ilmiön ymmärrys kasvoi entisestään ja puhuttiin datan havainnoinnista, keräämisestä, varastoinnista ja analysoinnista. Kymmenen vuotta sitten internetin käyttö räjähti muun muassa verkkokaupan ja hakukoneiden myötä, ja Big Datan laaja-alainen merkitys yhteiskunnille alettiin ymmärtää paremmin.

Big Data tarkoittaa dataa, jota kerätään pääasiassa internetin liikenteestä ja tallennetaan tietovarastoihin. Perinteiset tietojenkäsittelymenetelmät eivät enää riitä käsittelemään datan jatkuvasti kasvavaa määrää. Big Data voidaan myös määritellä neljän v:n kautta: volume (datan määrä), velocity (nopeus, jolla uutta dataa syntyy) ja variety (datan rakenteiden monimuotoisuus). Myös neljäs v on määritelty: veracity, jolla tarkoitetaan datan sisällön merkityksen epävarmuutta.

Algoritmit Big Datan päällä

Kehittyneet algoritmit lukevat dataa ja löytävät siitä hyödyllisiä ja uusia merkityksiä. Algoritmit automatisoivat tietomassojen käsittelyä. Yhtenä sovelluksena voidaan mainita potentiaalisten lääkkeiden löytäminen Parkinsonin tautiin älykkäiden tekstianalyysipohjaisten algoritmien avulla.

Big Data ja 2010-luku

Tietokoneiden muistin ja tehojen kehitys, tietokantaratkaisujen kehitys, internet-verkon, -liikenteen ja -palveluiden kasvu ja kehitys on ollut räjähdysmäisen nopeaa viimeisten 10 vuoden aikana. Avoimen lähdekoodin kehitys mahdollistaa edulliset konesaliratkaisut. Erään asiantuntijan mukaan tiedon tuotanto kasvaa vuoteen 2020 mennessä vuosittain 4300 prosenttia!

Juha Vuorinen pitää syventävän luennon aiheesta Leppävaarassa 1.3. –22.3. 2018 kurssilla Big Data, kurssinumero E180473. Kurssilla käsitellään Big Data -ilmiötä laaja-alaisesti.

Kurssilla opitaan Big Datan keskeiset käsitteet, teknologiset ratkaisut, yhteiskunnalliset vaikutukset sekä käsitellään Big Datan tulevaisuutta. Kurssilla tutustutaan myös R-kieleen, jolla Big Datan kanssa usein työskennellään.

Kurssilla on muutama paikka vielä vapaana. Tervetuloa!

Omnia AI Lab käynnistyi lokakuussa 2017 ja on matalan kynnyksen oppimispaikka, jossa voi päivittää digiosaamistaan. Ensimmäisessä pilottivaiheessa voi kuulla alan asiantuntijoiden puheenvuoroja, harjoitella virtuaalineuvottelujen pitämistä ja kuulla erilaisia tietoiskuja.

Teksti: Kristiina Santala