Data & Tietue
Data sitä, data tätä, Datakeskeinen, datavetoinen ja niin edelleen. Yksi nykyaikana kaikkialle levinnyt sana, jonka tarkka merkitys on täysin tapauskohtainen.
Data on yksinkertaisesti kasa faktoja, jotka on kerätty tiettyä käyttöä varten. Joskus nämä faktat voivat olla jopa tosia, mutta sille ei ole käytännössä mitään takeita. (Tämä on aihe tulevalle postaukselle.) Yleensä datassa olevat tietueet ovat muodoltaan identtisiä, eli kaikki ovat esimerkiksi saman kokoisia kuvia taikka sisältävät samat tiedot eri autoista.
Tieto
Tieto on paljon muutakin kuin mitä data, se on fysiikan lakeja, matemaattisia kaavoja, syy-seuraus -suhteita. Ihmiskunta on kerännyt uskomattoman määrän tietoa, jonka hyödyntäminen on vasta lastenkengissä tekoälyn suhteen.
Yksi suuri hankaluus tämän tiedon hyödyntämisessä on se, että se on hajautettuna joka puolelle ja harvoin koneen ymmärrettävässä muodossa. Monesti tekoälyn kehittäjiltä uupuu suuri määrä jopa kriitistä tietoa tekoälyn sovellusalasta, esimerkkinä COVIDia havaitsevat tekoälyt jotka eivät toimineetkaan. Harva tekoälyekspertti on röntgenekspertti ja toisinpäin. Tämä ongelma tulee esille myös monissa muissa tietotekniikkaprojekteissa, ei vain tekoälyprojekteissa. Jos tekijöillä ei ole tietoa siitä miten ohjelmistoa käytetään se ei toimi suoraan paketista.