Friday, February 3, 2023

Chat GPT dominoi uutisia

Tammikuun YLE:n uutisointi tekoälystä keskittyi liki täysin Chat GPT:n käsittelyyn. Kuusi yhdeksästä tekoälyä käsittelevästä uutisesta vähintäänkin sivusi Chat GPT:tä.

Chat GPT - mikä se on? Kala? Lintu? Teräsmies?

Tilastollinen papukaija

Kaikki kielelliset tekoälyt ovat pohjimmiltaan papukaijoja, toistaen mitä ne ovat oppineet. Koska tämä toistaminen pohjautuu tilastollisiin yhteyksiin sanojen välillä, niin sen papukaijamaisuuden havaitseminen on hankalaa.
Kaikki tekoälyt pohjaavat tilastotieteisiin ja niille syötetyn datan tilastollisiin ominaisuuksiin (enemmän tai vähemmän). Tekoäly hakee datasta yhteyksiä: tämä esiintyy yleensä tuon kanssa ja joskus myös noiden kanssa jos mukana on tietty. Kun tekoälyn sitten käsketään tuottaa jotain missä esiintyy sanat Artturi ja Ilmari niin se tuottaa tekstiä A.I. Virtasesta ja maataloudesta, jos taasen Ilmarin sijasta on sana pöytä niin se tuottaa jotain ritareista.
Mitä suuremman määrän aineistoa tekoälylle annetaan opittavaksi, sitä enemmän sillä on vaihtoehtoja omaan tuotantoonsa ja sitä hankalampaa on huomata kyseessä olevan tekoäly. Suurimpia hankaluuksia tekoälylle tuottaa erikoisasiantuntemus, jossa se helposti sortuu tuottamaan kasan jargonia, ilman syvempää merkitystä. Itse epäilen hankalimman aiheet olevan kvanttimekaniikka, sillä netti on jo täynnä kvanttimekaniikan terminologiaa käyttävää new age -humpuukia.

Tekoälyn koulutus

Yhdessä uutisessa kerrottiin kuinka kenialaiset työntekijät joutuivat olemattomalla palkalla lukemaan netin syövereistä hyvin häiritseviä tekstejä. Tätä tarvittiin jotta Chat GPT ei alkaisi toistamaan juurikin epäillyttävää materiaalia. Uutisen mukaan tätä materiaalia käytettiin toisen tekoälyn koulutukseen, tämä toinen tekoäly sitten yritti havaita samankaltaista tekstiä muun materiaalin joukosta.
Uutisesta ei käy ilmi miten tätä sitten käytettiin Chat GPT:n koulutuksessa. Itse tiedän kaksi vaihtoehtoista tekniikkaa. Ensimmäinen vaihtoehto on materiaalin karsinta, jos se havaitsee kyseenalaista materiaalia koulutusmateriaalista, niin se poistetaan ennenkuin materiaali annetaan Chat GPT:lle. Toinen vaihtoehto on että sitä käytetään Chat GPT:n "rankaisemiseen" jos se tuottaa kyseenalaista materiaalia. Yksi tekoälyn koulutustavoista perustuu "palkintoihin" ja "rangaistuksiin", tekoäly pyrkii maksimoimaan saamansa pisteet ja muuttaa toimintaansa sen perusteella mistä se saa pisteitä tai mistä vähennetään pisteitä.

No comments:

Post a Comment

John Oliver puhui täyttä asiaa.

 Jos englanti sujuu, niin tässä on helmikuun 2023 lopulta Last Week Tonight with John Oliver käsittelemässä tekoälyä. En huomannut mitään ky...