Uusi ChatGPT-4o-versio ällistyttää interaktiivisuudellaan ja puheen luonnollisuudellaan

OpenAI esitteli 13.5.2024 uusimman GPT-version, 4o:n, ominaisuuksia järjestämässään demotilaisuudessa. Erona aiempiin versioihin tästä versiosta erityisenä nousee esiin mahdollisuus keskustella tekoälyn kanssa suullisesti. Lisäksi mukana on muun muassa kehittyneitä kuva- ja video-ominaisuuksia ja lukuisia parannuksia ilmaiskäyttäjille sekä rajapintakäyttöön.

Esittelytilaisuuden perusteella tekoälyn puheen luontevuus on ällistyttävää – vastoin yleisiä monotonisilta kuulostavia robottimaisia puheteknologioita ChatGPT-4o:n puheessa on erilaisia intonaatioita ja sävyjä, mikä saa sen kuulostamaan hyvin luonnolliselta ja inhimilliseltä. Esittelyssä GPT-4o osaa jopa laulaa. Uutta versiota kuvataan myös nopeammaksi, lähes reaaliaikaiseksi, eikä siinä pitäisi olla muutaman sekunnin viivettä ennen vastausta.

Kuvakaappaus uuden ChatGPT.4o:n esittelytilaisuudesta YouTubessa.

Esittelytilaisuudessa kerrottiin, että GPT-4o:n käyttö API-rajapinnan kautta on 2 kertaa nopeampaa, 50 % halvempaa ja siinä on 5 kertaa korkeampi käyttörajoitus (rate limit) verrattuna GPT-4 Turboon.

GPT-4o tulee vaiheittain käyttöön esittelypäivästä lähtien. Uudet ominaisuudet tuodaan Plus-tilaajille seuraavien viikkojen aikana, minkä jälkeen julkaisua on tarkennus laajentaa, ja päivitetyn version pitäisi tulla ilmaiskäyttäjienkin saataville. Mukavana parannuksena ilmaiskäyttäjille saadaan lisäksi tulevaisuudessa kuvien ja tiedostojen analysointimahdollisuus, mikä on aikaisemmin ollut maksullinen ominaisuus.

GPT-4o:n multimodaalisuus tuli esittelyssä selkeästi esiin, kun esittelijät näyttivät tekoälylle lämpötiladiagrammia ja esittivät siihen liittyviä kysymyksiä suullisesti. Lämpötiladiagrammin visuaalinen esittäminen tarjosi tekoälylle kontekstin, mikä helpotti sen ymmärrystä keskustelun aiheesta. Samalla suullinen vuorovaikutus mahdollisti kysymysten esittämisen ja keskustelun jatkumisen.

Kuvakaappaus säätietoja sisältävästä diagrammista ChatGPT-4o:n esittelyvideolta.

Tekoäly osasi tulkita diagrammia hyvällä menestyksellä.

Uuden ChatGPT-version julkaisu avaa oven uudenlaiselle vuorovaikutukselle ihmisen ja koneen välillä. Mahdollisuus keskustella tekoälyn kanssa suullisesti palvelee tilanteita, joissa tietokoneet voivat tarjota reaaliaikaista apua ja tukea, kuten asiakaspalvelussa, koulutuksessa tai terveydenhuollossa. Suullinen tekoäly voi mullistaa kielten opiskelun tarjoamalla käytännön harjoitusta kielen puhumiseen. Se voi simuloida keskusteluja eri tilanteissa ja antaa välitöntä palautetta ääntämisestä ja kieliopista. Soveltamismahdollisuudet ovat rajattomat.

Nähtäväksi jää, kuinka hyvin tekoäly osaa puhua suomea. Odotukset ovat ainakin toistaiseksi korkealla, sillä demossa äänikeskustelu luonnistui englannin lisäksi italian kielellä. Kaiken kaikkiaan uusi ChatGPT-4o -versio näyttää olevan askel kohti entistä inhimillisempää ja interaktiivisempaa tekoälyä, joka voi muuttaa tapaamme kommunikoida tietokoneen kanssa ja hyödyntää teknologiaa päivittäisessä elämässä.

Edellinen
Edellinen

Mitä ovat vastuullisuusraportoinnin scope 1, 2 ja 3?

Seuraava
Seuraava

Mikä on vastuullisuusraportoinnin ESRS-standardi?