Miten OpenAI:n uusin o3-kielimalli eroaa aiemmista kielimalleista?

16. tammik.

OpenAI:n uusin o3-kielimalli on herättänyt kiinnostusta teknologia-alalla. Yritys esitteli tuoreimman kielimallinsa joulukuussa 2024, ja turvallisuus- ja tietoturvatutkijat ovat jo päässeet käyttämään malleja ennakkoon alkuvuodesta 2025. Kielimallista on olemassa kaksi versiota: o3 ja o3-mini. OpenAI suunnittelee julkaisevansa o3-minin yleiseen käyttöön tammikuussa 2025. O3-mini sisältää kolme laskentatasoa (matala, keskitaso ja korkea). OpenAI ei ole vielä ilmoittanut kielimallin hintaa.

(Huom. OpenAI nimesi o1-kielimallia seuraavan kielimallin o3:ksi välttääkseen tavaramerkkikiistat O2-nimisen matkapuhelinoperaattorin kanssa.)

Erot aiempiin kielimalleihin

GPT-3 ja GPT-4-mallit keskittyvät pääasiassa tuottamaan ihmismäistä tekstiä, mutta ne eivät sisällä samanlaista syvällistä järkeilykykyä, kuten o1 ja o3. Vanhemmat GPT-mallit generoivat vastauksia pääasiassa harjoitteludatan tunnistamien mallien pohjalta, kun taas o1 ja o3 käyttävät itsereflektoivaa ja järjestelmällistä järkeilyprosessia päästäkseen lopputulokseen. Uusi o3-kielimalli on jatkokehitystä aiemmasta o1-mallista, joka julkaistiin vuonna 2024.

O3-malli on merkittävä askel kohti tekoälyn yleistä älykkyyttä (AGI). Se ei ole vielä AGI, mutta lähestyy sitä tietyissä olosuhteissa.

Parannettu matemaattinen osaaminen

Yksi merkittävimmistä o3:n uudistuksista on sen huomattavasti parantunut kyky ratkaista matemaattisia tehtäviä. Aiempien GPT-mallien heikkous oli monimutkaisten matemaattisten ongelmien ja loogisen päättelyn hallinta, mutta o3 pystyy suorittamaan vaiheittaisia laskelmia ja päättelyketjuja tarkemmin. Tämä tekee siitä erityisen hyödyllisen esimerkiksi teknisten asiantuntijoiden ja ohjelmistokehittäjien työssä, joissa tarvitaan monimutkaista analyysiä ja algoritmista suunnittelua.

Looginen päättely ja ”yksityinen ajatteluketju”

Toinen keskeinen uudistus o3:ssa on sen kyky ”ajatella” ennen vastausten antamista. Malli käyttää vahvistusoppimiseen perustuvaa ”yksityistä ajatteluketjua”, jossa se suunnittelee ja suorittaa väliaskelia ongelman ratkaisemiseksi ennen lopullisen vastauksen muodostamista. Tämä parantaa mallin suorituskykyä erityisesti monimutkaisissa ongelmissa, kuten ohjelmistokehityksessä ja tieteellisessä tutkimuksessa.

Tällainen vaiheittainen päättely ei ollut aiempien mallien vahvuus, mutta o3 onnistuu yhdistämään nopeuden ja tarkkuuden vaikuttavalla tavalla. Vaikka tämä lisää jonkin verran laskennallista viivettä, tulokset ovat huomattavasti tarkempia.

Suorituskyky eri vertailutesteissä

OpenAI o3 on saavuttanut erinomaisia tuloksia useissa vertailutesteissä, jotka mittaavat tekoälyn kykyä ratkaista ongelmia:

SWE-bench Verified: Ohjelmistokehitykseen keskittyvä vertailutesti, jossa o3 saavutti 71,7 %:n tuloksen verrattuna o1:n 48,9 %:iin.
Codeforces Elo-luokitus: o3 sai kilpailuohjelmoinnissa vaikuttavan 2727 Elo-luokituksen, kun taas o1:n tulos oli 1891.
ARC-AGI: Loogisten ongelmien ja taitojen hankintaa arvioiva testi, jossa o3 saavutti kolminkertaisen tarkkuuden o1:een verrattuna.

Vaikutukset IT-alaan

Uusi kielimalli on herättänyt muun muassa tietojenkäsittelyn opiskelijoiden keskuudessa ahdistusta ja pelkoa siitä, että tekoäly tulee syrjäyttämään heidät työmarkkinoilla. OpenAI:n toimitusjohtaja Sam Altman kirjoitti syyskuussa, että "monet työt, joita teemme nykyään, olisivat näyttäneet ihmisten silmissä vähäpätöiseltä ajanhaaskaukselta muutama sata vuotta sitten, mutta kukaan ei katso taaksepäin menneisyyteen toivoen olevansa lampunsytyttäjä".

Bill Gatesin mukaan kolme alaa tulee välttymään tekoälyn vaikutuksilta: energia-ala, biologiaan liittyvät alat sekä tekoälykehitys. Nämä kaikki alat tulevat hyötymään tekoälystä, mutta se ei korvaa ihmisten asiantuntemusta ja luovuutta, joita tarvitaan ratkaisemaan monimutkaisia haasteita.

OpenAI o3:n ominaisuudet voivat mullistaa tapaa, jolla ohjelmistokehitystä ja muuta teknistä työtä tehdään. Sen kyky ratkaista monimutkaisia ongelmia nopeasti ja tarkasti tarkoittaa, että kehittäjät voivat keskittyä korkeamman tason suunnitteluun ja innovointiin rutiinitehtävien sijaan.

Vaikka malli vaatii enemmän laskentatehoa ja sen käyttö voi olla kallista, sen tarjoama tehokkuus ja tarkkuus voivat pitkällä aikavälillä tuottaa merkittävää lisäarvoa yrityksille.

Lähteet

https://www.axios.com/2025/01/07/openai-o3-college-students-computer-science

https://www.marca.com/en/technology/2024/04/11/661826d5ca474130118b4579.html

https://en.wikipedia.org/wiki/OpenAI_o3

tekoälyAiartificial intelligenceOpenAIgeneratiivinen tekoälyChatGPTChatGPT4ChatGPT3.5o3o1kielimalliLLM

Mari Hynninen

Miten OpenAI:n uusin o3-kielimalli eroaa aiemmista kielimalleista?

Millainen tekoäly on ChatGPT:n haastaja DeepSeek?

Mitä ovat tekoälyagentit?