OpenAI julkaisee GPT-5.5:n haastamaan Anthropicin Claude Opus 4.7

  • OpenAI julkaisi tänään GPT-5.5:n ja ilmoitti tunnuslukujen ylivoimasta Claude Opus 4.7:ään verrattuna.
  • Malli keskittyy agenttimaiseen koodaukseen, työkalujen käyttöön ja itsenäiseen tehtävien suorittamiseen.
  • API:n hinnoittelu alkaa 5,0000 dollarista miljoonaa syöte-tokenia kohti, mikä vastaa Anthropicin hintoja.

OpenAI julkaisi GPT-5.5:n 23. huhtikuuta, koodinimellä “Spud”. Malli on yhtiön tähän mennessä kyvykkäin järjestelmä itsenäiseen, monivaiheiseen työskentelyyn.

Julkaisu tapahtui viikko sen jälkeen, kun Anthropic toi markkinoille Claude Opus 4.7:n. Näin asetettiin suora vertailuasetelma näiden kahden huippumallin välille.

GPT-5.5 keskittyy agenttipohjaiseen työhön ja koodaukseen

GPT-5.5 on suunniteltu suunnittelemaan, toteuttamaan, tarkistamaan ja toistamaan työvaiheita eri työkalujen välillä ilman jatkuvaa ihmisen valvontaa. OpenAI kuvaa sitä “uudenlaisena älynä todellisen työn tekemiseen ja agenttien taustalla.”

Seuraa meitä X:ssä saadaksesi tuoreimmat uutiset reaaliajassa

“Uskomme vaiheittaiseen käyttöönottoon; vaikka GPT-5.5 on jo älykäs malli, odotamme nopeaa kehitystä. Iteratiivinen käyttöönottotapa on oleellinen osa turvallisuusstrategiaamme; mielestämme maailma on parhaiten valmis luomaan resilienssiä tekoälyssä tällä tavalla,” kirjoitti Sam Altman viestissään.

Malli on nyt saatavilla ChatGPT Plus-, Pro-, Business- ja Enterprise-käyttäjille. Lisäksi tarjolla on tehokkaampi Pro-versio. API:n hinnoittelu alkaa 5 dollarista per miljoona syötetokenea ja 30 dollarista per miljoona tulostetokenea, ja kontekstin pituus on miljoona tokenia.

OpenAI:n omat vertailutestit osoittavat, että GPT-5.5 on edellä Claude Opus 4.7:ää useissa agenttiin liittyvissä tehtävissä. Se saavutti Terminal-Bench 2.0:ssa 82,7 %, kun Opus 4.7 sai 69,4 %.

FrontierMath Tasoilla 1-3 tulos oli 51,7 %, kun taas Opus 4.7 sai 43,8 %. Alkuvaiheen riippumattomat testit tuottivat samanlaisia tuloksia sekä koodaus- että tietotyöarvioinneissa.

Missä Claude Opus 4.7 on edelleen vahvempi

Anthropicin mallilla on etuja tutkimuskirjoittamisessa, oikeudellisessa ja taloudellisessa päättelyssä sekä ohjeiden noudattamisen johdonmukaisuudessa riippumattomien arvioiden mukaan.

Opus 4.7 tukee myös korkeampaa resoluutiota, jopa 3,75 megapikseliä, mikä on yli kolme kertaa enemmän kuin edellisessä versiossa.

Tietokoneen käytössä erot kaventuvat. GPT-5.5 sai OSWorld-Verified-testissä 78,7 %, kun taas Opus 4.7 sai 78,0 %.

Mallit ovat eri tasolla myös verkkoselailun testeissä, ja GPT-5.5 Pro nousi kärkeen 90,1 %:lla verrattuna 79,3 %:iin.

Tekoälykilpailu kiihtyy vuonna 2026

Perättäiset julkaisut heijastavat laajempaa ilmiötä. OpenAI on tuonut useita GPT-5.x-versioita tänä vuonna, kun taas Anthropic on päivittänyt Claude-malliaan tasaisesti uusilla julkaisuilla.

Myös Googlen Gemini 3.1 Pro kilpailee samasta yritysasiakaskunnasta.

Kehittäjien keskuudessa valinta saattaa riippua käyttötarkoituksesta. GPT-5.5 vaikuttaa vahvemmalta automaattiseen agenttityöhön ja pitkäjänteisten ohjelmakoodien luontiin.

Claude Opus 4.7 voi taas sopia paremmin tarkkuutta vaativiin analyyttisiin prosesseihin. Riippumattomien testien tulokset ja niiden vahvistamat OpenAI:n julkaistut luvut selviävät tulevien päivien aikana.

Tilaa YouTube-kanavamme ja katso johtajien sekä toimittajien asiantuntijanäkemykset


Lue tuorein kryptomarkkina-analyysi BeInCrypto, klikkaa tästä.

Vastuuvapauslauseke

Kaikki verkkosivustollamme olevat tiedot julkaistaan vilpittömässä mielessä ja ainoastaan yleiseen tiedottamiseen. Lukijan on toimittava verkkosivustomme tietojen perusteella täysin omalla vastuullaan.