Kiinan jälkeen OpenAI haastaa Nvidiaa: miksi NVDA-osake on nousussa?

  • OpenAI laski inferenssikustannuksiaan ja Nvidia-sirujen käyttöä, mutta Nvidia-osake nousi silti
  • Ohjelmiston optimoinnit ja räätälöity Broadcom-siru vauhdittavat OpenAI:n kustannussäästöjä
  • Nvidia hallitsee yhä tekoälykoulutusta ja sen datakeskusmyynti kasvoi 75 prosenttia viime neljänneksellä

Kiina rakensi juuri suuren tekoälymallin ilman Nvidia-siruja. Nyt OpenAI on löytänyt tapoja käyttää huomattavasti vähemmän näitä siruja, alentamalla inference-kustannuksia yli puoleen. Tästä huolimatta Nvidia-osake nousi.

Tässä on pulma. OpenAI on yksi Nvidian (NVDA) suurimmista asiakkaista. Osake nousi silti, vaikka OpenAI tarvitsee vähemmän siruja.

Nvidia (NVDA) osakkeen kehitys. Lähde: Google Finance
Nvidia (NVDA) osakkeen kehitys. Lähde: Google Finance

OpenAI leikkaa inference-kustannuksia kahdella osa-alueella

Ensimmäinen osa-alue liittyy ohjelmistoon. The Information raportoi, että OpenAI:n insinöörit onnistuivat vähentämään inference-kustannuksia yli puolella uusien optimointimenetelmien avulla. OpenAI ei ole julkaissut teknisiä yksityiskohtia.

Säästö pienentää Nvidia-sirujen tarvetta ChatGPT-liikenteen käsittelyssä. Tämä voi mahdollistaa myös hintojen laskemisen tai käyttörajojen nostamisen OpenAI:n taholta.

Toinen osa-alue on laitteistot. 24. kesäkuuta OpenAI ja Broadcom (AVGO) esittelivät Jalapeñon, heidän ensimmäisen räätälöidyn sirunsa. OpenAI kertoi, että varhaisten testien mukaan suorituskyky verrattuna tehoon voi olla huomattavasti parempi kuin nykyisillä huippusiruilla, ja sirun suunnittelu kesti vain yhdeksän kuukautta.

Ensimmäiset sirut otetaan käyttöön gigawatin mittakaavassa vuoden 2026 loppuun mennessä, Microsoft on pääkumppani. Nvidia vastaa silti suurimmasta osasta OpenAI:n inference-suorituksista, vaikka OpenAI rahoittaa Broadcom-siruyhteistyötään.

Suuryhtiöt kilpailevat omien sirujen rakentamisessa

OpenAI ei ole ainoa. Google on rakentanut tensor-prosessointiyksiköitä vuodesta 2016 lähtien, ja Amazon seurasi perässä omilla versioillaan. Tutkimusyhtiö TrendForce arvioi, että ASIC-pohjaiset järjestelmät kattavat 27,8 % tekoälypalvelinten toimituksista vuonna 2026, korkeimmillaan sitten vuoden 2023.

TrendForcen mukaan räätälöityjen sirujen kasvu kiihtyy ensi kertaa nopeammaksi kuin Nvidia:n GPU-sirujen. Toimittajat kuten Broadcom ja Marvell ovat nousseet tärkeiksi räätälöityjen sirujen valmistajiksi laajennuksessa.

Pakon sanelemana sama kehitys näkyy myös Kiinassa. Meituan koulutti äskettäin 1,6 biljoonan parametrin LongCat-2.0-mallia Kiinan kotimaisilla siruilla ilman Nvidia-laitteita.

Miksi Nvidia-osake jatkaa nousuaan?

Uhka on todellinen, mutta luvut selittävät tilanteen rauhallisuuden. Nvidia-osake nousi lähes 2 % 30. kesäkuuta, lähes 4,8 biljoonan dollarin arvoon. Nvidian tuoreimmat tulokset osoittivat datakeskusten liikevaihdon kasvaneen 75 % ennätykselliseen 62,3 miljardiin dollariin yhdessä neljänneksessä.

Suurin paine kohdistuu inference-vaiheeseen, ei mallien koulutukseen. Nvidia hallitsee yhä mallien koulutusvaihetta, jossa sen CUDA-ohjelmisto on sitonut kehittäjät vuodesta 2006 lähtien. Räätälöidyt sirut harvoin yltävät samaan joustavuuteen.

Nvidia puolustaa myös inference-kerrosta, jota sen epäillään menettävän. GTC-tapahtumassa Nvidia kertoi tulevan Rubin-alustan leikkaavan inference-kustannuksia tokenia kohden jopa kymmenkertaisesti Blackwelliin verrattuna. Edullisempi inference usein myös lisää käyttöastetta ja kokonaissuorituskykyä.

Kaikki eivät ole vakuuttuneita. Jotkut sijoittajat ovat siirtyneet kilpaileviin siruyhtiöihin, panostaen siihen, että inference-painopiste vain kasvaa. Nvidia arvioi tämän neljänneksen tulokset laskematta mukaan myyntiä Kiinaan, ja kysyntä on silti huipussaan.

Nvidia myy yhä kaikki sirut, mitä kykenee valmistamaan. Todellinen koe on siinä, ehtivätkö sen suurimmat asiakkaat siirtyä kilpaileviin ratkaisuihin nopeammin kuin markkina kasvaa.


Lue tuorein kryptomarkkina-analyysi BeInCrypto, klikkaa tästä.

Vastuuvapauslauseke

Kaikki verkkosivustollamme olevat tiedot julkaistaan vilpittömässä mielessä ja ainoastaan yleiseen tiedottamiseen. Lukijan on toimittava verkkosivustomme tietojen perusteella täysin omalla vastuullaan.