DeepSeekin nousu järkytti teknologiayritysten mukavaa asemaa AI-innovaation johtajina. Kiinalainen start-up osoitti, kuinka mallin tehokkuus voidaan saavuttaa vähemmällä rahalla ja resursseilla.
BeInCrypto keskusteli kymmenen alan johtajan kanssa siitä, miksi teknologinen sektori vaikutti kryptomarkkinoihin ja kuinka DeepSeekin nousu on pysyvästi määritellyt AI-kehityksen tulevaisuuden uudelleen.
Ämpärillinen jäävettä amerikkalaisille teknologiayrityksille
DeepSeekin nousu ja sen syvälle ulottuvat vaikutukset kryptomarkkinoihin toimivat herätyksenä länsimaisille teknologiasektoreille, jotka eivät enää voi luottaa ylivoimaiseen asemaansa AI-kehityksessä.
Vain kaksi viikkoa sitten kiinalainen start-up julkaisi kaksi AI-mallia: R1 ja V3. Nämä järjestelmät osoittautuivat yhtä tehokkaiksi kuin teknologiajättien OpenAI:n ja Googlen kehittämät, ja ne sijoittuivat jopa korkeammalle joissakin tunnusluvuissa. Ne tuotettiin myös murto-osalla kustannuksista.
Kielimallien (LLM) kuten Metan Llama 3.1 tuotantokustannukset nousevat yli 60 miljoonaan dollariin, mutta DeepSeek nousi otsikoihin vähentämällä huippumallin koulutuskustannukset vain 6 miljoonaan dollariin.
Vain tunteja DeepSeekin julkaisun jälkeen uutinen pyyhkäisi biljoonan dollarin pois johtavien yhdysvaltalaisten teknologiayritysten markkina-arvosta. Nvidia, maailman johtava AI-sirujen toimittaja, menetti arvoaan 600 miljardia dollaria.
Yhdysvaltain osakemarkkinat kokivat pahimman yksittäisen päivän tappionsa koskaan, ja kryptovaluutat tunsivat vaikutuksen. DeepSeekin saapuminen aiheutti suuria laskuja louhintayhtiöiden osakkeissa kuten Marathon ja Riot, jotka ovat vahvasti riippuvaisia Nvidian laitteistosta.
Uutinen myös laukaisi miljardin dollarin kryptomyyntiaallon, Bitcoinin pudotessa 5 % ja altcoinien nähdessä vielä jyrkempiä 8-10 % laskuja. Samaan aikaan AI-vetoiset kryptot kokivat 10 % laskun markkina-arvossaan 24 tunnin aikana, neljän viidestä suurimmasta AI-kolikosta kärsiessä suuria tappioita.

DeepSeekin esiintyminen nöyryytti itsevarmoja teknologiayrityksiä. Se nosti esiin niiden liiallisen riippuvuuden miljardiluokan investoinneista ja tulevasta tuloskasvusta.
Se osoitti myös, että tulevat innovaatiokilpailun häiriöt vaikuttavat väistämättä kryptomarkkinoihin.
Kiina luo DeepSeekin vastoinkäymisistä huolimatta
DeepSeek järkytti markkinoita, koska se osoitti, ettei Kiina ollutkaan niin paljon Yhdysvaltoja jäljessä tehokkaimpien AI-mallien kehittämisessä. Ennen kuin uutinen tuli julki 27. tammikuuta, suurten toimijoiden kuten Microsoftin, Googlen ja OpenAI:n teknologiaosakkeet osoittivat positiivista tunnelmaa.
Tämä tunne perustui pääasiassa siihen, että nämä teknologiayritykset ovat vakiintuneita ja hyvin rahoitettuja. Niillä on jo vahva markkina-asema ja pääsy hienostuneimpaan laitteistoon ja ohjelmistoon, joita tarvitaan AI-innovaation edistämiseen.
“Nämä yritykset eivät ainoastaan omaa teknologista etua, vaan myös infrastruktuurin, laajat tietoaineistot ja taloudelliset resurssit ylläpitääkseen hallitsevaa asemaansa,” sanoi Pavel Matveev, Wirexin perustaja.
Samaan aikaan Joe Bidenin presidenttikaudella Nvidialta kiellettiin GPU-prosessoriensa myynti Kiinaan. Nämä vientirajoitukset pakottivat Kiinan luottamaan siihen varastoon, jonka se oli siihen mennessä kerännyt.
Haasteista huolimatta Kiina loi DeepSeekin.
“Yhdysvaltojen vientirajoitusten vuoksi kiinalaisilla ei ollut läheskään samanlaista pääsyä laitteistoon kuin yhdysvaltalaisilla yrityksillä. Mutta jälleen kerran, tämä on taloustieteen peruskurssi: resurssien niukkuus johtaa innovaatioon, tai “tarpeen pakko,” kuten me muut sanomme. Kiinan oli mentävä syvälle insinöörityöhön ja todella innovoitava. Se on todella voitokas tarina,” sanoi Sebastian Pfeiffer, Impossible Cloud Networkin toimitusjohtaja.
Yang Tangille, QStarLabsin toimitusjohtajalle, tällainen oli väistämätöntä.
“Tämä on luonnollinen kehitys teknologian kehityksessä: ketterämpi kilpailija, joka käytti parempaa prosessia saavuttaakseen parempia tuloksia. On huomattava, että kaikki mitä DeepSeek teki, oli aiemmin julkaistu akateemisessa ja/tai teollisuuden tutkimuksessa. Tämä pakottaa varmasti vakiintuneet AI-laboratoriot ajattelemaan eri tavalla, sillä monet ovat olleet liiaksi tutkimuskeskeisiä,” hän sanoi.
Se opetti myös länsimaille arvokkaan läksyn.
Joskus vähemmän on todellakin enemmän
Vuosi sitten OpenAI:n toimitusjohtaja Sam Altman ennusti, että tekoälyteollisuus tarvitsisi biljoonia dollareita investointeja erikoistuneiden sirujen kehittämiseen. Nämä sirut ovat välttämättömiä energiaintensiivisten datakeskusten toiminnalle, jotka tukevat teollisuuden yhä monimutkaisempia tekoälymalleja.
Muut johtavat teknologiayritykset ovat äskettäin ottaneet samanlaisia aloitteita. Meta on jo ilmoittanut aikovansa käyttää jopa 65 miljardia dollaria tänä vuonna laajentaakseen tekoälyinfrastruktuuriaan. Yritys pyrkii päättämään vuoden yli 1,3 miljoonalla grafiikkaprosessorilla.
Microsoft ilmoitti suunnitelmistaan noin 80 miljardin dollarin datakeskusten kehittämiseen tilivuodelle 2025. Samaan aikaan Amazon odottaa, että sen ennustettu vuoden 2025 kulutus vastaavaan infrastruktuuriin ylittää sen arvioidun 75 miljardin dollarin investoinnin vuonna 2024.
Monet näistä yrityksistä myös varastoivat GPU:ita ja niihin liittyvää tekoälylaitteistoa. Esimerkiksi Metan toimitusjohtaja Mark Zuckerberg sanoi, että hänen yrityksensä tavoitteena on nostaa GPU-varastonsa 600 000:een vuoden 2024 loppuun mennessä.
Samaan aikaan DeepSeek käytti hieman yli 2 000 Nvidia GPU -yksikköä ja 6 miljoonaa dollaria R1-mallinsa tehostamiseen.
“DeepSeekin läpimurto kehityskustannusten vähentämisessä ja tekoälymallien optimoinnissa minimaalisilla laskentaresursseilla merkitsee suurta muutosta kilpailukykyisessä tekoälymaisemassa. Perinteiset jättiläiset kuten Nvidia, OpenAI ja Google, jotka luottavat massiiviseen laskentatehoon ja kalliiseen infrastruktuuriin (kuten huippuluokan GPU:ihin ja laajoihin pilvipalveluihin), saattavat huomata perinteisen etunsa resurssi-intensiivisessä tekoälykehityksessä vähenevän,” Trevor Koverko, Sapien.io:n perustaja, kertoi BeInCrypto:lle.
Länsimaiset yritykset havaitsivat, että Kiina ei ollut kaukana jäljessä kilpailussa, mikä pelästytti sijoittajia perinteisillä rahoitusmarkkinoilla ja kryptomarkkinoilla.
DeepSeekin vaikutus kryptomarkkinoihin selitetty
Laajempi markkinoiden lasku – erityisesti perinteisillä markkinoilla – heijasti odotusten uudelleenkalibrointia teknologian arvostuksista pikemminkin kuin yksinkertaista korjausta.
“Markkinat olivat hinnoitelleet aggressiivisia kasvuodotuksia tekoälyteknologioille, erityisesti laskentavaatimuksille, jotka hyödyttäisivät yrityksiä kuten Nvidia ja suuret pilvipalveluntarjoajat. DeepSeekin läpimurto saavuttaa vastaavia tuloksia vähemmällä laskentateholla on pakottanut sijoittajat arvioimaan nämä oletukset uudelleen,” sanoi Karan Sirdesai, Mira Networkin toimitusjohtaja ja perustaja.
Vaikka kryptosektorilla ei ole suoria yhteyksiä DeepSeekin kanssa, se jakaa pelikentän tekoälykehittäjien kanssa. Tämän seurauksena kryptovaluutat kärsivät yhtä lailla uutisista R1-julkaisusta.
Sirdesain mukaan krypton ja tekoälymarkkinoiden välinen suhde on monimutkaisempi kuin yksinkertainen korrelaatio. Vaikka molemmat kuuluvat teknologian piiriin, ne toimivat perustavanlaatuisesti eri periaatteilla.
“Bitcoinin ja kryptojen arvostukset perustuvat rahataloudellisiin dynamiikkoihin, verkoston käyttöönottoon ja sääntely-ympäristöihin, kun taas tekoälykehitykset keskittyvät teknologisiin kykyihin ja kaupallisiin sovelluksiin,” hän selitti.
Kuitenkin sekä kryptolla että tekoälyllä on suuri läsnäolo teknologiasektorilla.
“Molemmat sektorit kilpailevat laskentaresursseista, erityisesti GPU:ista, luoden toimitusketjun yhteyksiä. Lisäksi monet sijoittajat ovat aktiivisia molemmilla alueilla, joten tunnelma voi levitä. Kun suuret teknologiayritykset kokevat volatiliteettia tekoälykehityksistä, se voi heijastua kryptomarkkinoille tämän yhteisen sijoittajapohjan kautta,” Sirdesai lisäsi.
Viimeaikaiset markkinaliikkeet DeepSeekin R1-mallin julkaisun jälkeen todistavat, kuinka herkkä kryptomarkkina on teknologiasektorin yleiselle tunnelmalle.
“Tämä vuorovaikutus heijastaa kulttuurista ja teknologista synergiaa tekoälyn ja krypton välillä, mikä viittaa siihen, että kehitykset yhdellä alueella voivat merkittävästi vaikuttaa toiseen,” lisäsi Forest Bai, Foresight Venturesin perustaja.
Sen vuoksi on tärkeää seurata tarkasti, miten amerikkalaiset teknologiayritykset reagoivat DeepSeekin viimeisimpään innovaatioon, jotta voidaan ymmärtää, miten vastaavat tapahtumat voivat vaikuttaa kryptomarkkinoihin tulevaisuudessa.
Amerikkalaisten teknologiayritysten kalibrointijakso
Sijoittajien luottamuksen lasku paljastaa epävarmuuden tekoälymarkkinoiden tulevaisuudesta. Nämä epäilykset keskittyvät siihen, pysyykö laskentateho kilpailun avaimena ja miten tehokkuusinnovaatiot muokkaavat alaa.
“Tekoälykilpailu ei enää koske sitä, kenellä on eniten GPU:ita, vaan sitä, kuka voi kouluttaa älykkäimmät ja tehokkaimmat mallit. DeepSeekin läpimurto todistaa, että koulutuksen innovaatiot voivat häiritä tekoälymonopolia,” Ilan Rakhmanov, ChainGPT:n perustaja, kertoi BeInCrypto:lle.
Rakhmanov korosti keskeisiä teknisiä innovaatioita, joita DeepSeek toteutti kiertääkseen esteet GPU:iden saatavuudessa.
”DeepSeekin R1-malli saavuttaa todennäköisesti tehokkuutensa optimoidun arkkitehtuurin, vaihtoehtoisten koulutusmenetelmien, erikoistuneen laitteiston ja energiatehokkaiden laskentastrategioiden yhdistelmällä. Parantamalla transformerien tehokkuutta, hyödyntämällä mallin harvuutta ja sisällyttämällä hakuun perustuvaa generointia, DeepSeek vähentää laskentavaatimuksia suorituskyvystä tinkimättä. Sen tukeutuminen itseohjautuvaan oppimiseen, synteettiseen datan lisäykseen ja vahvistusoppimiseen minimoi riippuvuuden massiivisista tietoaineistoista, kun taas mukautetut AI-kiihdyttimet tai ei-GPU-vaihtoehdot auttavat alentamaan laskentakustannuksia,” hän totesi.
Tähän liittyen Anthony Simonet, iExecin tutkimusjohtaja, lisäsi:
”Se käyttää tekniikoita, kuten Mixture-of-Experts-arkkitehtuureja, matalan tarkkuuden koulutusta ja tiedon tislausta maksimoidakseen tehokkuuden vähemmillä resursseilla, mahdollistaen AI:n sujuvan toiminnan tavallisella laitteistolla ja tehden siitä helpommin saatavilla,” hän sanoi.
Teknologia-asiantuntijat huomasivat myös nopeasti, että DeepSeek julkaisi mallinsa taustalla olevan tutkimuksen julkisesti nähtäväksi.
Perusteet hajautetulle tekoälylle
Toisin kuin perinteinen yhdysvaltalaisten yritysten, kuten OpenAI, salailu, DeepSeek julkaisi vaikuttavasti R1-mallinsa täysin avoimena lähdekoodina. Monet alan johtajat kiittivät tätä liikettä, mikä viittaa siihen, että AI:n tulevaisuuden pysyminen julkisen hallinnassa edellyttää yleisen saatavuuden pysymistä hajautettuna.
”DeepSeek on ollut pelinmuuttaja AI-teollisuudelle, ja uskon, että se on juuri sellainen herätys, jota yritykset kuten OpenAI tarvitsevat. OpenAI perustettiin alun perin tekemään kehittynyt AI kaikkien saataville, mutta ajan myötä olemme nähneet siirtymisen kohti suljettuja, portinvartioituja malleja. AI-ala kehittyy, ja DeepSeek on muistuttanut meitä kaikkia jostain tärkeästä—suuren teknologian tulisi olla rakennettu kaikille, ei vain harvoille valituille,” sanoi Rakhmanov.
Pienemmät kehittäjät, joilla on vähemmän resursseja, ottivat tämän uutisen ilolla vastaan. Pääsy DeepSeekin suunnitteluun ja tutkimuspapereihin antaa heille mahdollisuuden hioa mallejaan ilman, että heidän tutkimusbudjettinsa ehtyvät.
”DeepSeekin halvemmat mallit vähentävät AI-mallien koulutukseen tarvittavia GPU:ita, mikä alentaa laskentakustannuksia. Tämä tehokkuus mahdollistaa AI:n laajentamisen edullisemmin, tehden siitä saavutettavamman yrityksille ja tutkijoille, joilla on rajalliset resurssit,” sanoi Ron Bodkin, Theoriqin toinen perustaja.
Koska start-upin malli on nyt avoimen lähdekoodin, kehittäjät analysoivat sitä laajasti, mikä edistää AI-innovaatiota edelleen.
”Koska DeepSeek on avoimen lähdekoodin, AI-kilpailu siirtyy peruuttamattomasti enemmän avoimen lähdekoodin alueelle, tuhoten suljetun lähdekoodin perustavan mallin narratiivin. Avoimen lähdekoodin hyöty koituu kaikille, AI-yrityksille (jokaiselle ekosysteemin toimijalle), innovaattoreille ja kuluttajille. Ainoat häviäjät ovat ne, jotka pitävät kiinni suljetun lähdekoodin mallista, joka kokee nopean hajoamisen lähitulevaisuudessa,” Steven Pu, Taraxan toinen perustaja, kertoi BeInCryptolle.
Kun AI tulee halvemmaksi ja helpommin saatavilla, siitä tulee enemmän hyödyke.
AI-teknologian tuotteistaminen
DeepSeekin julkaisupäivänä Microsoftin toimitusjohtaja Satya Nadella julkaisi sosiaalisessa mediassa Jevonsin paradoksista.
”Jevonsin paradoksi iskee jälleen! Kun AI tulee tehokkaammaksi ja helpommin saatavilla, näemme sen käytön räjähtävän, muuttaen sen hyödykkeeksi, josta emme saa tarpeeksemme,” Nadella sanoi X:ssä.
Myös palautusvaikutuksena tunnettu Jevonsin paradoksi on taloudellinen periaate, jonka loi englantilainen taloustieteilijä William Stanley Jevons. Resurssien käytön lisääntynyt tehokkuus voi johtaa kyseisen resurssin kulutuksen kasvuun.
Kun AI-järjestelmät tulevat tehokkaammiksi, niiden tehtävien kysyntä voi kasvaa—ilmiö, jota AI-tutkimuksen lisääntynyt saatavuus voi voimistaa.
“Kustannusten alentaminen sekä koulutus- että päättelyvaiheissa on hyvä asia. Teknologiassa kustannusten alentaminen on aina johtanut laajempaan käyttöönottoon ja korkeampaan kokonaiskulutukseen, ei vähempään. Kun autot tulivat edullisiksi, yhä useammalla oli auto. Kun tietokoneet pienenivät edullisiksi henkilökohtaisiksi tietokoneiksi, se ajoi digitaalista vallankumousta. Samalla tavalla näemme enemmän innovaattoreita ja start-upeja kokeilemassa tekoälyä nyt, kun se on tullut edullisemmaksi, mikä johtaa tekoälyn laajempaan hyödyntämiseen ja suurempaan kysyntään tekoälyyn liittyvälle infrastruktuurille, kuten GPU-laitteistolle,” Pu kertoi BeInCrypto:lle.
Pfeifferin mukaan tekoälyinfrastruktuurin kaupallistaminen muuttaa myös innovaatioteknologiayritysten tavoitteita. Kehittäjät keskittyivät aiemmin hienostuneimpien LLM-mallien luomiseen. Nyt ponnistelut siirtyvät tämän teknologian integroimiseen eri teollisuudenaloille.
“DeepSeek koulutettiin OpenAI:lla ja pystyi rakentamaan merkittävästi muiden edistymisen pohjalta. LLM-maisema kaupallistuu ja todennäköisesti avataan täysin lähdekoodiksi. Tämä ei kuitenkaan ole paikka, jossa suurin osa innovaatioista tapahtuu. Tekoälyn kasvu ja kehitys näkyvät vähemmän kehityspuolella, mutta enemmän tekoälyn integroinnissa ja käytössä. Vertikaaliset, syvät integraatiot teollisuudenaloille ja pääsy niiden dataan ovat paljon tärkeämpiä kuin hienostuneet LLM:t, koska ne ovat kaupallistettuja ja niiden innovaatiokehitys hidastuu,” hän sanoi.
Tämä paradoksi voi myös antaa amerikkalaisille teknologiayrityksille etulyöntiaseman maihin nähden, joilla on rajoitettu pääsy laskentaresursseihin.
Yhdysvaltojen etulyöntiasema
Vaikka DeepSeekin uusin malli on osoittanut kaventaneensa kilpailuetua vakiintuneisiin yhdysvaltalaisiin yrityksiin nähden, yritys ei ole immuuni haasteille.
Jevonsin paradoksin mukaan lisääntynyt kysyntä tekoälytuotteille johtaa väistämättä myös lisääntyneeseen kysyntään niiden kehittämiseen tarvittaville resursseille. Vaikka muita vaihtoehtoja tutkitaan edelleen, GPU:t ovat edelleen elintärkeitä tekoälyteknologioiden tulevalle kehitykselle.
“DeepSeek näyttää myös saavuttavan kapasiteetin, joka rajoittaa heidän kykyään laajentaa tarjontaansa – he ovat rajoittaneet sovelluksensa rekisteröitymisiä kiinalaisille asukkaille ja heidän API:nsä on paljon hitaampi kuin lanseerauksen aikaan. Uskon, että he eivät pysty hankkimaan lisää GPU:ita, jotta he voisivat laajentaa tarjontaansa,” Bodkin sanoi.
DeepSeekin läpimurto ei myöskään poista Yhdysvaltojen vuosikymmeniä kestänyttä sitoutumista tekoälyinfrastruktuurin kehittämiseen.
“Huolimatta DeepSeekin optimointiläpimurroista, tekoälykilpailua ohjaa edelleen suurelta osin pääsy massiivisiin tietoaineistoihin, laskentatehoon ja end-to-end-ekosysteemin hallintaan. Yritykset kuten OpenAI ja Google eivät luota pelkästään brutaaliin skaalaamiseen – niillä on myös omaa dataa, pilvi-infrastruktuuria ja laajoja käyttöönottoverkostoja. Vaikka vaihtoehtoiset menetelmät ovat lupaavia, ne häiritsevät status quota vain, jos ne pystyvät johdonmukaisesti ylittämään perinteiset lähestymistavat monipuolisissa käyttötapauksissa. Tällä hetkellä on liian aikaista sanoa, edustaako DeepSeek teollisuuden muutosta vai onko se vain vähittäinen parannus jo ennestään kilpailullisessa ympäristössä,” Matveev kertoi BeInCrypto:lle.
Tämän todellisuuden valossa Sirdesai uskoo, että markkinoiden reaktio DeepSeekiin oli jossain määrin liioiteltu.
“Markkinoiden reaktio näyttää aliarvioivan tekoälyteknologian kaupallistamisen monimutkaisuutta. DeepSeekin tehokkaampi arkkitehtuuri on merkittävä, mutta onnistunut tekoälyn käyttöönotto vaatii vankan infrastruktuurin, vahvat turvatoimet ja todistetun luotettavuuden tuotantoympäristöissä. Länsimaiset teknologiayritykset ovat käyttäneet vuosia näiden kyvykkyyksien rakentamiseen,” hän sanoi.
DeepSeekin nousu on kiistatta muokannut tekoälykilpailua, osoittaen, että innovaatio voi nousta odottamattomista kulmista ja haastaa vakiintuneet jättiläiset.
Teollisuuden kehittyessä edelleen avoimen lähdekoodin mallien, resurssien saatavuuden ja kilpailudynamiikan välinen vuorovaikutus muokkaa epäilemättä tekoälyn kehityksen tulevaisuutta ja sen vaikutusta maailmaan.
Vastuuvapauslauseke
Kaikki verkkosivustollamme olevat tiedot julkaistaan vilpittömässä mielessä ja ainoastaan yleiseen tiedottamiseen. Lukijan on toimittava verkkosivustomme tietojen perusteella täysin omalla vastuullaan.
