Sisällön tokenisointi voi olla seuraava suurin tekoälytrendi – tässä syy miksi

Johtavat mediaorganisaatiot solmivat yhä enemmän lisenssisopimuksia tekoälyjättien kanssa. Sanomalehdille, kuten The New York Times, tällainen sopimus suojaa niiden immateriaalioikeuksia ja tarjoaa lisätulovirran.

Samaan aikaan yritykset kuten OpenAI ja Amazon voivat kouluttaa mallejaan tarkalla tiedolla ja välttää tekijänoikeusrikkomuksiin liittyvät oikeusjutut. IoTeX Networkin, O.XYZ:n ja AR.IO:n asiantuntijat kertoivat BeInCryptolle, että olemassa olevat hajautetut vaihtoehdot voisivat läpinäkyvämmin ja oikeudenmukaisemmin saavuttaa samat tulokset sisällöntuottajille.

The New York Timesin uusi AI-strategia

Merkittävää huomiota herättäen The New York Times solmi aiemmin tässä kuussa sopimuksen Amazonin kanssa, joka sallii Amazonin käyttää sen toimituksellista sisältöä kouluttaakseen teknologiayrityksen tekoälymalleja.

The New York Timesin ja Amazonin välinen lisenssisopimus sallii teknologiayrityksen käyttää sanomalehden ja sen muiden julkaisujen artikkeleita. Kuitenkin sanomalehden julkinen ilmoitus sopimuksesta ei paljastanut taloudellisia ehtoja.

Amazon and The New York Times Announce an A.I. Licensing Deal https://t.co/BPDtaxpliI
— Michael M. Grynbaum (@grynbaum) May 29, 2025

Päätös merkitsee julkista muutosta The New York Timesin strategiassa, joka aiemmin vastusti suurten kielimallien (LLM) käyttöä sen sisällön luvattomassa käytössä.

Tammikuussa 2024 sanomalehti haastoi OpenAI:n ja Microsoftin oikeuteen tekijänoikeusrikkomuksista. The New York Times väitti, että nämä yritykset käyttivät tekijänoikeudella suojattuja artikkeleita kouluttaakseen LLM:nsä ilman lupaa tai korvausta. Tämä oikeusjuttu on yhä kesken eikä ole vielä saavuttanut lopputulosta.

The New York Times ei ole ensimmäinen mediaorganisaatio, joka haastaa teknologia-alan yrityksen oikeuteen sen immateriaalioikeuksien epäoikeudenmukaisesta käytöstä.

“Viime vuosina monet suuret teknologiaprojektit ovat kohdanneet lukuisia oikeudellisia haasteita ja sakkoja. Esimerkiksi Google on saanut yli 8 miljardia euroa sakkoja EU:lta viimeisen vuosikymmenen aikana huonojen tietokäytäntöjen vuoksi,” Ahmad Shadid, O.XYZ:n toimitusjohtaja, kertoi BeInCryptolle.

Johtavien LLM-mallien luojat tarvitsevat laajempaa pääsyä tarkkaan tietoon, joten tällaiset sopimukset ovat yhä yleisempiä.

Lisenssisopimusten nousu

Lisenssisopimukset kasvattavat suosiotaan. Viime vuonna OpenAI, Sam Altmanin johdolla, solmi sopimuksen eurooppalaisen monikansallisen mediayhtiön Axel Springer SE:n kanssa. Sopimus muistutti läheisesti äskettäin tehtyä sopimusta The New York Timesin ja Amazonin välillä.

Sopimus sallii OpenAI:n käyttää Axel Springerin omistamien mediaorganisaatioiden, kuten Politicon, Business Insiderin ja Morning Brewn, artikkeleita muiden kansainvälisten julkaisujen ohella.

Altman solmi myöhemmin samankaltaisia sopimuksia Financial Timesin, Voguen ja sellaisten julkaisujen kuin The New Yorker, Cosmopolitan ja Le Monde emoyhtiöiden kanssa, muutamia mainitakseni. OpenAI suostui linkittämään kaikki asiaankuuluvat tiedot alkuperäisiin artikkeleihin osana näitä sopimuksia.

OpenAI's content licencing deals

Companies with proprietary content (🧵): pic.twitter.com/7k0sqF4bft
— Chief AI Officer (@chiefaioffice) June 4, 2024

Kun suuret teknologiayritykset kohtaavat kasvavaa painetta immateriaalioikeusrikkomuksista ja tekijänoikeusrikkomuksista, nämä tilanteet ovat voitto kaikille osapuolille.

“The New York Timesin kaltaisten oikeusjuttujen jälkeen tekoälyyritykset ovat varovaisempia siitä, mitä ne kouluttavat. Lisenssisopimukset tarjoavat mielenrauhaa, ja julkaisijoille se on mahdollisuus muuttaa vuosikymmenten arkistoitu sisältö vakaaksi tuloksi. Samalla tekoälyyritykset hyötyvät yksinoikeudella pääsystä luotettaviin lähteisiin, mikä parantaa niiden mallien laatua,” Aaron Basi, IoTeX Networkin tuotepäällikkö, selitti.

Mutta, onko olemassa parempi tapa saavuttaa samat tulokset suuremmalla läpinäkyvyydellä?

Voiko hajauttaminen tuoda läpinäkyvyyttä tekoälykauppoihin?

On yhä kiireellisempää löytää ratkaisu, joka laajentaa pääsyä luotettavaan tietoon tekoälyn kanssa toimiessa ja korvaa sen luojat oikeudenmukaisesti. Lisenssisopimukset tarjoavat yhden polun tähän tavoitteeseen.

“Näillä sopimuksilla on valtava strateginen arvo. Ne voivat sisältää paremman näkyvyyden, kuten esiintymisen tekoälyn tuottamissa vastauksissa tai yhteenvedoissa. Lisäksi on pääsy analytiikkaan, joka näyttää, miten sisältöä käytetään tai miten siihen reagoidaan,” Basi sanoi.

Se myös estää väärän tiedon leviämistä LLM:ien käytössä.

“Tekoälyn kouluttaminen ilman varmennettua, läpinäkyvää dataa on kuin lentäisi sokkona. Jos emme voi jäljittää, mitä sisään meni, emme voi luottaa siihen, mitä ulos tulee. Näin päädymme hiljaisiin epäonnistumisiin, jotka ovat hauraita tekoälymalleja, joilta puuttuu pitkän aikavälin harkinta,” Phil Mataras, AR.IO:n perustaja, kertoi BeInCryptolle.

Nämä lisenssisopimukset ovat kuitenkin usein yksityisiä, mikä vaikeuttaa pienempien sisällöntuottajien mahdollisuuksia solmia samankaltaisia sopimuksia tai suojautua epäoikeudenmukaiselta käytöltä. Hajauttaminen voi tasoittaa pelikenttää tässä.

“Suljetut mallit voittavat lyhyen aikavälin sprintit. Hajautetut mallit voittavat maratonin. Luottamus hallitsee yhdessä läpinäkyvyyden ja tarkastettavuuden kanssa,” Mataras lisäsi.

Web3 tarjoaa useita erilaisia työkaluja, jotka voivat saavuttaa tällaisen asian.

Sisällön tokenisointi hajautetuissa verkoissa

Hajautetut teknologiat voivat luoda demokraattisemman ja läpinäkyvämmän järjestelmän kaikille sisällöntuottajille lisensoida sisältönsä. Tämä on erityisesti hyödyllistä niille, jotka usein jäävät huomiotta perinteisissä yksityisissä sopimuksissa.

”Sen sijaan, että solmittaisiin yksittäisiä lisenssisopimuksia suljettujen ovien takana, sisällöntuottajat voivat ladata sisältöä hajautettuun verkkoon. Älysopimukset voivat valvoa ehtoja ja hoitaa maksut automaattisesti. Tämä helpottaa itsenäisten sisällöntuottajien tai pienempien organisaatioiden osallistumista. Se luo myös enemmän läpinäkyvyyttä siitä, kuka käyttää dataa ja miten,” Basi selitti.

Tokenisointi tarjoaa myös sisällöntuottajille keinon seurata sisältönsä aktiivista käyttöä tekoälymalleissa.

”Sisällön tokenisointi voisi antaa julkaisijoille enemmän hallintaa ja parempaa seurantaa. Esimerkiksi he voisivat asettaa sääntöjä pääsystä tai käytöstä ja saada maksun automaattisesti älysopimusten kautta. Tämä on vielä alkuvaiheessa, mutta digitaalisille mediayrityksille tällainen järjestely voisi tarjota uusia tapoja ansaita tuloja luopumatta hallinnasta,” Basi lisäsi.

Muut lohkoketjupohjaiset ratkaisut voivat varmistaa murtumattoman kirjanpidon vahvistaakseen näitä hajautettuja vaihtoehtoja entisestään.

Immateriaalioikeuksien turvaaminen lohkoketjupohjaisten järjestelmien avulla

Toinen tärkeä osa aidosti oikeudenmukaista digitaalista ekosysteemiä on aitouden varmistaminen, käytön seuranta ja immateriaalioikeuksien suojaaminen. Tässä lohkoketjupohjaiset alkuperäjärjestelmät nousevat voimakkaiksi ratkaisuiksi.

Lohkoketjupohjaiset alkuperäjärjestelmät on suunniteltu tallentamaan digitaalisen sisällön historia ja alkuperä tarkasti. Ne hyödyntävät lohkoketjun ydintoimintoja—sen jäljitettävyyttä, läpinäkyvyyttä ja muuttumattomuutta—luodakseen luotettavia ja väärentämättömiä tietueita.

Jokainen merkittävä tapahtuma sisällön elinkaaressa, sen luomisesta muutoksiin tai siirtoihin, voidaan kirjata hajautettuun kirjanpitoon, luoden murtumattoman tietueen sen historiasta.

”Alkuperäjärjestelmät ovat olleet erittäin hyödyllisiä teknologiateollisuudessa. Niiden avulla voidaan kuvata tarkasti datasetin historiaa, kun sitä käytetään tai siirretään. Tämä auttaa määrittämään alkuperäisen omistajan, kenelle se myytiin, miten se myytiin, milloin ja datasetin nykyisen haltijan. Lohkoketjujärjestelmillä on jo pysyvät tallennusmekanismit—ne tarjoavat jäykkyyttä, kun on kyse datan omistajuudesta,” Shadid kertoi BeInCrypto:lle.

Tähän todennettavan historian perustaan rakentuvat vesileimaustyökalut täydentävät alkuperäjärjestelmiä upottamalla piilotettua, tunnistettavaa tietoa suoraan digitaaliseen sisältöön.

”Vesileimaustyökalut ovat keskeisessä roolissa estämässä tekijänoikeusrikkomuksia, datavarkauksia ja väärää omistajuusväittämää. Nämä tekniikat tekevät datavarkaiden ja hakkereiden pelistä kovempaa tarjoten datan eheyden, oikeudenmukaisuuden ja etiikan,” Shadid lisäsi.

Hajauttamisen periaatteita voitaisiin myös laajentaa sisällön kollektiiviseen hallintaan ja johtamiseen.

Media DAOs: luovien tekijöiden voimaannuttaminen sisällön lisensoinnissa

Sen sijaan, että yksittäiset sisällöntuottajat tai suurten mediayritysten johto tekisivät yksin päätöksiä sisällön lisensoinnista, hajautetut autonomiset organisaatiot (DAO:t) voisivat antaa sisällöntuottajien kollektiiveille, kuten toimittajille, mahdollisuuden ottaa päätöksenteko hallintaansa yhdessä.

”Ryhmä sisällöntuottajia voisi yhdistää työnsä ja käyttää DAO:ta hallitsemaan lisensointia, maksuja ja hallintoa. Tämä lähestymistapa antaa itsenäisille äänille paikan pöydässä suurten tekoälyyritysten kanssa. Se helpottaa myös oikeudenmukaisten ehtojen neuvottelua ja varmistaa, että päätökset tehdään yhdessä. Se on kuin ammattiliitto, mutta suunniteltu digiaikaan,” Basi selitti.

Vaikka painopiste on läpinäkyvyydessä, lisenssisopimukset tekoälymallien ja tietolähteiden välillä ovat vielä alkuvaiheessa. Tämä herättää tärkeän kysymyksen: Jäävätkö avoimen lähdekoodin mallit jälkeen, kun tekoälyyritykset solmivat yksinoikeudellisia datadiilejä?

Lisenssisopimukset vs. hajauttaminen: mikä polku menestyy?

LLM-mallien luvaton ja läpinäkymätön sisällön käyttö aiheutti aluksi merkittävää tyytymättömyyttä alkuperäisten sisällöntuottajien keskuudessa. Lisenssisopimukset ovat nyt parantaneet tilannetta.

Kuitenkin täysi läpinäkyvyys on vielä näkemättä. Sopimukset, kuten The New York Timesin ja Amazonin välinen, eivät riitä niille, jotka haluavat tietää, mistä he saavat tietonsa, ja sisällöntuottajille, jotka haluavat ymmärtää, miten heidän sisältöään käytetään.

”Suljetut mallit voittavat lyhyen aikavälin sprintit. Hajautetut mallit voittavat maratonin. Luottamus hallitsee ylivertaisesti läpinäkyvyyden ja tarkastettavuuden rinnalla,” Mataras sanoi.

Basi oli samaa mieltä ja lisäsi:

“Läpinäkyvyys on voimakas etu. Ihmiset haluavat ymmärtää, mitä työkaluihin sisältyy, erityisesti herkissä aloissa kuten terveys tai koulutus. Avoimen lähdekoodin projektit voivat mukautua nopeasti, saada apua yhteisöltä ja rakentaa luottamusta avoimuuden kautta. Pitkällä aikavälillä tuo luottamus saattaa olla tärkeämpää kuin pääsy muutamaan yksinomaiseen tietoaineistoon.”

Vaikka lisenssisopimukset ovat hyvä lähtökohta, todellinen muutos sisällöntuottajille ja tekoälyn läpinäkyvyydelle tulee todennäköisesti hajautetuista ja avoimen lähdekoodin lähestymistavoista.