Pripojte sa k našim denným a týždenným spravodajcom a získajte najnovšie aktualizácie a exkluzívny obsah o špičkovom pokrytí AI. Viac informácií


Každý týždeň – niekedy aj každý deň – sa na svete rodí nový model umelej inteligencie. Keď vstupujeme do roku 2025, tempo vydávania nových modelov je závratné, ak nie vyčerpávajúce. Krivka horskej dráhy naďalej exponenciálne rastie a únava a úžas sa stali stálymi spoločníkmi. Každé vydanie zdôrazňuje prečo to jeden model je lepší ako všetky ostatné, s nekonečnými zbierkami benchmarkov a stĺpcových grafov, ktoré plnia naše informačné kanály, keď sa snažíme držať krok.

Počet hlavných modelov nadácií vydávaných ročne od roku 2020 exponenciálne vzrástol
Charlie Giattino, Edouard Mathieu, Veronika Samborska a Max Roser (2023) – “Artificial Intelligence” publikované online na OurWorldinData.org.

Pred 18 mesiacmi drvivá väčšina vývojárov a spoločností používala jediný model AI. Dnes je opak pravdou. Je zriedkavé, aby sa spoločnosť významnej veľkosti obmedzila na možnosti jedného modelu. Spoločnosti sa obávajú zablokovania dodávateľov, najmä pokiaľ ide o technológiu, ktorá sa rýchlo stala základnou súčasťou dlhodobej obchodnej stratégie a krátkodobých obchodných výsledkov. Pre tímy je čoraz riskantnejšie staviť všetky svoje stávky na jeden veľký jazykový model (LLM).

Napriek tejto fragmentácii však mnohí poskytovatelia modelov stále podporujú názor, že AI bude trhom, ktorý bude víťazom brať všetko. Tvrdia, že odborné znalosti a výpočtový výkon potrebné na trénovanie najlepších modelov sú vzácne, obhájiteľné a posilňujúce sa. Z ich pohľadu sa bublina pre vytváranie AI modelov nakoniec zrúti a zostane jeden obrovský model umelej všeobecnej inteligencie (AGI), ktorý sa bude používať na čokoľvek. Vlastniť výlučne takýto model by znamenalo byť najmocnejšou spoločnosťou na svete. Veľkosť tejto ceny odštartovala preteky v zbrojení pre stále viac GPU, pričom každých pár mesiacov pribudla nová nula k počtu tréningových parametrov.

Deep Thought, monolitické AGI zo Stopárovho sprievodcu vesmírom
BBC, Stopárov sprievodca po galaxii, televízny seriál (1981). Statický obrázok získaný na účely komentára.

Domnievame sa, že tento názor je nesprávny. Nebude existovať jediný model, ktorý bude vládnuť vesmíru, ani budúci rok, ani ďalšie desaťročie. Namiesto toho bude budúcnosť AI multimodelová.

Jazykové modely sú fuzzy tovary

z Oxfordský slovník ekonómie definuje komoditu ako „štandardizovaný tovar, ktorý sa kupuje a predáva vo veľkom a ktorého jednotky sú vzájomne zameniteľné“. Jazykové modely sú komodity v dvoch dôležitých smeroch:

  1. Samotné modely sú čoraz viac zameniteľné pre širší rozsah úloh;
  2. Výskumná expertíza potrebná na výrobu týchto modelov je čoraz rozšírenejšia a dostupnejšia, pričom hraničné laboratóriá sa navzájom sotva predbiehajú a nezávislí výskumníci v komunite s otvoreným zdrojovým kódom im škriabu na päty.
Komodity popisujúce suroviny (kredit: nie diamant)

Ale zatiaľ čo jazykové modely komoditizujú, robia to nerovnomerne. Existuje veľké množstvo možností, pre ktoré sa každý model, od GPT-4 až po Mistral Small, dokonale hodí. Zároveň, keď sa posúvame smerom k okrajovým a okrajovým prípadom, vidíme rastúcu diferenciáciu, pričom niektorí poskytovatelia modelov sa výslovne špecializujú na generovanie kódu, uvažovanie, generovanie rozšíreného vyhľadávania (RAG) alebo matematiku. To vedie k nekonečnému ručnému žmýkaniu, hľadaniu na reddite, vyhodnocovaniu a dolaďovaniu, aby ste našli ten správny model pre každú úlohu.

Modely AI využívajú základné schopnosti a špecializujú sa na okraje. Kredit: Nie diamant

A zatiaľ čo jazykové modely sú komodity, sú presnejšie opísané ako nejasný tovar. V mnohých prípadoch použitia budú modely AI prakticky zameniteľné, pričom metriky ako cena a latencia určujú, ktorý model použiť. Ale na hranici možností sa stane opak: modely sa budú naďalej špecializovať a budú čoraz viac diferencované. Napríklad Deepseek-V2.5 je pri kódovaní v C# silnejší ako GPT-4o, napriek tomu, že je zlomok veľkosti a 50-krát lacnejší.

Obe dynamiky – komoditizácia aj špecializácia – podkopávajú tvrdenie, že na riešenie každého možného prípadu použitia bude najvhodnejší jeden model. Skôr poukazujú na čoraz viac fragmentovanú krajinu pre AI.

Multimodálna orchestrácia a smerovanie

Pre trhovú dynamiku jazykových modelov existuje nápadná analógia: ľudský mozog. Štruktúra nášho mozgu zostala nezmenená už 100 000 rokov a mozgy sú si oveľa viac podobné ako odlišné. Počas veľkej väčšiny nášho času na zemi sa väčšina ľudí učila rovnaké veci a mala podobné schopnosti.

Ale potom sa niečo zmenilo. Rozvinuli sme schopnosť komunikovať v jazyku – najprv rečou, potom písmom. Komunikačné protokoly uľahčujú vytváranie sietí a ako ľudia začali medzi sebou sieťovať, začali sme sa aj my čoraz viac špecializovať. Boli sme oslobodení od bremena potreby byť generalistami vo všetkých oblastiach, byť sebestačnými ostrovmi. Paradoxne, kolektívne bohatstvo špecializácie tiež spravilo z dnešného priemerného človeka oveľa silnejšieho generalistu ako ktorýkoľvek z našich predkov.

Na dostatočne širokom vstupnom priestore má vesmír vždy tendenciu k špecializácii. To platí od molekulárnej chémie až po biológiu a ľudskú spoločnosť. Pri dostatočnej variácii budú distribuované systémy vždy výpočtovo efektívnejšie ako monolity. Veríme, že to isté bude platiť aj pre AI. Čím viac dokážeme využiť silné stránky viacerých modelov namiesto spoliehania sa len na jeden, tým viac sa tieto modely môžu špecializovať a posúvať hranice možností.

Viacmodelové systémy umožňujú väčšiu špecializáciu, kapacitu a efektivitu. Zdroj: Nie Diamond

Čoraz dôležitejším vzorom na využitie silných stránok rôznych modelov je smerovanie: dynamické odosielanie dopytov na najvhodnejší model a zároveň používanie lacnejších a rýchlejších modelov, ak to neznižuje kvalitu. Prostredníctvom smerovania môžeme využívať všetky výhody špecializácie – vyššiu presnosť s nižšími nákladmi a latenciou – bez toho, aby sme sa vzdali robustnosti zovšeobecnenia.

Jednoduchou demonštráciou sily smerovania je skutočnosť, že väčšina svetových top modelov sú samotné smerovače: sú postavené pomocou Mix odborníkov architektúry, ktoré smerujú každú nasledujúcu generáciu tokenov na niekoľko desiatok expertných podmodelov. Ak je pravda, že LLM exponenciálne distribuujú fuzzy komodity, potom sa smerovanie musí stať nevyhnutnou súčasťou každého zásobníka AI.

Existuje názor, že LLM budú stagnovať, keď dosiahnu ľudskú inteligenciu – že keď budeme plne saturovať schopnosti, spojíme sa okolo jedného generického modelu rovnakým spôsobom, akým sme sa spojili okolo AWS alebo iPhonu. Žiadna z týchto platforiem (ani ich konkurenti) v posledných rokoch nerozšírila svoje možnosti desaťnásobne – takže by sme sa mohli v ich ekosystémoch aj my cítiť pohodlne. Veríme však, že AI sa nezastaví pri inteligencii na úrovni ľudí; bude pokračovať ďaleko za hranice, ktoré si vôbec dokážeme predstaviť. Keď to urobí, bude čoraz viac fragmentovaný a špecializovaný, rovnako ako ktorýkoľvek iný prírodný systém.

Nemôžeme dostatočne zdôrazniť, do akej miery je fragmentácia modelu AI veľmi dobrá. Fragmentované trhy sú efektívne trhy: dávajú silu kupujúcim, maximalizujú inovácie a minimalizujú náklady. A v rozsahu, v akom dokážeme využiť siete menších, špecializovanejších modelov namiesto toho, aby sme všetko riadili vnútornými časťami jedného obrovského modelu, smerujeme k oveľa bezpečnejšej, lepšie interpretovateľnej a kontrolovateľnej budúcnosti AI.

Najväčšie vynálezy nemajú majiteľov. Dedičia Bena Franklina nevlastnia elektrinu. Turingov majetok nevlastní všetky počítače. AI je nepochybne jedným z najväčších vynálezov ľudstva; veríme, že jej budúcnosť bude – a mala by byť – multimodelová.

Zack Kass je bývalým šéfom go-to-market v OpenAI.

Tomás Hernando Kofman je spoluzakladateľom a generálnym riaditeľom spoločnosti Nie diamant.

Rozhodnutia o údajoch

Vitajte v komunite VentureBeat!

DataDecisionMakers je miesto, kde odborníci vrátane technických ľudí, ktorí pracujú s údajmi, môžu zdieľať poznatky a inovácie súvisiace s údajmi.

Ak si chcete prečítať viac o špičkových nápadoch a informáciách, osvedčených postupoch a budúcnosti dát a dátových technológií, pripojte sa k DataDecisionMakers.

Môžete dokonca zvážiť, či sami prispejete článkom!

Prečítajte si viac od DataDecisionMakers