Do roku 2025 uvidíme, ako sa AI a strojové učenie používajú na dosiahnutie skutočného pokroku v porozumení komunikácie so zvieratami a odpovedia na otázku, ktorá mátla ľudí už pred našou existenciou: „Čo si hovoria zvieratá?“ Ten nedávny Cena Coller-DolittlePonuka peňažných odmien až do pol milióna dolárov vedcom, ktorí „prelomia kód“, je znakom optimistickej dôvery, že nedávny technologický pokrok v oblasti strojového učenia a veľkých jazykových modelov (LLM) prinesie tento cieľ na dosah.
Mnoho výskumných skupín už roky pracuje na algoritmoch na pochopenie zvukov zvierat. Projekt Ceti napríklad dekódoval cvakacie vlaky vorvaňov a piesne vráskavcov. Tieto moderné nástroje strojového učenia vyžadujú extrémne veľké množstvo údajov a doteraz také množstvo kvalitných a dobre anotovaných údajov chýbalo.
Zvážte LLM ako ChatGPT, ktoré majú k dispozícii školiace údaje vrátane plného textu dostupného na internete. Takéto informácie o komunikácii zvierat neboli v minulosti dostupné. Nejde len o to, že korpusy ľudských údajov sú o mnoho rádov väčšie ako druh údajov, ku ktorým máme prístup pre voľne žijúce zvieratá: na trénovanie GPT-3 sa použilo viac ako 500 GB slov v porovnaní s niečo vyše 8 000 „kódmi“. “ (alebo vokalizácie) pre nedávnu analýzu komunikácie vorvaňov od projektu Ceti.
Navyše, keď pracujeme s ľudským jazykom, už to robíme vedieť čo sa hovorí. Dokonca vieme, čo je to slovo, čo je obrovská výhoda oproti interpretácii zvieracej komunikácie, kde vedci len zriedka vedia, či napríklad dané vlčie zavýjanie znamená niečo iné ako zavýjanie iného vlka, alebo či dokonca vlci používajú vytie ako niečo iné. nejako analogicky k „slovu“ v ľudskom jazyku.
Rok 2025 však prinesie nové pokroky v množstve údajov o komunikácii zvierat, ktoré majú vedci k dispozícii, ako aj v typoch a sile algoritmov AI, ktoré možno na tieto údaje použiť. Automatizované nahrávanie zvukov zvierat je na dosah každej vedeckej výskumnej skupiny, pričom popularita lacných nahrávacích zariadení, ako je AudioMoth, exploduje.
Obrovské súbory údajov sú teraz online, pretože rekordéry môžu byť ponechané na poli a počúvať volanie gibonov v džungli alebo vtákov v lese, 24 hodín denne, 7 dní v týždni, po dlhú dobu. Vyskytli sa prípady, keď také obrovské súbory údajov nebolo možné spravovať manuálne. Teraz nové automatické detekčné algoritmy založené na konvolučných neurónových sieťach môžu prechádzať tisíckami hodín nahrávok, vyberať zvuky zvierat a zoskupovať ich do rôznych typov na základe ich prirodzených akustických charakteristík.
Akonáhle budú tieto veľké súbory údajov o zvieratách dostupné, stanú sa možnosťou nové analytické algoritmy, ako napríklad použitie hlbokých neurónových sietí na nájdenie skrytých štruktúr v sekvenciách vokalizácie zvierat, ktoré by mohli byť analogické zmysluplnej štruktúre v ľudskom jazyku.
Základná otázka, ktorá však zostáva nejasná, znie: čo presne dúfame, že urobíme s týmito zvukmi zvierat? Niektoré organizácie, ako napríklad Interspecies.io, uviedli svoj cieľ veľmi jasne ako: „preložiť signály z jedného druhu na koherentné signály pre iný druh“. Inými slovami: do preložiť komunikácia zvierat v ľudskom jazyku. Napriek tomu väčšina vedcov súhlasí s tým, že neľudské zvieratá v skutočnosti nemajú svoj vlastný jazyk – aspoň nie tak, ako ho máme my ľudia.
Cena Coller Dolittle je o niečo pokročilejšia a hľadá spôsob, ako „komunikovať alebo dešifrovať komunikáciu organizmu“. Dešifrovanie je o niečo menej ambiciózny cieľ ako prekladanie, vzhľadom na možnosť, že zvieratá v skutočnosti nemusia mať jazyk, ktorý by sa dal preložiť. Dnes nevieme, koľko informácií alebo málo informácií si zvieratá navzájom sprostredkujú. Do roku 2025 bude mať ľudstvo potenciál prekonať naše chápanie nielen toho, koľko toho zvieratá hovoria, ale aj toho, čo presne si navzájom hovoria.