Umělá inteligence stvořila vlastní tajný jazyk. Podezření se nepodařilo zcela vyvrátit
Oblíbený nástroj na generování obrázků podle zadaných slov začal překládat některé věci do textu, který na první pohled nedává smysl. Je v něm však řád a dá se přeložit.
Pokud se pohybujete na sociálních sítích, patrně jste si nemohli nevšimnout fenoménu Dall·E – umělé inteligence, které stačí zadat několik základních klíčových slov, podle nichž následně vygeneruje obrázek. Výsledky jsou pozoruhodné, protože v nich Dall·E uplatňuje u strojů nevídanou kreativitu, díky které hravě řeší i bizarní zadání a dále se zdokonaluje.
K dispozici jsou dvě verze, Dall·E 2 coby profesionální nástroj, k němuž se dostanete pouze skrze pozvánku, aby nedošlo ke zneužití například pro propagandu. A Dall·E Mini, všem dostupný, leč značně omezený generátor, na kterém si nicméně můžete sami vyzkoušet základní princip, ovšem bez možnosti dostat z něj fotorealistické obrázky.
DALLE-2 has a secret language.
— Giannis Daras (@giannis_daras) May 31, 2022
"Apoploe vesrreaitais" means birds.
"Contarra ccetnxniams luryca tanniounons" means bugs or pests.
The prompt: "Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons" gives images of birds eating bugs.
A thread (1/n)🧵 pic.twitter.com/VzWfsCFnZo
Umělá inteligence vytváří slovní zásobu
Důvod, proč o této umělé inteligenci píšeme, však má spojitost s vedlejším efektem, kterým je očividné vytváření vlastního jazyka, jemuž naplno momentálně rozumí jen Dall·E. Podle Giannise Darase a Alexandrose Dimakise z University of Texas jde v první fázi spíše o vytváření slovní zásoby, kterého si všimli při zadávání pokynů, aby Dall·E vygenerovala obrázek nějakého slova. V takových případech přichází kreativní umělá inteligence se shluky písmen, které jsou na první pohled nesrozumitelné. Jak ale oba studenti zjistili, pokud některá nesrozumitelná slovíčka použijí jako zadání pro vytvoření nového obrázku, dostávají konzistentní výsledky.
Daras celou záležitost popsal v dlouhém vláknu na svém Twitteru, kde pochopitelně uvádí i konkrétní příklady nesrozumitelných slov a toho, co podle Dall·E znamenají. Například „Apoploe vesrreaitais“ překládá umělá inteligence jako ptáci, zatímco delší „Contarra ccetnxniams luryca tanniounons“ má odpovídat broukům a „Vicotees“ pokrmům se zeleninou.
K některým ze slov se Daras a jeho kolega dostali tím způsobem, že chtěli po umělé inteligenci vytvořit obrázek, kde se spolu lidé baví o zadaném tématu, což občas přináší výsledek v podobě fotky s textovou bublinou. Podle Dall·E tak například „dva farmáři mluvící o zelenině“ vypadají jako dva muži, z nichž si jeden druhému patrně stěžuje, že mu jeho zeleninu (vicotees) požírají ptáci (apoploe vesrreaitais).
Daras ovšem zkoušel i jiná, mnohem bizarnější zadání, jako například dvě velryby mluvící spolu o jídle, což přineslo další slovní spojení „Wa ch zod rea“ – jídlo, které jedí velryby. Mezi obrázky, které na tento pokyn vygeneruje Dall·E, jsou krevety, malé ryby nebo mušle, což opět posiluje pocit, že si umělá inteligence sama vybírá slova, pro která přiřazuje vlastní význam. A to, že zadání rozumí i při opačném postupu, tedy zobrazí konzistentní a relevantní výsledky k domnělému významu slov, je velmi zajímavý průlom v přístupu k umělým inteligencím obecně.
Rozporuplné výsledky
Ne všichni jsou ale se závěry Darase a Dimakise spokojeni a věří jim. Výzkumný analytik Benjamin Hilton patří mezi hrstku vyvolených, kteří mají přístup k plné verzi Dall·E a rozhodl se výše popisované případy sám pečlivě prozkoumat. Zjistil, že výsledky nejsou tak jednoznačné, jak studenti z University of Texas uvádějí. Hilton tvrdí, že například dlouhé „Contarra ccetnxniams luryca tanniounons“ neznamená pouze brouky, ale další všemožná zvířata, včetně muflonů, motýlů nebo jelenů.
No, DALL-E doesn’t have a secret language.
— Benjamin Hilton (@benjamin_hilton) May 31, 2022
(or at least, we haven't found one yet)
This viral DALL-E thread has some pretty astounding claims. But maybe the reason they’re so astounding is that, for the most part, they're not true.
Thread 👇🧵 (1/15)https://t.co/8F2WDp7lTK
Pokud navíc k objeveným termínům přidal další slova, jako kreslený obrázek nebo 3D render, byly výsledky ještě divočejší. Jediné, s čím Hamilton souhlasí, je správné zobrazování výlučně „ptačích“ výsledků po zadání „Apoploe vesrreaitais“, vše ostatní ale označuje za šum či nedokonalá spojování zdánlivě nesourodých výsledků pod jedno slovo.
Ani to ovšem nevylučuje fázi vytváření jednotlivých slov a zdokonalování jazyka, který se vyvíjí autonomně tak, jak se umělá inteligence postupně učí nové věci. Způsob tréninku, jak se v této souvislosti proces označuje, totiž nemají lidští tvůrci pod kontrolou, když nechávají problémy vyhodnocovat samotný systém. Veškerá snaha Dall·E tak může díky tomu vést k plnohodnotnému jazyku, stejně jako k naprostému rozpadu a zanechání zdokonalování této větve.
Zdroj: Science Alert, The Register