Umelá inteligencia patrí medzi horúce témy súčasnosti. Niekto sa na ňu pozerá ako na užitočný nástroj, iní sú v otázkach jej využitia skôr skeptickí. Obzvlášť kontroverzné je vnímanie umelej inteligencie v umeleckej sfére. Nech je ako chce, ide o fenomén, ktorý tu s nami nepochybne ostane a zrejme sa s ním budeme musieť naučiť pracovať. Ako uvádza aj portál Tlačovej agentúry Slovenskej republiky (TASR) TERAZ, nedávno sa v tejto oblasti uskutočnil ďalší zaujímavý výskum. Ten sa zameral na to, ktorý jazyk je pri zadávaní otázok umelej inteligencii najvhodnejší.
Túto otázku skúmali vedci na Marylandskej univerzite v americkom Baltimore v spoluprácii so spoločnosťou Microsoft. V rámci experimentu porovnávali celkom 26 rôznych jazykov, pričom výsledky zverejnili v rámci nového benchmarku OneRuler. Ten testuje schopnosť veľkých jazykových modelov spracovávať dlhé textové vstupy. Pokiaľ si myslíš, že najlepším jazykom na zadávanie príkazov umelej inteligencii bude jednoznačne angličtina (prípadne iný z veľkých jazykov), výsledky analýzy ťa zrejme prekvapia.
Ani angličtina, ani francúzština. Výsledky prekvapili
Na prvom mieste sa totiž umiestnila poľština! Spomínaná angličtina skončila až na šiestom mieste, pričom poľština za sebou nechala aj také jazyky ako taliančina či francúzština. Štúdia vyšla pod názvom „One ruler to measure them all: Benchmarking multilingual long-context language models“ (Jedno kritérium pre všetky jazyky: Meranie viacjazyčných modelov s dlhým kontextom). Jej autori uvádzajú, že poľština dosiahla priemernú úspešnosť 88 %. Naproti tomu angličtina dosiahla necelých 84 %. Na prvý pohľad to neznamená veľký pokles, v danom rebríčku však angličtina skončila až na šiestom mieste.

Pozoruhodné to je preto, lebo modely umelej inteligencie sa zvyčajne trénujú na najväčšom množstve dát práve v angličtine. Trénujú však napríklad aj v čínštine, ktorá vo výskume tiež príliš nezahviezdila. Umiestnila sa totiž až na štvrtom mieste od konca. Jej úspešnosť dosiahla len 62 %. Skúmanie vhodnosti jazykov prebiehalo na siedmich typoch úloh. Tie rozdelili do kategórií vyhľadávania a agregácie s kontextami od 8-tisíc do 12-tisíc tokenov. Experti prišli na to, že čím je kontext dlhší, tým viac sa prehlbuje rozdiel vo výkonnosti medzi tzv. vysokozdrojovými jazykmi (ako sú tie európske) a nízkozdrojovými (kam patrí napríklad swahilčina či sothčina). Rozdiel sa zvýšil z 11 na 34 percent pri najdlhších textoch.
Hoci jazykové modely sa po poľsky učia len na obmedzenom množstve dát, napriek tomu dosiahli práve v tomto jazyku vyššiu presnosť odpovedí, menej chýb a lepšie výsledky pri analýze rozsiahlych dokumentov. Podľa autorov štúdie sa teda práve poľština stala najvhodnejším jazykom na takzvané promptovanie, teda zadávanie dlhých a komplexných otázok umelej inteligencii.





















