Umelá inteligencia si vyskúšala 44 povolaní. Výsledky prekvapili aj odborníkov

Tento test ukázal, čo všetko už AI dokáže.


Každý má svoj názor na to, ako veľmi AI ohrozí ľudské pracovné miesta. Niekto tvrdí, že stroje nikdy nenahradia kreativitu človeka, iní zas, že o pár rokov budeme všetci pracovať pre algoritmy. Lenže realita sa ukazuje byť oveľa zaujímavejšia.

ČLÁNOK POKRAČUJE POD REKLAMOU

OpenAI, spoločnosť stojaca za ChatGPT, totiž urobila experiment v skutočnom svete práce – nie na akademických testoch, ale priamo na úlohách, ktoré bežne riešia ľudia v desiatkach profesií. A výsledky naznačujú, že umelej inteligencii sa začína dariť aj tam, kde sme to nečakali.

Nový test s názvom GDPval

OpenAI predstavila nové hodnotenie s názvom GDPval, ktoré meria, ako dobre si AI modely vedú pri reálnych, ekonomicky dôležitých úlohách. Názov odkazuje na HDP – teda hrubý domáci produkt – pretože práve z odvetví, ktoré najviac prispievajú k HDP, výskumníci vybrali reprezentatívne profesie.

GDPval pokrýva 44 povolaní z deviatich kľúčových sektorov, vrátane zdravotníctva, financií, práva, médií či výroby. Medzi testované profesie patria napríklad advokáti, novinári, inžinieri, sestry, účtovníci aj vývojári softvéru.

Každé povolanie dostalo realistické úlohy – napríklad pripraviť právny dokument, zhodnotiť finančný plán, navrhnúť technické riešenie alebo upraviť text článku. Úlohy navrhli odborníci s v priemere 14 rokmi skúseností, aby čo najlepšie vystihovali reálnu prax.

ČLÁNOK POKRAČUJE POD REKLAMOU

Ako test prebiehal

Na každom z viac ako 1 300 úloh sa zúčastnili najvyspelejšie modely umelej inteligencie – GPT-5, Claude Opus 4.1, Gemini 2.5 Pro, Grok 4 a ďalšie. Následne sa ich výstupy porovnávali s prácou ľudí, pričom hodnotitelia nevedeli, ktorý text vytvoril človek a ktorý AI.

Odborníci mali určiť, ktorý výsledok je lepší, rovnako dobrý alebo horší. Okrem toho vznikol aj automatizovaný systém hodnotenia, ktorý predpovedá, ako by výstup zhodnotili ľudia.

A teraz to najzaujímavejšie: najnovšie modely sa už veľmi približujú kvalite profesionálov. Niektoré výstupy dokonca odborníci ohodnotili ako lepšie než ľudské.

GPT-5 zvíťazil v presnosti, Claude v estetike

Z testu vyplynulo, že Claude Opus 4.1 bol najúspešnejší v oblasti vzhľadu a štruktúry (napríklad formátovanie dokumentov či prezentácií), zatiaľ čo GPT-5 vynikal v presnosti a faktickej správnosti.

Výkon modelov sa pritom za jediný rok viac než zdvojnásobil – medzi GPT-4o (jar 2024) a GPT-5 (leto 2025) je vidieť jasný, lineárny rast schopností. Navyše, AI zvládla tieto úlohy až stokrát rýchlejšie a lacnejšie než človek – hoci výskumníci dodávajú, že to nezahŕňa čas potrebný na dohľad a integráciu do reálnej práce.

ČLÁNOK POKRAČUJE POD REKLAMOU

Mohlo by ťa zaujímať:

Umelá inteligencia naberá vlastný rozum. Odborníci varujú pred budúcnosťou, v ktorej pre ľudí nie je miesto

Čo to znamená pre ľudí

GDPval ukazuje, že umelá inteligencia je dnes schopná zvládať rutinné, presne definované úlohy, čím môže odbremeniť ľudí od monotónnej práce. V praxi to znamená, že učitelia, právnici či manažéri môžu mať viac času na kreatívne a strategické časti svojej práce.

OpenAI tvrdí, že cieľom nie je nahradiť ľudí, ale „udržať všetkých vo výťahu smerujúcom hore“ – teda využívať AI tak, aby z nej profitovali všetci, nie len technologické elity.

GDPval je zatiaľ len prvý krok. Budúce verzie by mali zahŕňať aj interaktívne úlohy, viac odvetví a situácie, kde AI musí reagovať na nejasné zadania či spätnú väzbu.

Zatiaľ je však jasné jedno – umelá inteligencia sa už dávno nehrá na šachy alebo písanie básní. Teraz zvláda aj úlohy, ktoré doposiaľ patrili výlučne ľuďom.


Tagy:
REKLAMA
Henrieta Balázsová
Som spravodajská redaktorka EMEFKA a venujem sa aktuálnemu dianiu, spoločenským témam aj virálnym príbehom. Milujem dobrú kávu, knihy a svoje dve mačky.Okrem spravodajstva sa venujem aj umeleckým textom a fascinujú ma emócie, medziľudské vzťahy a veci, ktoré sa nedajú vygoogliť. Písanie pre mňa znamená spôsob, ako dávať svetu zmysel a sprostredkovať čitateľom obsah, ktorý ich zaujme a inšpiruje.
Najčítanejšie
Podobné