Každý má svoj názor na to, ako veľmi AI ohrozí ľudské pracovné miesta. Niekto tvrdí, že stroje nikdy nenahradia kreativitu človeka, iní zas, že o pár rokov budeme všetci pracovať pre algoritmy. Lenže realita sa ukazuje byť oveľa zaujímavejšia.
OpenAI, spoločnosť stojaca za ChatGPT, totiž urobila experiment v skutočnom svete práce – nie na akademických testoch, ale priamo na úlohách, ktoré bežne riešia ľudia v desiatkach profesií. A výsledky naznačujú, že umelej inteligencii sa začína dariť aj tam, kde sme to nečakali.
Nový test s názvom GDPval
OpenAI predstavila nové hodnotenie s názvom GDPval, ktoré meria, ako dobre si AI modely vedú pri reálnych, ekonomicky dôležitých úlohách. Názov odkazuje na HDP – teda hrubý domáci produkt – pretože práve z odvetví, ktoré najviac prispievajú k HDP, výskumníci vybrali reprezentatívne profesie.
GDPval pokrýva 44 povolaní z deviatich kľúčových sektorov, vrátane zdravotníctva, financií, práva, médií či výroby. Medzi testované profesie patria napríklad advokáti, novinári, inžinieri, sestry, účtovníci aj vývojári softvéru.
Každé povolanie dostalo realistické úlohy – napríklad pripraviť právny dokument, zhodnotiť finančný plán, navrhnúť technické riešenie alebo upraviť text článku. Úlohy navrhli odborníci s v priemere 14 rokmi skúseností, aby čo najlepšie vystihovali reálnu prax.

Ako test prebiehal
Na každom z viac ako 1 300 úloh sa zúčastnili najvyspelejšie modely umelej inteligencie – GPT-5, Claude Opus 4.1, Gemini 2.5 Pro, Grok 4 a ďalšie. Následne sa ich výstupy porovnávali s prácou ľudí, pričom hodnotitelia nevedeli, ktorý text vytvoril človek a ktorý AI.
Odborníci mali určiť, ktorý výsledok je lepší, rovnako dobrý alebo horší. Okrem toho vznikol aj automatizovaný systém hodnotenia, ktorý predpovedá, ako by výstup zhodnotili ľudia.
A teraz to najzaujímavejšie: najnovšie modely sa už veľmi približujú kvalite profesionálov. Niektoré výstupy dokonca odborníci ohodnotili ako lepšie než ľudské.
GPT-5 zvíťazil v presnosti, Claude v estetike
Z testu vyplynulo, že Claude Opus 4.1 bol najúspešnejší v oblasti vzhľadu a štruktúry (napríklad formátovanie dokumentov či prezentácií), zatiaľ čo GPT-5 vynikal v presnosti a faktickej správnosti.
Výkon modelov sa pritom za jediný rok viac než zdvojnásobil – medzi GPT-4o (jar 2024) a GPT-5 (leto 2025) je vidieť jasný, lineárny rast schopností. Navyše, AI zvládla tieto úlohy až stokrát rýchlejšie a lacnejšie než človek – hoci výskumníci dodávajú, že to nezahŕňa čas potrebný na dohľad a integráciu do reálnej práce.
Čo to znamená pre ľudí
GDPval ukazuje, že umelá inteligencia je dnes schopná zvládať rutinné, presne definované úlohy, čím môže odbremeniť ľudí od monotónnej práce. V praxi to znamená, že učitelia, právnici či manažéri môžu mať viac času na kreatívne a strategické časti svojej práce.
OpenAI tvrdí, že cieľom nie je nahradiť ľudí, ale „udržať všetkých vo výťahu smerujúcom hore“ – teda využívať AI tak, aby z nej profitovali všetci, nie len technologické elity.
GDPval je zatiaľ len prvý krok. Budúce verzie by mali zahŕňať aj interaktívne úlohy, viac odvetví a situácie, kde AI musí reagovať na nejasné zadania či spätnú väzbu.
Zatiaľ je však jasné jedno – umelá inteligencia sa už dávno nehrá na šachy alebo písanie básní. Teraz zvláda aj úlohy, ktoré doposiaľ patrili výlučne ľuďom.