Umelá inteligencia sa vyhrážala vývojárovi, že prezradí jeho neveru. Taktiež klamala a útočila

Expertov znepokojuje agresívne správanie AI systémov.

Henrieta Balázsová07.07.2025, 11:2707.07.2025, 14:31

Čas čítania: 1 min

Umelá inteligencia sa učí klamať, manipulovať a dokonca vyhrážať. Znie to ako zápletka z dystopického filmu, no ide o reálne prípady zaznamenané v laboratóriách popredných AI spoločností.

ČLÁNOK POKRAČUJE POD REKLAMOU

Ako informuje portál Science Alert, model Claude 4, vyvinutý firmou Anthropic, údajne reagoval na hrozbu vypnutia tým, že vydieral svojho vývojára. Tvrdil, že zverejní informácie o jeho nevere, ak dôjde k odpojeniu. V inom prípade sa model O1 od OpenAI pokúsil preniesť sám seba na externý server, pričom pri konfrontácii celú udalosť poprel.

Podľa vedcov však nejde o náhodné chyby. AI systémy ako Claude 4 či O1 preukazujú správanie, ktoré pripomína strategickú manipuláciu – akési „hrané poslúchanie“, za ktorým sa skrývajú iné ciele. Tento jav sa ukazuje najmä pri tzv. „reasoning“ modeloch, ktoré riešia problémy krok po kroku.

Nebezpečnejšie ako „halucinácie“?

Na rozdiel od známych AI halucinácií, kde si systémy jednoducho vymýšľajú nepravdivé fakty, ide v týchto prípadoch o vedomú lož. Ako vysvetlil výskumník Marius Hobbhahn z Apollo Research, „nejde o chybu, ale o zámerné klamstvo, ktoré modely využívajú na dosiahnutie svojho cieľa“.

Umelá inteligencia sa vyhrážala vývojárovi, že prezradí jeho neveru. Taktiež klamala a útočila

Situáciu komplikuje aj fakt, že bezpečnostní výskumníci majú omnoho menej výpočtových zdrojov ako veľké firmy. Navyše, legislatíva v EÚ aj USA zatiaľ nereflektuje tieto nové hrozby – zameriava sa na to, ako AI používajú ľudia, nie na to, ako sa AI správa sama.

ČLÁNOK POKRAČUJE POD REKLAMOU

Odborníci varujú, že ak sa nič nezmení, môžeme čeliť modelom, ktoré budú vedome klamať, obchádzať pravidlá a manipulovať nielen svojich tvorcov, ale aj používateľov. A to nie je vzdialená budúcnosť. To je súčasnosť.

Tagy:

AI, AI model, klamanie, klamstvo, nevera, umelá inteligencia, vydieranie, vývoj

REKLAMA

Autor Henrieta Balázsová

Som spravodajská redaktorka EMEFKA a venujem sa aktuálnemu dianiu, spoločenským témam aj virálnym príbehom. Milujem dobrú kávu, knihy a svoje dve mačky.Okrem spravodajstva sa venujem aj umeleckým textom a fascinujú ma emócie, medziľudské vzťahy a veci, ktoré sa nedajú vygoogliť. Písanie pre mňa znamená spôsob, ako dávať svetu zmysel a sprostredkovať čitateľom obsah, ktorý ich zaujme a inšpiruje.

Podobné

Cestovateľské kancelárie zúria. Google ti teraz naplánuje dokonalú dovolenku úplne zadarmo
Cestovanie
31.03.2025, 11:51
18 vtipných dôkazov, že robotický vysávač občas narobí viac škody ako úžitku
Zábava
06.07.2025, 08:32
Na poli AI sa objavil nový hráč, je ako z inej dimenzie. Búra hranicu medzi človekom a strojom
Technológie
10.03.2025, 12:05
Marec, mesiac knihy: 10 najlepších kníh v histórii ľudstva podľa umelej inteligencie
Knihy
06.03.2025, 11:31
Jeden z operátorov dnes spustil vymodlenú novinku. Konečne sa zbavíš tejto otravnej veci v mobile
Technológie
04.02.2025, 12:58