Google šokuje svet: Nový AI nástroj dokáže niečo, čo grafici roky považovali za nemožné

Tento model posúva hranice umelej inteligencie na úplne novú úroveň.


Google opäť posúva hranice umelej inteligencie. Predstavil Gemini 2.5 Flash Image – svoj najnovší model na generovanie a úpravu obrázkov, ktorý je podľa expertov najvyspelejším nástrojom, aký má doteraz vo svojom portfóliu. Novinka nadväzuje na úspech Gemini 2.0 Flash, no prináša zásadné zlepšenia, ktoré vývojári i bežní používatelia dlhodobo žiadali.

Ak si si myslel, že AI dokáže len „pekne kresliť“, priprav sa na prekvapenie. Gemini 2.5 Flash Image spája rýchlosť, kvalitu, konzistentnosť a reálne znalosti o svete, vďaka čomu vznikajú úplne nové možnosti vizuálnej tvorby. Google o novinke informuje na svojom blogu.

Čo všetko dokáže Gemini 2.5 Flash Image

Kľúčovou vlastnosťou je schopnosť udržať konzistentný vzhľad postavy alebo objektu naprieč rôznymi obrázkami. Znamená to, že vytvoríš postavu a môžeš ju vložiť do desiatok rôznych scén, pričom si vždy zachová svoju tvár, pózu či štýl. Tento prístup je ideálny pre tvorcov príbehov, marketérov alebo značky, ktoré potrebujú jednotnú vizuálnu identitu.

Model zároveň výborne pracuje s vizuálnymi šablónami – od zamestnaneckých preukazov až po celé katalógy produktov. Stačí jeden návrh a Gemini dokáže automaticky vytvoriť desiatky variantov.

Jednoduché príkazy namiesto zložitej grafiky

Jednou z najväčších výhod je, že Gemini rozumie prirodzenému jazyku. Nemusíš sa trápiť s maskovaním či desiatkami filtrov v grafickom programe. Stačí, ak napíšeš príkaz, a model urobí presne to, čo potrebuješ.

Shutterstock

Od rozmazania pozadia cez odstránenie osoby až po zafarbenie čiernobielej fotografie – všetko zvládneš pár slovami. To z Gemini robí skutočný nástroj pre každého, nielen pre profesionálov.

Ďalšou novinkou je multi-image fusion – schopnosť zlúčiť viacero obrázkov do jedného. Môžeš vložiť predmet do inej scény, upraviť interiér izby podľa svojej predstavy alebo vytvoriť úplne nový, realistický obraz zo štyroch rôznych vstupov.

AI, ktorá rozumie svetu

Na rozdiel od predchádzajúcich generátorov obrázkov, ktoré síce vyzerali esteticky, no často postrádali logiku, Gemini 2.5 Flash Image využíva hlboké znalosti sveta. Vie rozpoznať náčrty, pochopiť diagramy a reagovať na komplexné inštrukcie. V praxi to znamená, že okrem umeleckých diel zvládne aj edukatívne alebo praktické úlohy.

Mohlo by ťa zaujímať:

Ktoré povolania nahradí umelá inteligencia? Tieto vlastnosti a zručnosti ti zaručia, že o prácu neprídeš

Cena a dostupnosť

Model je už dostupný cez Gemini API, Google AI Studio a Vertex AI. Cena je nastavená na 30 dolárov za milión výstupných tokenov, čo vychádza približne na 0,039 dolára za jednu vygenerovanú snímku.

Google zároveň garantuje transparentnosť – každý obrázok vytvorený či upravený modelom obsahuje neviditeľný digitálny vodoznak SynthID, ktorý ho označí ako AI obsah.

Prečo je to prelom

Gemini 2.5 Flash Image nie je len ďalší generátor obrázkov. Je to plnohodnotný tvorivý nástroj, ktorý kombinuje rýchlosť, kvalitu a presnosť s možnosťou intuitívneho ovládania cez príkazy v prirodzenom jazyku.

Či už si vývojár, dizajnér alebo len nadšenec umelej inteligencie, tento model ti otvára dvere k tvorbe, aká tu ešte nebola. Google s ním ukazuje, že budúcnosť vizuálneho obsahu sa rodí práve teraz.

  1. Vyskúšaš si tento nový nástroj?

    1. Určite áno
    2. Nie, nemám záujem
    3 hlas(y/ov)
    Share Your Result

Tagy:
Henrieta Balázsová
Žijem s novinárskym perom v ruke a nebojím sa ponoriť do rôznorodých tém. Od aktuálneho diania cez záhadné kriminálne prípady až po fascinujúce zákutia ľudskej psychiky - všetko je pre mňa inšpiráciou.
Najčítanejšie
Podobné