Dobrý den, vážení čtenáři,
Google na konferenci Cloud Next 25 ukázal svůj nový serverový čip pro umělou inteligenci. Ironwood má Googlu samotnému i jeho zákazníkům přinést až dvojnásobný výpočetní výkon při stejné spotřebě. Ne ve všech situacích, ale i tak jde o slušný pokrok, který neudělá radost dominantní Nvidii.
Nové čipy mají umožnit firmám provozovat velké jazykové modely soukromě, ve vlastních datacentrech nebo přímo v kancelářích. Platí to alespoň pro nový „přemýšlivý“ model Gemini 2.5 Flash, efektivnější verzi modelu Gemini 2.5, který aktuálně dostal Google na čelo srovnávacích tabulek.
Ironwood a Gemini přitom patří k sobě. Google si vyvíjí vlastní čipy právě proto, aby měl k dispozici optimalizovaný ekosystém. Nová generace AI akcelerátorů od Googlu tak obsahuje prvky, které přímo podporují rychlé výpočty spojené s „přemýšlením“ umělé inteligence.
Výsledkem je efektivní snížení spotřeby na polovinu proti loňské generaci čipů Trillium. A ve srovnání s první generací „cloudových“ čipů od Googlu má Ironwood téměř třicetinásobně menší spotřebu při stejném výkonu.
Pomůže k tomu rychlejší paměť i fakt, že firma naskládá více čipů do stejného prostoru, takže spotřeba elektřiny spojená s chlazením bude moci klesnout. Do jednoho svazku s rychlým propojením mezi čipy se má vejít až 9216 výpočetních jednotek. Google nové stroje nebude využívat pouze pro sebe, ale bude je i pronajímat, a to ve verzích se 256 čipy v jednom serveru a v plném „clusteru“ s devíti tisíci čipů.
Jeden takový cluster disponuje špičkovým výkonem 42,5 exaflopu, tedy 42,5 trilionu operací za sekundu (1 trilion je jednička následovaná 18 nulami). Každý jeden čip Ironwood pak má výkon 4,614 teraflopu, tedy 4,614 bilionu operací za sekundu. Aby si takový výkon čipy mohly udržet déle a nedošla jim data ke zpracování, podporuje nový hardware využití 192 GB vysokorychlostní paměti pro každý čip, šestinásobek kapacity paměti u loňských čipů Trillium.
Součástí čipů Ironwood je také akcelerátor SparseCore používaný u náročnějších úloh založených na třídění a doporučování hodnot ve velkých databázích. Potřebné jsou například v AI úlohách pro finanční sektor a vědu a výzkum.
Nové čipy, nové modely
Nejvýraznější přínos nových čipů uvidíme nejspíše za rok, a to v podobě další generace velkých jazykových modelů od Googlu. Firma teprve na konci března vypustila do světa v experimentální verzi Gemini 2.5 Pro, svůj pokročilý přemýšlivý model. S ním se Gemini dostala z dlouhodobé role otloukánka na trhu systémů umělé inteligence na jeho špičku.
K vývoji tohoto modelu posloužily loňské čipy Trillium. Nové čipy Ironwood budou sloužit pro vývoj nové generace Gemini, jak to dopadne, zatím není jisté. Dopad další generace Gemini bude záležet na tom, kam se za stejnou dobu posune konkurence.
Spolu s novými čipy Google na konferenci Next Cloud 25 představil také nového člena rodiny Gemini 2.5 s označením Flash. Google ho definuje jako „pracanta“ s nízkou latencí a cenou. Optimální využití Gemini 2.5 Flash vidí firma v roli virtuálních asistentů a nástrojů na vytváření souhrnů velkého množství textů a dalších dat.
I Flash zatím existuje v experimentální fázi a Google jej zatím nenabízí na webu ani v aplikaci Gemini. První zákazníci se k němu dostanou ve službě Vertex AI.
Google podobně jako OpenAI u svého přemýšlivého modelu o3-mini nabízí firemním zákazníkům a vývojářům možnost nastavit chování tohoto modelu tak, aby využíval pro různé typy požadavků odlišné množství výpočetního výkonu. To pomáhá udržovat nižší ceny a zároveň v případě potřeby poskytuje kvalitnější výstupy umělé inteligence, která zjednodušeně řečeno dostane více času na přemýšlení.
Gemini do firem i rodiny
Menší výpočetní nároky Gemini 2.5 Flash umožní také provoz mimo datová centra Googlu. Ke zpřístupnění této možnosti by mělo dojít na podzim letošního roku v rámci Google Distributed Cloudu. Jde o program umožňující instalaci řešení Googlu ve vlastních datacentrech nebo serverovnách konkrétních zákazníků, kteří mají extrémní požadavky na zabezpečení dat, například pro vládní organizace a bezpečnostní složky.
Google nyní pracuje s Nvidií, aby zajistil podporu Gemini 2.5 Flash na kompatibilních systémech s čipy Nvidia Blackwell, které pak bude nabízet buď přímo Google, nebo vybraní prodejní partneři Nvidie. To zároveň znamená, že se Gemini 2.5 Flash zatím nedostane na „domácí“ systémy, alespoň do chvíle, než Nvidia začne prodávat svůj stolní superpočítač.
Cloudová verze Gemini se nicméně dostane k zákazníkům také, a v nové podobě. Samsung s Googlem na konferenci Cloud Next 25 představily kulatého robota Ballie s konverzační verzí Gemini, který má fungovat podobně jako Gemini v mobilních telefonech – jako osobní informační asistent. Na trh se Ballie má dostat v létě, pravděpodobně společně s novou generací skládacích telefonů řady Galaxy Z.
***
Zajímavé věci se děly i v Česku. Zoner vydal novou verzi svého grafického nástroje ZPS X. Jeho součástí je nová generace AI nástrojů s podporou lokálních úprav fotografií s použitím masek a s možností použít stejné procesy na celé série fotek. Lepší jsou i nástroje na tvorbu koláží nebo tvorbu foto obrazů rozdělených na více pláten. Stále platí, že Zoner Photo Studio pokračuje v obchodním modelu založeném na předplatném. ZPS 18, poslední s jednorázovým nákupem licence, naštěstí stále funguje.
***
Microsoft s téměř ročním zpožděním od původního oznámení začíná distribuovat Preview verzi funkce Recall pro Windows 11 na počítačích s čipy s podporou umělé inteligence, primárně s procesory Snapdragon X. Experiment s Windows na architektuře ARM nicméně po necelém roce nepřinesl revoluci, ve kterou Microsoft doufal, a to kvůli cenám a omezené možnosti hraní. ARMu se daří jen ve specifické kategorii laptopů s cenou nad 800 dolarů, kde Snapdragony X na americkém trhu dosáhly 10% podílu.
|