Nvidia na veletrhu CES v Las Vegas odhalila, že nová generace akcelerátorů pro umělou inteligenci s názvem Rubin je už ve výrobě a první zákazníci se k ní mají dostat v nejbližších měsících. Podle šéfa firmy Jensena Huanga by nasazení ve velkém mělo připadnout na druhou polovinu roku, což je v kontextu rychle se rozvíjejícího „AI závodu“ klíčová zpráva pro poskytovatele cloudu i provozovatele datových center.
Skok ve výkonu: trénování 3,5×, provoz až 5×
Huang na CES popsal, že Rubin má proti předchozí generaci Blackwell přinést výrazný posun ve dvou nejdůležitějších metrikách. Při trénování modelů má být zhruba 3,5krát rychlejší, při samotném provozu (inference) pak až pětkrát rychlejší. Právě inference dnes roste nejrychleji: firmy nasazují stále složitější systémy, které už nejsou jedním modelem, ale sítí specializovaných komponent řešících úlohy ve více krocích.
„Poptávka je opravdu vysoká,“ zaznělo od Huanga jako jeden z důvodů, proč Nvidia zveřejňuje detaily dříve než obvykle.
Nvidia tím reaguje i na nervozitu trhu. Zatímco investice do AI infrastruktury v posledních letech explodovaly, čím dál častěji se mluví o sílící konkurenci a o tom, že část zákazníků si vyvíjí vlastní akcelerátory. Typicky jde o giganty typu Google nebo Amazon, kteří si chtějí udržet kontrolu nad náklady i technologickou nezávislost.
Nový CPU s 88 jádry a levnější provoz celého systému
Vedle GPU Nvidia ukázala i posun na straně procesorů: nový CPU má mít 88 jader a nabídnout dvojnásobný výkon oproti předchozí generaci. Rubin se má stát součástí superpočítačových konfigurací DGX SuperPod, ale bude dostupný i jako samostatný produkt pro datová centra.
Důležitý slib se netýká jen hrubého výkonu, ale ekonomiky provozu. Nvidia tvrdí, že systémy postavené na Rubinu mohou dosahovat stejných výsledků s menším počtem komponent a tím pádem zlevnit provoz oproti Blackwellu. Mezi prvními zákazníky, kteří mají Rubin otestovat a následně nasadit, mají být Microsoft, Google Cloud a AWS.
Čína, licence a silná poptávka po H200
Nvidia zároveň naznačila, že situace kolem exportu do Číny zůstává citlivá. Firma čeká na rozhodnutí americké vlády o licencích, které mohou dodávky omezovat. Současně ale zdůrazňuje, že poptávka po starších čipech je stále vysoká a že například o H200 je v Číně silný zájem. Podle vyjádření společnosti má mít Nvidia dostatek zásob tak, aby případné dodávky pro čínské zákazníky neohrožovaly ostatní trhy.
Fyzická AI: roboti a průmysl za 50 bilionů $ (1 000 bilionů Kč)
CES ale nebyl jen o datových centrech. Nvidia se snaží posílit vyprávění o tom, že další velkou vlnou bude takzvaná fyzická AI, tedy umělá inteligence zhmotněná v robotech, výrobních linkách a autonomních strojích. Podle firmy může proměnit výrobu a logistiku, tedy sektor v hodnotě 50 bilionů $ (1 000 bilionů Kč).
Huang uvedl, že technologie Nvidie využívají hráči jako Boston Dynamics, Caterpillar, LG Electronics nebo NEURA Robotics. Vedle nových AI modelů pro trénování robotů firma představila také konkrétní systém Alpamayo zaměřený na zlepšování samořídicích technologií. Vzkaz je zřejmý: Nvidia chce být nejen „motorem“ generativní AI v cloudu, ale i základní výpočetní platformou pro stroje, které budou AI přenášet do reálného světa.
Zdroj: patria.cz