V rozhovoru se specialistou Honzou Hovorou jsme nahlédli do zákulisí vývoje v NVIDIA, probrali směřování firmy k AI i tomu, na čem nyní pracuje.
NVIDIA se v posledních letech stává synonymem pro vývoj v oblasti umělé inteligence. Z firmy, která dříve cílila především na hráče a vývojáře grafických aplikací, se transformuje v technologického lídra, který své čipy a výpočetní systémy směřuje téměř výhradně na oblast AI. Tento posun je zřetelný i z letošního veletrhu CES, kde NVIDIA představila zmenšenou verzi výpočetní stanice DGX – nový produkt Digits, určený právě pro AI výpočty.
I když vývoj čipů pro AI přináší obrovské výkonnostní skoky v oblastech jako strojové učení či neuronové sítě, přechod od čisté grafiky k AI znamená i kompromisy. Pro profesionály zaměřené na počítačovou grafiku nebo rozšířenou realitu přináší tato změna určité zklamání. Nové architektury jsou totiž optimalizované pro 4bitové operace typické pro AI, nikoliv pro vizuální výpočty v reálném čase, kde je klíčová nízká latence a vysoký hrubý výkon.
Jedním z nejdiskutovanějších produktů byla výpočetní jednotka Digits – zmenšený DGX, který umožňuje běh AI modelů i mimo datová centra. Cílové nasazení je především tam, kde není možné data posílat do cloudu, například v medicíně, při vývoji autonomních systémů nebo ve státních agenturách s důrazem na bezpečnost. Cena zařízení se může lišit podle konfigurace, ale jeho přístupnost pro menší instituce může být revoluční.
Zároveň se však ukazuje, že NVIDIA díky svým technologiím jako CUDA nebo řešením paměťového sdílení mezi více GPU prakticky nemá konkurenci v některých oblastech. Vývojáři, kteří potřebují provozovat složité výpočty nebo rendering v reálném čase, jsou tak de facto závislí na jejich platformě. Omniverse, který měl být jednotným rozhraním pro simulace a sdílení dat mezi aplikacemi, zatím nenaplnil očekávání – projekt trpí nedostatečným vývojem a funguje spíše jako marketingový nástroj než spolehlivé vývojové prostředí.
Honza Hovora podrobně popsal zásadní problém v oblasti rozšířené reality – roztříštěnost a nekompatibilitu. AR brýle od různých výrobců (Apple, Microsoft, Meta…) nejsou vzájemně kompatibilní a většina podnikových aplikací vyžaduje přepis do specifických engine jako Unity nebo Unreal. Pro dlouhodobě vyvíjené profesionální software, například pro medicínu, je to zcela nereálné.
Řešením je vrstva, která umožní aplikacím běžet nezávisle na konkrétním headsetu. Právě na tomto konceptu pracuje tým v Moza, který vyvinul vlastní pipeline pro přenos dat z existujících 3D aplikací přímo do různých brýlí – a to bez zásahu do kódu původní aplikace. Uživatel tak dostává výstup ve 3D prostoru bez nutnosti přepisovat celý software. To by mohlo znamenat průlom v rozšíření AR/VR ve vážných oborech jako je armáda, medicína nebo průmysl.
Budoucnost 3D grafiky zřejmě patří technice Gaussian Splat. Oproti tradičnímu vykreslování polygonů nebo point cloudům přináší tento přístup vyšší vizuální kvalitu a schopnost věrně zobrazovat jemné struktury, jako jsou dráty, listí nebo skleněné povrchy. Gaussiany jsou v podstatě „razítka“ s informací o barvě, směru světla a pozorovacím úhlu, což umožňuje realistické vykreslení s nižšími nároky na datovou velikost.
Nevýhodou je vyšší výpočetní náročnost a problematické zapojení do dynamického prostředí (například her). Nicméně už dnes tuto technologii používají firmy jako Vario pro streamování vysokorealistických scén. Uplatnění najde v mapování, fotogrametrii nebo zobrazování reálného světa ve virtuálním prostoru. Přestože NVIDIA zatím tento směr ignoruje ve prospěch AI, vývojáři věří, že dříve či později vznikne i hardwarová podpora pro tuto metodu.
S rostoucí popularitou AI asistentů se objevují nové typy brýlí, zaměřené především na notifikace, překlady či interakci s digitálním světem přes hlas. Tyto smartglasses mají často jen malé zorné pole a monokulární displej, ale bojují za nízkou cenu a nízkou hmotnost. Tlak technologických gigantů na dodavatele optiky paradoxně brzdí vývoj AR brýlí s větším zorným polem, potřebným pro skutečné AR aplikace.
Zároveň však vývojáři jako tým Moza neztrácejí naději – jejich přístup ke standardizaci by mohl otevřít cestu k univerzálnímu využití brýlí v profesionální sféře. Klíčem je nezávislost aplikací na konkrétním hardwaru. Jak se AI asistenti stanou běžnou součástí brýlí, poroste i tlak na jejich funkčnost v rozšířené realitě. Spojení AI, AR a specializovaného software může v příštích letech přinést zásadní změny v mnoha odvětvích.
NVIDIA jednoznačně sází na AI, a i když to znamená odklon od čistě grafických výpočtů, přináší to nové možnosti pro vývoj autonomních systémů i simulací. Nové produkty jako Digits nebo koncepty jako Gaussian Splat ukazují, kam se ubírá budoucnost výpočetního výkonu. Rozšířená realita však zatím trpí absencí standardizace, což brání jejímu širšímu uplatnění. Řešení přinášejí nezávislé vývojové týmy s vizí univerzální platformy. Více detailů a ukázek z vývoje najdete ve videu, které doporučujeme zhlédnout celé.
Jsem šéfredaktor serveru zaměřeného na elektromobilitu, oblast, která představuje budoucnost dopravy. Moje vášeň pro technologii a udržitelný rozvoj mě přivedla k tomuto zaměření, kde mohu spojit svůj zájem o inovace s odpovědností vůči životnímu prostředí.
Autor
Jan Piechaczek