Tesla ruší Dojo a sází na AI budoucnost

Ondřej Bačina s expertem na počítačové vidění Janem Hovoru rozebírají zrušení projektu DOJO a Tesla Robotaxi vs Waymo.

25.8.2025

Konec projektu Dojo

Tesla nedávno oficiálně oznámila ukončení vývoje vlastního trénovacího superpočítače Dojo. Tento krok vyvolal řadu otázek i spekulací. Dojo měl být specializovaný hardware zaměřený na trénování modelů pro autopilota Tesly, navržený na míru pro zpracování video dat. Vzhledem k vývoji v oblasti umělé inteligence a rostoucím možnostem konkurenčních platforem, zejména těch od NVIDIE, se ale tato strategie ukázala jako dlouhodobě neudržitelná.

Rozhodnutí ukončit Dojo tak odráží hlubší změnu v přístupu Tesly – přechod od jednoúčelových systémů k univerzálním architekturám. Elon Musk si pravděpodobně uvědomil, že technologický vývoj v oblasti AI běží natolik rychlým tempem, že stavět vlastní infrastrukturu na specifickou architekturu nedává smysl. Namísto toho bude Tesla spoléhat na flexibilnější řešení, která se dokáží přizpůsobit novým modelům i způsobům trénování.

AI trénink za běhu

Jedním z hlavních témat diskuse bylo, jakým směrem se ubírá vývoj umělé inteligence. Zásadní je především otázka, zda budoucí modely budou potřebovat schopnost učit se za běhu – tedy v průběhu interakce s uživateli. Takové systémy by musely kombinovat inferenci (odpovídání) s neustálým trénováním, čímž by se rozmazával rozdíl mezi dvěma dříve oddělenými procesy.

V současnosti se objevuje trend oddělování tréninku od inference s cílem optimalizovat výpočetní výkon a snížit energetickou náročnost. Specializované inferenční čipy jsou energeticky úsporné, ale mají zásadní omezení – nejsou schopny adaptivního učení. Pokud se však AI systémy mají posunout směrem k AGI (obecné umělé inteligenci), bude nutné architekturu přepracovat tak, aby učení probíhalo paralelně s používáním.

NVIDIA zatím v tomto směru dominuje – její univerzální čipy H100 a H200 lze použít pro široké spektrum modelů. To vytváří výhodu nejen technologickou, ale i ekonomickou. Tesla se tak zřejmě rozhodla nevést drahý boj na poli hardwaru a soustředit se raději na softwarové inovace. Projekt Dojo byl z hlediska vývoje, náboru specialistů i finančních nákladů velmi náročný a těžko konkurenceschopný vůči etablovaným gigantům jako právě NVIDIA.

Kamery, lidar a problém přesnosti

V oblasti autonomního řízení zůstává nevyřešená otázka: jak přesně musí systém vidět, aby mohl bezpečně řídit? Tesla sází na tzv. multiview stereo – tedy rekonstrukci 3D prostoru pomocí kamer. Tato metoda však trpí omezením: bez aktivního senzoru, jako je lidar nebo alespoň radar, není možné přesně určit velikost a vzdálenost objektů. Deep estimation, tedy odhad vzdálenosti pomocí neuronových sítí, je vždy jen tak přesný, jak kvalitní byla trénovací data.

Systémy jako Waymo, které používají lidar, pracují s absolutními daty. Díky tomu mají výhodu ve specifických situacích (tzv. edge cases), kde neuronka Tesly může selhat. Typickým příkladem je situace, kdy se stín na vozovce jeví jako překážka, nebo naopak, kdy systém neidentifikuje dítě kvůli nedostatečnému tréninku na daný objekt.

Výhoda Tesly spočívá v rozsahu dat, která sbírá, ale pro deep estimation to nestačí. Aby byl model přesný, potřebuje být trénován na absolutních měřeních, často právě z lidaru. I proto Tesla nasazuje testovací vozidla vybavená těmito senzory. To však zpochybňuje její tvrzení, že lze dosáhnout plné autonomie pouze pomocí kamer.

Evoluce neuronových sítí

Dalším zásadním bodem diskuze je trend přechodu od klasického videa k trénování přímo na 3D datech. NVIDIA na konferenci SIGGRAPH předvedla neuronové sítě, které pracují nikoliv s videem, ale s tzv. Gaussian Splatting – metodou, jež umožňuje generovat realistické 3D prostředí. To přináší velký potenciál zejména v robotice a autonomním řízení, kde lze trénovat modely synteticky, bez potřeby reálných senzorických dat.

Generování 3D scén přímo neuronovou sítí (například model Genie 3) posouvá možnosti modelů dále, než kam dosud sahala klasická AI. Trénování na reálné fyzice ustupuje tzv. prediktivnímu chování – systém se učí, že pokud se čtyřikrát něco stalo, očekává, že to nastane i popáté. Nejde o přesnou fyzikální simulaci, ale o statistické předpovědi, které jsou dostatečně přesné pro reálný provoz.

Tento směr však opět klade důraz na flexibilitu hardwaru. Pokud má AI trénovat na běhu, nebo generovat celé 3D světy, potřebuje výpočetní infrastrukturu, která je tomu přizpůsobená. Inferenční čipy bez možnosti průběžného tréninku zde brzy narazí na své limity.

Shrnutí

Tesla ruší Dojo a přizpůsobuje se dynamice vývoje v oblasti umělé inteligence. Místo jednoúčelového hardwaru volí univerzálnější řešení, která umožní adaptaci na nové architektury a přístupy k trénování modelů. Zásadní otázky ale zůstávají: Jak škálovat autonomní řízení bez lidaru? Jak řešit přesnost v různých regionech? A jak se vypořádat s edge casy, kde neuronka selhává? Budoucnost ukáže, zda je přístup Tesly udržitelný a jak se vyrovná s technologickými výzvami, kterým čelí. Více detailů a zasvěcených komentářů najdete v kompletním videu, které rozhodně doporučujeme ke zhlédnutí.

Jan Piechaczek

Šefredaktor

Jsem šéfredaktor serveru zaměřeného na elektromobilitu, oblast, která představuje budoucnost dopravy. Moje vášeň pro technologii a udržitelný rozvoj mě přivedla k tomuto zaměření, kde mohu spojit svůj zájem o inovace s odpovědností vůči životnímu prostředí.