Ashok Elluswamy odhalil detailní pohled na vývoj Tesla AI, zatímco Ondřej Bačina jej doprovodil cenným komentářem a odbornými postřehy.
Tesla znovu rozvířila debatu o budoucnosti autonomního řízení. Na nedávné prezentaci, kterou vedl Ashok Elluswamy, vedoucí týmu Tesla AI, jsme získali unikátní vhled do zákulisí vývoje technologie, která už dnes umožňuje vozům Tesla samostatně jezdit po ulicích Austinu bez lidského dohledu. Ashok, který ve firmě působí už 12 let, podrobně vysvětlil, jak celý systém funguje pouze za použití kamer, bez potřeby LIDARu či dalších senzorů.
Ondřej Bačina, dlouholetý popularizátor témat umělé inteligence a autonomního řízení, prezentaci okomentoval a doplnil ji o souvislosti z předchozích dílů svého seriálu. Zvlášť důležitým bodem je podle něj posun Tesly od modulárních systémů k jediné end-to-end neuronové síti, která zpracovává video, zvuk i jízdní data a díky tomu dokáže chápat svět komplexněji než kdykoli dřív.
Tesla se vzdala tradiční architektury, kde jsou detekce objektů, plánování nebo predikce oddělené. Místo toho nasazuje jediný obrovský model, který vstřebává veškerá data a sám určuje, jak se vozidlo zachová. Tento přístup je sice odvážný, ale mimořádně účinný.
Model se učí jednat podobně jako člověk – například v situaci, kdy se musí rozhodnout mezi přejezdem do protisměru a objetím hluboké kaluže. Bačina zdůrazňuje, že právě tato schopnost chápat komplexní scénu a kontext je pro autonomii klíčová. Model navíc zohledňuje i akustické podněty, například zvuk sirén nebo cákání vody, což dosud nebylo běžné.
Tesla denně shromažďuje data odpovídající 500 letům řízení, ale zaměřuje se jen na situace, které jsou z hlediska tréninku neuronových sítí opravdu přínosné. Díky této selektivní strategii dokáže systém reagovat na extrémní situace, které se v běžném provozu vyskytují jen zřídka.
Jedním z nejpokročilejších nástrojů, který Ashok Elluswamy představil, je 3D simulátor světa – Tesla Reality Engine. Tento systém dokáže v reálném čase generovat 3D model prostředí na základě kamerových vstupů a předvídat chování jednotlivých objektů. Výhodou je možnost testovat scénáře, které by bylo ve skutečnosti příliš rizikové zkoušet.
Bačina poukázal na schopnost modelu například rozpoznat, že zpoza zaparkovaného auta může vyběhnout dítě, nebo že pohyb hasičského vozu vyžaduje přejetí plné čáry. Tesla také ukázala, že jejich model zvládá predikovat nehodu ještě dříve, než se skutečně stane – a automaticky začne brzdit.
Tesla Reality dokáže generovat 3D scénu z kamerových dat během 22 milisekund, zatímco tradiční techniky jako Gaussian Splatting potřebují i desítky minut. Díky tomu může být tento model využit v reálném provozu – a nejen k ladění v laboratoři.
Velkým problémem neuronových sítí bývá jejich „černá skříňka“. Tesla však vyvinula systém sond, které umožňují detailní analýzu rozhodovacího procesu. Ashok Elluswamy ukázal příklady, kde model sám vysvětluje, proč se rozhodl určitým způsobem – například na základě dopravního značení nebo chování ostatních účastníků provozu.
Bačina zdůrazňuje, že právě tento přístup umožnil Tesle dramaticky urychlit vývoj. Díky zpětné vazbě je možné systém efektivně ladit a zároveň předcházet regresím – tedy situacím, kdy by oprava jednoho problému způsobila jiný. Tento transparentní model „uvažování“ je využitelný i v dalších oblastech robotiky, včetně humanoidních robotů Optimus.
Pro hodnocení výstupů Tesla používá tzv. „simulátor světa“ – neuronovou síť, která dokáže generovat budoucí stavy na základě aktuální situace a provedené akce. Tímto způsobem může Tesla testovat nové modely na starých scénářích a ověřovat, zda došlo ke zlepšení.
Bačina upozorňuje, že pomocí těchto nástrojů může Tesla simulovat miliardy kilometrů jízdy bez nutnosti nasazení fyzických vozidel. Hardware Tesly je díky tomu trénován ve virtuálních scénářích, které jsou zcela realistické a umožňují simulaci extrémních nebo vzácných situací.
Simulace jsou rovněž základem pro vývoj robotických schopností – například manipulace s objekty nebo pohybu v interiéru. Tesla tak trénuje jeden unifikovaný model, který se uplatní nejen v autech, ale i v robotice obecně.
Ashok Elluswamy v závěru prezentace potvrdil dlouhodobou filozofii Tesly: autonomní řízení je problém umělé inteligence, nikoli senzoriky. Pokud lidé dokážou řídit vozidlo pouze za pomoci očí, mělo by to být možné i pro stroj. Kamery jsou jednoduché, levné a snadno integrovatelné. Klíčem je pouze dostatečně inteligentní software.
Bačina k tomu dodává, že Tesla tímto přístupem odmítá budovat zcela novou infrastrukturu – např. upravené křižovatky nebo doplňkové senzory. Řešení má být kompatibilní se světem, jaký existuje dnes. Tento postoj je sice kontroverzní, ale Tesla jej dlouhodobě prosazuje a výsledky naznačují, že se ubírá správným směrem.
Tesla v čele s Ashokem Elluswamym představila fascinující pohled na fungování svého autonomního systému. Díky kombinaci neuronových sítí, obrovského množství dat a pokročilé simulace je firma schopna reagovat na situace rychleji a inteligentněji než člověk. Ondřej Bačina celou prezentaci doplnil o cenné postřehy a kontext, který pomáhá divákům lépe pochopit význam každého kroku. Pokud vás téma zaujalo, rozhodně doporučujeme zhlédnout celé video ZDE nebo ZDE, kde se dozvíte mnohem víc.


Jsem šéfredaktor serveru zaměřeného na elektromobilitu, oblast, která představuje budoucnost dopravy. Moje vášeň pro technologii a udržitelný rozvoj mě přivedla k tomuto zaměření, kde mohu spojit svůj zájem o inovace s odpovědností vůči životnímu prostředí.
Autor
Jan Piechaczek