A Nvidia bemutatta a Groot N1-et, egy úttörő innovációt a humanoid robotikában, amelyet egy kettős rendszerű keretrendszerrel terveztek, amely tükrözi az emberi megismerést. Ez az architektúra egy lassú útvonalat integrál, amely az észlelésre, érvelésre és tervezésre összpontosít, valamint egy gyors útvonalat, amely a műveletek végrehajtására fókuszál. A kettős rendszerű megközelítés lehetővé teszi a fejlett robotikai autonómiát, lehetővé téve a humanoid robotok számára, hogy természetesebben és hatékonyabban lépjenek kapcsolatba környezetükkel.
A Groot N1-be beépített Látás-Nyelv-Cselekvés modell multimodális bemeneteket dolgoz fel, beleértve a nyelvet és képeket, hogy széles körű feladatokat hajtson végre. Ez elősegíti a humanoid interakciót, amely intuitívabb és alkalmazkodóbb a különböző kontextusokhoz. A különböző megtestesüléseken keresztüli általánosítással a modell képes különböző humanoid robotok irányítására, mint például a Fourier GR-1 és az 1X Neo, ezáltal támogatva az alkalmazások széles körét.
A folyamatos cselekvés végrehajtása tovább fokozza a modell képességét az objektummanipulációban, a többlépcsős sorozatokban és a kontextuális megértésben, tükrözve a robotikai autonómia fejlődését. A Groot N1 jelzi a kezdetét az általános robotika korszakának, ahogy azt az Nvidia vezérigazgatója, Jensen Huang hangsúlyozta. A modell fejlesztése az európai technológiai szuverenitásból merít ihletet, kiemelve a regionális szakértelem fontosságát az AI-vezérelt innovációk előmozdításában.
A Groot N1 nyílt forráskódú elérhetősége az NVIDIA Isaac GR00T-on keresztül teljes hozzáférést biztosít a fejlesztőknek a modellek súlyaihoz megengedő licencekkel, elősegítve egy befogadó és együttműködő fejlesztési környezetet. A Groot N1 kiképzésében alkalmazott hibrid adatstratégia ötvözi az olyan platformokon keresztül generált szintetikus adatokat, mint az Omniverse és a Cosmos, a valós demonstrációkkal. Ez a megközelítés, a nagyméretű egocentrikus emberi videók adatkészleteivel és az internetes méretű videó adatokkal párosítva, leküzdi a kizárólag a valós adatokra való támaszkodás korlátait.
Az adatbővítési tervek lehetővé teszik a fejlesztők számára, hogy exponenciálisan bővítsék a képzési adataikat, ezáltal finomítsák a modell képességeit.
A teljesítmény mérőszámok átlagosan 45%-os sikert mutatnak különböző szimulációs tesztekben, mint a RoboCasa, DexMG és GR-1, felülmúlva olyan versenytársakat, mint a BC Transformer és a Diffusion Policy. Jelentős, hogy a Groot N1 a legmagasabb sikerességi arányt az asztali manipulációs feladatokban éri el a GR-1 mérőszám szerint, bizonyítva a feladatspecifikus teljesítményben való jártasságát. A modell képessége a kétkezes manipuláció és a nyelvi feltételekhez kötött feladatok végrehajtására fizikai robotokban tovább példázza funkcionális sokoldalúságát.
A Groot N1 kulcsfontosságú alkalmazásai kiterjednek a humanoid robotikára az anyagkezelésben, csomagolásban és ellenőrzési feladatokban. Kiválóan teljesít az együttműködő többlépcsős feladatokban, amelyek fenntartott kontextuális megértést és tárgymanipulációs képességeket igényelnek, mint például a tárgyak megragadása és átadása a karok között. Háztartási környezetben a Groot N1 ügyessége az asztali manipulációban nyilvánvaló.
Az Nvidia nyílt forráskódú hozzáférése a modellhez, rész
References
- https://www.newsbytesapp.com/news/science/nvidia-debuts-groot-n1-foundation-ai-model-for-humanoid-robots/story
- https://research.nvidia.com/publication/2025-03_nvidia-isaac-gr00t-n1-open-foundation-model-humanoid-robots
- https://techcrunch.com/2025/03/18/nvidia-announces-groot-n1-a-foundation-model-for-humanoid-robotics/
- https://developer.nvidia.com/blog/accelerate-generalist-humanoid-robot-development-with-nvidia-isaac-gr00t-n1/
- https://www.youtube.com/watch?v=m1CH-mgpdYg