PuppyGo ist ein vision language model, das große Sprachmodelle für verkörperte Agenten nutzt. Es kombiniert Informationen aus großen Sprachmodellen mit 3D-Wertkarten für Aufgaben der alltäglichen Manipulation. Die Robustheit gegenüber Störungen wird durch geschlossene visuelle Rückmeldungen ermöglicht.
Loading...Loading...
Loading...
We use cookies
We use cookies to ensure you get the best experience on our website. For more information on how we use cookies, please see our cookie policy.
By clicking accept, you agree to our use of cookies. Learn more.