腾讯汽车对的深度采访:VLA只是说这个模型它是Vision-Language-Action,它能干这些事,是不是真的可以用这样的模型去干这些事?
我举个例子,大猩猩和人,它其实都是VLA的model(模型),猩猩人家也有语言,有可能老鼠也有老鼠的语言。就是说,VLA的model,有的是老鼠的VLA,有的是猩猩的VLA,有的是人的VLA。VLA更好的模型,意味着这个模型上限是更高的,它有更好的视觉能力、更好语言能力以及更强的action能力。[破涕为笑] 腾讯汽车Momenta
腾讯汽车对的深度采访:VLA只是说这个模型它是Vision-Language-Action,它能干这些事,是不是真的可以用这样的模型去干这些事?
我举个例子,大猩猩和人,它其实都是VLA的model(模型),猩猩人家也有语言,有可能老鼠也有老鼠的语言。就是说,VLA的model,有的是老鼠的VLA,有的是猩猩的VLA,有的是人的VLA。VLA更好的模型,意味着这个模型上限是更高的,它有更好的视觉能力、更好语言能力以及更强的action能力。[破涕为笑] 腾讯汽车Momenta
作者最新文章
热门分类
汽车TOP
汽车最新文章