腾讯汽车对的深度采访:VLA只是说这个模型它是Vision-Language-A

郭淮谈汽车 2025-05-29 16:01:50

腾讯汽车对的深度采访:VLA只是说这个模型它是Vision-Language-Action,它能干这些事,是不是真的可以用这样的模型去干这些事?

我举个例子,大猩猩和人,它其实都是VLA的model(模型),猩猩人家也有语言,有可能老鼠也有老鼠的语言。就是说,VLA的model,有的是老鼠的VLA,有的是猩猩的VLA,有的是人的VLA。VLA更好的模型,意味着这个模型上限是更高的,它有更好的视觉能力、更好语言能力以及更强的action能力。[破涕为笑] 腾讯汽车Momenta

0 阅读:0
郭淮谈汽车

郭淮谈汽车

感谢大家的关注