快手可灵联手香港城市大学提出:让AI用视频回答问题,比如你问领带怎么打,AI直接生成个视频解答。无论是烹饪、折纸、修理家电,当你卡在某个步骤时,只需拍下你当前的进度并提问:「下一步该怎么做?」AI不仅能推断出你的下一步动作,还能生成一段从你当前状态开始的、无缝衔接的教学视频。模型名字叫VANS(不是鞋),Video-As-Answer Network的缩写。这套系统背后有两个“角色”:- 一个“思想家”模型,理解视频和问题,判断下一步该干嘛- 一个“艺术家”模型,根据思想家的指令把它“拍”出来这个系统特别适合两个方向:- 程序性教学:像个随身AI生活助理,能按你当前物料教你做饭、修东西、折纸- 多未来推演:推演未来的多种形态,给一个场景,它能生成多种可能的未来比起传统只能输出文字的AI回答,VANS像是一次“形象化思维”的升级。不只是AI生成视频那么简单,更像是给AI加上“示范”的能力,离“通用助手”又近了一步。项目页面:video-as-answer.github.io/代码已开源:github.com/KlingTeam/VANS

