两种主流生成模型Flow Matching和Diffusion有啥区别? 从结果上看,两种方法都能生成目标图案,比如一个“笑脸”,但过程却有显著差异,在【图1】中: - 图像左侧是初始状态,像一个模糊的蓝色团块。 - 图像右侧是目标分布,也就是我们想生成的图案,比如有“眼睛”和“嘴巴”的笑脸。 红色粒子代表从起点出发的数据点,它们如何移动,体现了模型生成的“路径”。 Flow Matching(流匹配): - 轨迹线平滑、直接,看起来像被“规划好路线”的导航。 - 这是因为Flow Matching训练的是一个连续的向量场,告诉粒子“每一步往哪里走最合适”。 - 这里用的是Euler采样器,结果就是非常光滑的迁移。 Diffusion(扩散模型): - 路径呈现出明显的“抖动”,中间经历了不少波折。 - 实际上用的是 DDPM(Denoising Diffusion Probabilistic Model),它本质上是在高斯噪声里一步步“去噪”,过程充满随机性。 - 虽然最终也能收敛到目标分布,但生成路径就显得更“混沌”。 此外,展示这个过程的可视化工具,支持选择不同采样器,还可以控制时间轴。【图2】 感兴趣的小伙伴可以自己尝试一下:-Explorer
智界R7腰斩,从月销16000台落至5000台还真怪不得人家刘亦菲说到底
【7评论】【1点赞】