[LG]《FlowingDatasetswithWassersteino

爱生活爱珂珂 2025-09-03 06:31:45

[LG]《Flowing Datasets with Wasserstein over Wasserstein Gradient Flows》C Bonet, C Vauthier, A Korba [ENSAE & Universite Paris-Saclay] (2025)

利用Wasserstein over Wasserstein (WoW) 距离,实现概率分布上概率分布的梯度流,为机器学习中的数据流动提供全新视角。

• 创新性地将标记数据集视为概率分布上的混合分布,进而定义WoW距离度量,建立空间的黎曼结构,实现数据集间的连续流动。

• 提出WoW梯度流的理论构建及其数值模拟,采用显式的欧拉前向离散化方案,兼顾理论严谨性与计算可行性。

• 设计基于Sliced-Wasserstein核的最大均值差异(MMD)函数,实现对概率分布的有效比较,支持多类分布间复杂交互。

• 应用于迁移学习和数据集蒸馏,实验证明通过WoW梯度流可实现不同类别间的结构化变换,提升模型迁移和小样本学习效果。

• 具备处理无限维空间分布的能力,拓展传统Wasserstein梯度流的应用边界,适应复杂数据表示和优化需求。

• 通过对多数据集如MNIST、Fashion-MNIST、CIFAR10等的实验,展示算法在保持类别结构的同时实现高效数据映射,提升下游任务表现。

心得:

1. 直接在概率分布上的概率分布空间中构建梯度流,避免了对条件分布的强高斯假设,更真实地捕捉数据分布形态。

2. 两层交互机制(类内与类间)引导样本粒子协同演化,体现出更丰富的数据结构调整能力,适合复杂任务如域适应和数据蒸馏。

3. 运用Sliced-Wasserstein核的MMD优化目标,既保证了计算的可控复杂度,又提升了对分布间差异的敏感度和表达能力。

详情🔗 openreview.net/forum?id=I1OHPb4zWo

机器学习最优传输概率分布梯度流迁移学习数据集蒸馏Wasserstein距离

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注