Bootstrap

个性化联邦学习(Personalized Federated Learning,PFL) 介绍(下)

个性化联邦学习(Personalized Federated Learning,PFL) 介绍(下)

PFL 介绍(上):入口

FL基本介绍:入口


PFL基准

尽管已经发布了针对FL的基准数据集,但它们在PFL研究中并没有被广泛采用。绝大多数PFL研究选择通过在机器学习中使用的公共基准数据集(例如MNIST, EMNIST,CIFAR-100)上执行自己的分区来模拟非iid设置,或者创建一个合成数据集。

  1. 数量倾斜:FL客户端持有不同大小的本地数据集,其中一些客户端拥有的数据量比其他客户端大得多。由于跨FL客户端的使用模式不同,数据大小的异构性在实际环境中非常普遍。为了模拟数据大小的异质性,直接使用来自不平衡数据集的数据,而无需进一步采样。也可以根据幂律将数据分发到FL客户端。

  2. 特征分布偏态:特征分布 P c ( x ) P_c(x) Pc(x)

;