个性化联邦学习(Personalized Federated Learning,PFL) 介绍(下)
PFL 介绍(上):入口
FL基本介绍:入口
PFL基准
尽管已经发布了针对FL的基准数据集,但它们在PFL研究中并没有被广泛采用。绝大多数PFL研究选择通过在机器学习中使用的公共基准数据集(例如MNIST, EMNIST,CIFAR-100)上执行自己的分区来模拟非iid设置,或者创建一个合成数据集。
-
数量倾斜:FL客户端持有不同大小的本地数据集,其中一些客户端拥有的数据量比其他客户端大得多。由于跨FL客户端的使用模式不同,数据大小的异构性在实际环境中非常普遍。为了模拟数据大小的异质性,直接使用来自不平衡数据集的数据,而无需进一步采样。也可以根据幂律将数据分发到FL客户端。
-
特征分布偏态:特征分布 P c ( x ) P_c(x) Pc(x)