添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
这篇INFOCOM2020论文探讨了使用深度强化学习(DRL)方法设计有效的边缘学习激励机制。通过定义损失函数和分布式数据集的全局损失,研究了如何最大化学习效果。论文考虑了边缘节点(ENs)的CPU周期数、本地训练时间、通讯模型以及资源更新的动态过程,同时引入了效用函数来衡量ENs的收益和成本。 摘要由CSDN通过智能技术生成

INFOCOM2020论文:An Incentive Mechanism Design for Efficient Edge Learning by Deep Reinforcement Learning Approach

define:

  • 训练样本 j j j 中包含:vector x j x_j x j is the input of ML model; scalar y j y_j y j is the output of ML model.
  • 对于每个训练样本 j j j 有定义在参数向量ω上的损失函数
  • 所有的训练数据对表示为: { x j , y j } j ∈ D n \{x_j, y_j\}_{j \in \mathcal{D}_n} { x j , y j } j D n
  • 损失函数表示表示训练数据与模型的误差。模型学习的过程是在训练样本上最小化损失函数。

  • 训练样本 j j j 的损失函数 f j ( w ) f_j(w) f j ( w )
  • ENs标识为 N = { 1 , 2 , ⋯   , N } \mathcal{N}=\{1,2, \cdots, N\} N = { 1 , 2 , , N } ,对应的本地数据集: D 1 , D 2 , . . . , D N \mathcal{D}_1, \mathcal{D}_2, ..., \mathcal{D}_N D 1 , D 2 , . . . , D N
  • 在这个edge上的所有训练样本的损失函数: F n ( w ) ≜ 1 D n ∑ j ∈ D n f j ( w ) F_n(w) \triangleq \frac{1}{\mathcal{D}_n} \sum_{j \in \mathcal{D}_n} f_j(w) F n ( w ) D n 1 j D n f j ( w )
  • 定义 D = ∑ n = 1 N D n D = \sum^N_{n=1} D_n D = n = 1 N D n
  • 分布式数据集的全局损失函数: F ( w ) ≜ ∑ j ∈ ∪ n D n f j ( w ) ∣ ∪ n D n ∣ = ∑ n = 1 N D n F n ( w ) D F(w) \triangleq \frac{\sum_{j \in \cup_n \mathcal{D}_n} f_j(w)}{|\cup_n \mathcal{D}_n|} = \frac{\sum^N_{n=1}D_n F_n(w)}{D} F ( w ) n D n j n
  • AI创业生态日益丰富,产业链 expansively 随着人工智能技术的不断发展和应用的深入,AI创业生态日益丰富,产业链也变得越来越庞大和复杂。本文将围绕AI创业生态的几个关键领域,梳理典型的高频面试题和算法编程题,并提供详细的答案解析和源代码实例。 1. AI
    文章目录一、 论文 翻译题目:从大基线深度单应性学习边缘保留图像拼接0摘要1引言2相关工作A传统图像拼接B深度单应方案C深度图像拼接3方法3.1大基线深度单应3.2边缘保持变形网络3.3无尺寸拼接4实验4.1数据集和实现细节4.2和单应估计比较4.3和图像拼接算法对比4.4消融实验5结论二、 论文 总结 一、 论文 翻译 题目:从大基线深度单应性学习边缘保留图像拼接 图像拼接是计算机视觉 一项经典而关键的技术,旨在生成具有宽视场的图像。传统方法严重依赖特征检测,要求场景特征在图像 密集且分布均匀,导致重影效果参
    开销和隐私两大problems 移动网络在计算和通信两方面有极大的开销,如果没有 激励机制 ,那么感兴趣的移动设备就不愿意加入联邦学习任务 以往的假设是认为所有的移动设备都会在被邀请时无条件的参与联邦学习,但是没有精心设计的补偿,自私自利的移动设备将不愿意参与 两个信息不对成 1.任务发布者不知道用于模型训练的资源量和数据大小 2.不知道移动设备的数据质量 导致: 任务发布者在为移动...
    目前大部分工作将网络、缓存、计算分立研究并优化,但本文将这三者进行联合优化,提出一个集成的动态管理架构。本文将此框架 的资源分配策略指定为一个联合优化问题,其综合考虑了网络、缓存、和计算的效用。对于系统的复杂性使用 DRL 的方法加以解决。 结论及未来工作 本文将网络、缓存、计算资源联合优化以提高车辆网络性能。基于SDN的可编程控制原理和ICN的缓存原理,我们提出一个集成的网络、缓存、计算资源的动态编排框架。通过深度强化学习方法加以解决,并给出了不同场景下算法的收敛性。未来将在该框架下考虑能效的提升。
    Title:Hierarchical Re info rcem ent L ear ning for Air-to-Air Combat 来源:https://www.res ear chgate.net/publication/351298817 作者:Adrian P. Pope∗, Jaime S. Ide 等
    Deep L ear ning for Intelligent Wireless Networks: A Comprehensive Survey 基于智能无线网络的深度学习:全面调查 As a promising machine l ear ning tool to handle the accurate pattern recognition from complex raw data, deep l ear ning (DL) is becoming a powerful method to add i
    边缘检测(英语: Edge detection)是图像处理和计算机视觉 的基本问题,边缘检测的目的是标识数字图像 亮度变化明显的点。图像属性 的显著变化通常反映了属性的重要事件和变化。这些包括(i)深度上的不连续、(ii)表面方向不连续、(iii)物质属性变化和(iv)场景照明变化。 边缘检测是图像处理和计算机视觉 ,尤其是特征检测 的一个研究领域。 本博文只介绍基于深度学习的边缘检测。 基于深度学习的边缘检测 基于深度学习的边缘检测分为三类:1.全要素边缘检测;2.物体边缘检测;3.语义边缘检测。如下
    A Deep Re info rcem ent L ear ning Approach to Concurrent Bilateral NegotiationPallavi Bagga, Nicola Paoletti, Bedour Alrayes, Kostas Stathis A Multi-Objective Approach to Mitigat.
    边缘智能相关 论文 Federated L ear ning PreliminaryFast InferenceModel Compression Federated L ear ning Preliminary Privacy-Preserving Deep L ear ning ,CCS, 2015 文 提出了Distributed Selective SGD,许多联邦学习文章都会引用该 论文 。 Communi...
    这里写自定义目录标题1. Introduction新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居 、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 Refere...