深度子领域自适应的方法（DSAN）「迁移学习」「AI核心算法」_九三智能控v的博客

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

一身肌肉的乌龙茶 · C# -- ...· 1 年前 ·

酷酷的馒头 · Java中javaagent启动怎么带参数？ ...· 1 年前 ·

眉毛粗的水龙头 · Apache顶级项目ShardingSphe ...· 2 年前 ·

不敢表白的海豚 · Linux下通过JDBC连接Oracle,S ...· 2 年前 ·

个性的木耳 · 錯誤訊息: Failure ...· 2 年前 ·

作者：朱勇椿来源：王晋东不在家（ID：yourwjd）

转载请联系作者

本期我们将为大家介绍一种极为简单的 「深度子领域自适应的方法（DSAN）」 ，在大多数方法都使用很多项loss相加、越来越复杂的大环境下，这篇文章仅使用一个分类loss和一个自适应loss，方法极为简单，但是效果却非常不错，几乎在所有的主流DA数据集（office-home, office31, Image-CLEF,VisDA-2017, digits）上均有不错的效果。

这篇文章近期发表在一区期刊IEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS)上，主要作者团队来自中科院计算所与微软亚洲研究院。文章相关链接：

IEEE链接：https://ieeexplore.ieee.org/document/9085896

PDF：http://jd92.wang/assets/files/a24tnnls20.pdf

代码：https://github.com/easezyc/deep-transfer-learning/tree/master/UDA/pytorch1.0/DSAN

近年来无监督领域自适应（unsupervised domain adaptation, UDA）吸引了众多研究者的注意。Deep UDA的方法通常将目标领域数据和源领域数据通过一个深度神经网络提取特征，然后在这个特征空间中对两个领域的特征进行对齐（alignment），希望通过特征对齐减少两个领域间的特征差异。特征对齐的方法通常有两大类，metric-based和adversarial-based。在早期的研究中，大多数方法都进行全局对齐（不考虑任何细粒度的信息，比如标签），最近几年，开始出现了很多更细粒度的方法，这些方法将标签信息纳入考虑。

这些细粒度的方法通常是adversarial-based，众所周知，基于对抗的方法通常面临 收敛速度慢 ， 收敛难 的问题，并且会使用 一长串loss ，非常 复杂 。

这里介绍的这篇工作解决了上述一系列问题。首先，定义了 「子领域」 的概念，一个领域下可以依据一些条件，将相似的样本划分到一个子领域，比如使用类标签作为划分依据，同一类放到一个子领域（这篇文章采用类别作为划分依据）。接着不再进行全局对齐，而是分别对相关的子领域进行对齐。

子领域自适应的思想如图所示。

subdomain adaptation

基于子领域自适应的思想，这篇文章提出了一种极为简单的方法—— 「深度子领域自适应网络（Deep Subdomain Adaption Network, DSAN）」 。DSAN方法使用一种**Local MDD(LMMD)**来对齐分布，取得了近几年metric-based方法中最好的效果。

DSAN方法非常之简单，如下图所示：只使用LMMD在不同的层进行对齐。

我们使用类别划分来定义子领域，一个子领域就是一个类别，所以LMMD的定义如下：

注意，这里的w在这篇文章中是根据类别定义，实质上，w的定义是非常灵活的，这个部分很容易扩展，比如使用多个相近的类来定义子领域。权重w的定义如下：

这里源领域数据使用真实标签，而目标领域数据使用网络预测的概率分布。LMMD的展开式如下：

整个网络使用如下损失函数进行优化：

上述第一项使用交叉熵作为分类损失，第二项使用LMMD作为自适应损失。可以看到优化目标相比于大多数UDA的方法来说是非常简单的。

这篇文章的思想非常简单，但是效果却超越了大多数复杂的方法，在5个数据集上效果如下。

ImageCLEF:

Office31:

OfficeHome:

VisDA-2017:

digits:

DSAN取得了当前metric-based UDA方法最好的效果。和比较著名的JAN进行了一些分析实验：

并且将DSAN和现有的细粒度对齐的方法进行了比较，可以看出DSAN不使用对抗，并且loss少，超参数少，运行时间更快，达到的效果也更好：

近年来，越来越多的研究者为了解决DA问题，倾向于提出一些越来越复杂的方法。但是事实上，越简单的方法往往是越有效果的。因为它关注了DA的本质性问题，而不会被各种新颖的loss冲昏头脑不知道自己到底在干什么。DSAN是就是这样一种非常简单有效的细粒度方法。在未来，读者可以基于DSAN做很多扩展，也希望更多的研究者去做简单但抓住问题本质的方法， 「回归研究的本质」 ，而不是一味地堆叠各种炫酷的模块来达到目的。

References

[1] Zhu Y, Zhuang F, Wang J, et al. Deep Subdomain Adaptation Network for Image Classification[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020.

本文作者：朱勇椿，中国科学院计算技术研究所博士生，研究方向为数据挖掘和迁移学习。

历史精华好文

请加微信号： y an_kylin_phenix ，注明姓名+单位+从业方向+地点，非诚勿扰。

关注：决策智能与机器学习，深耕AI脱水干货作者：朱勇椿来源：王晋东不在家（ID：yourwjd）转载请联系作者本期我们将为大家介绍一种极为简单的「深度子领域自适应的方法（DSAN）」...

Deep Subdom ai n Adaptation Network for Image Classification(用于图像分类的深度子域自适应网络)王晋东2020年最新文章全文翻译。对于没有标记数据的目标任务，域适应可以将知识从不同的源域迁移过来。以往的深度域适应方法主要是学习全局的域迁移，即对齐源域和目标域的全局分布，而不考虑同一类别不同域中的两个子域之间的关系，在没有捕捉到细粒度信息的情况下导致 迁移学习 效果不佳。近年来，越来越多的研究者开始关注子域自适应问题，重点是准确地对齐相关子域的分布。然而，它们大多包含多个损失函数且收敛缓慢的对抗性方法。在此基础上，我们提出了一种深度子域自适应

深度学习 需要大量的标签样本，为解决标签问题提出了 迁移学习 ，即从相关的source dom ai n 去学习标签好的数据。但由于不同域间的数据分布也不同，所以学习得到的模型泛化能力不高。在训练、测试数据的分布有变动的情况下去学习一个判别模型叫做dom ai n adaptation 或transfer distributions。在深度特征学习中嵌入dom ai n adaptation模块去提取固定特征已经证明能带来新的优势。之前的dom ai n adaptation都是在全局域上做迁移，导致一个域内不同

1、介绍 LMMD技术来源于论文: Deep Subdom ai n Adaptation Network for Image Classification MMD在领域适应的模块已经表现得很好，但是对于多个类别分类问题，它总是去将全局得数据去进行对齐，而忽略了每个类别得对齐效果。LMMD（local maximum mean discrepancy）这便被引出来，经过我实验室研究结果来看，LMMD在多类别得领域适应模块具有较好得效果。多类别得LMMD原理图如下所示： 2、数学原理上图所示为MMD在

细粒度对齐方法，local dom ai n shift 子领域对齐（可看作每类是一个子领域），语义对齐，匹配条件（概率）分布 subdom ai n adaptation (also called semantic alignment or matching conditional distribution) https://zhuanlan.zhihu.com/p/254856261 http://jd92.wang/assets/files/a24tnnls20.pdf 王晋东：Balance 边缘和条件

1 迁移学习 的直观理解人类容易在类似的任务上利用先前的经验，比如学过自行车就很容易学会摩托车，学会打羽毛球也能帮助学习打网球，学过小提琴也会对学习二胡有帮助。也就是把一个领域上学习的知识迁移到另一个领域上，目的也是让计算机有举一反三的能力（大概是实现AGI的一个重要的坎），或者是去尝试充分利用已经训练过的某个领域的知识来解决当前的任务（这样可以解决数据少的问题）。在 迁移学习 中要强调源域（Source Dom ai n）、源任务（Source Task）、目标域（Target Dom ai n）和目标任务（Tar

Aligning Dom ai n-Specific Distribution and Classifier for Cross-Dom ai n Classification from Multiple Sources 文章链接：https:// ai magazine.org/ojs/index.php/AA AI /article/view/4551 Code：https://github.com/ea...

以往工作直接用 last click item embedding 用来表示 current preference 不妥 session 中所有的 item 并不一定能反映用户偏好，有些交互可能是因为误触、浏览无关的促销广告等行为产生的对于问题1，例子如下例子中使用最后一个 item 预测的物品集合里面不存在真实的 target item 解决方法：论文提出了一个可学习的 embedding 用来刻画用户的 current preference，称为 targ

Abstract 我们提出了深子域自适应网络( DSAN )，它通过基于局部最大平均差异(LMMD)在不同域上对齐域特定层激活的相关子域分布来学习传输网络。我们的 DSAN 非常简单但有效，不需要对抗性训练，收敛速度快。大部分前馈网络模型都可以通过最小均方误差损失进行扩展来实现自适应，而最小均方误差损失可以通过反向传播进行有效训练。 (1)提出了一种新的子域自适应深度神经网络体系结构，该体系结构通过捕获每个类别的细粒度信息来扩展深度自适应网络的能力。 (2)我们证明了 DSAN 这种非对抗性的方法可以取得显著的效