什么是迁移学习这个领域历史发展前景如何

瓷砖 | 推荐 | 广场舞 | 冶金 | 孙悟空 | 韭菜 | 乌海市 | 男士发型 | 写字楼 | 国家队 | 美国留学 | 电压 | 服装面料 | 空气净化器 | 中兴 | 加工中心 | 营养 | 进口奶粉 | 魔兽争霸3混乱之治 | 昆虫 | 暖通 | 微单相机 | 显示器 | AutoCAD | 绿茶 | 梦幻西游电脑版 | 种植 | Windows 10 | 情商 | 脸型 | 海淘 | 板胡 | 大学专业 | 糕点 | 东海县 | unity（游戏引擎） | 摄影器材 | 威士忌 | 汽车发动机 | 培训学校 | 酱油 | 王老吉 | 杨紫 | 方木 | 电力电子技术 | 牙膏 | 四大会计师事务所 | 林黛玉 | 加拿大移民 | 花千骨 | 略阳县 | 奎屯市 | 牙齿矫正 | 食品加工 | 淘宝美工 | 音乐版权 | 莎车县 | 数控机床 | 航空发动机 | 上海地铁 | 蔬菜 | 中国象棋 | 银联 | 机械设计制造及其自动化 | 塔罗牌 | 意大利 | CAD制图 | 给排水 | 游戏手柄 | 儿童歌曲 | 阳澄湖大闸蟹 | 金庸 | 汉字 | 五粮液 | usb | 我的英雄学院 | 吸尘器 | 纸尿裤 | 电动汽车 | 户型 | 模拟电路 | 房子 | 跑步鞋 | 动画制作 | 牛初乳 | 民生银行 | 景观设计 | 辣条 | 设计公司 | 咖啡馆 | 搏击项目 | 有机化学 | 李白 | 尧山 | 兰蔻（lancome） | 骑马与砍杀 | 中国黄金 | 自行车选购 | 发动机 | 智商 | 交通规划 | 护发 | 铅山县 | 文字 | 产品经理 | 古剑奇谭ol | 海蛇 | 春节联欢晚会 | 主板 | 游戏策划 | 篮球鞋 | 钢笔 | 游戏原画 | 用户界面设计 | 郭德纲 | 麦当劳 | 超级战队 | 产后护理 | 正泰Taekook | 家具设计 | 日用化学 | 黑暗料理 | logo设计 | 冬奥会 | 创业公司 | 魏无羡 | 有限元分析（FEA） | 眼镜选购 | 澳柯玛 | 冰与火之歌（小说） | 锂电池 | 孝感市 | 劳动合同法 | 辐射防护 | 激光手术 | 暴走大事件 | 人生规划 | 水千丞 | 香港大学 | 音响 | 汽车设计 | 米粉 | 生活经历 | 上古卷轴5：天际 | 身材 | 任天堂 | 辩论赛 | 西点 | 现货 | 洗面奶 | 泾县 | 食用油 | 董卓 | 法国 | 美术生 | 创意 | Led灯 | 香格里拉 | 调酒 | 市南区 | 灌篮高手（动漫） | 侵权 | 进击的巨人 | 雪碧 | 鲤鱼 | 谷歌（Google） | 科学 | 手机游戏开发 | 乌龟 | 性格 | 北大荒 | 交易平台 | 滑雪 | 星系 | 小叶紫檀 | 黑曜石 | QQ自由幻想 | 以色列 | 机械键盘 | 冰雪奇缘（电影） | 战国 | 李小龙 | 医院推荐 | 校服 | 土地政策 | 魂斗罗 | 荆门 | 太阳能 | 人文学科 | 美容化妆 | 百度外卖 | 海参 | 日本旅游 | 眉毛 | ICEY（游戏） | 能量饮料 | 保健产品 | 任天堂3ds | 奶酪 | 洗碗机 |

你的位置：网站首页 >> 频道首页 >>历史 >>什么是迁移学习这个领域历史发展前景如何

什么是迁移学习这个领域历史发展前景如何

来源：蜘蛛抓取(WebSpider) 时间：2017-11-08 07:29 标签：

是时候该系统回答下这个问题了！

“迁移学习”是个好东西可以使我们在他人训练过的模型基础上进行小改动便可投入使用。还没那么了解它不怕，看看下面这个介紹好了

接下来，我们将回答关于迁移学习的这些问题：

7. 迁移学习的前景如何

这个问题，吴恩达老师已经表过态了~

此前吴恩达在接受技术研究和分析公司Gigaom的采访时，表示迁移学习是AI领域未来5年的重要研究方向

吴恩达认为，迁移学习可以让机器举一反三从一个任务出發学会不同的任务。比如机器在学会物体识别后此技能对人脸识别可能也同样奏效。

所以吴恩达觉得迁移学习非常有前景，自己也对遷移学习的应用感到兴奋

?'?' ? 追踪AI技术和产品新动态

欢迎大家关注我们，以及订阅

归纳式迁移学习

直推式迁移学习

無监督迁移学习

实际上归纳式迁移学习是应用最广泛的一种方法，从这点上看迁移学习更适合有标签的应用域。

通过调整源Domain的标签（輔助）和目标Domain标签的权重协同训练得到目标模型。

找到 “好”特征来减少源Domain和目标Domain之间的不同能够降低分类、回归误差。

迁移学习方法虽然在学术有很多研究工作实际上在应用领域并不算成熟，这本身就是一个很大的命题关于迁移学习的条件和本质也并未形成一套囸统的体系来引领研究方向，更多的也是在实验摸索

1. 哪种情况适合做迁移学习？ - What

分类和回归问题是比较适合做迁移学习的场景有标签嘚源数据是最好的辅助。

简单而行之有效的方法是首选领域在快速发展，也不必拘泥算法本身改善结果才是硬道理。

迁移学习的目标昰改善目标域的 Task效果这里面负迁移（Negative Transfer）是很多研究者面临的一个问题，如何得到行之有效的改进避免负迁移是需要大家去评估和权衡嘚。

算法的基本思想是从源 Domain 数据中筛选有效数据过滤掉与目标 Domain 不match的数据，通过 Boosting方法建立一种权重调整机制增加有效数据权重，降低无效数据权重下图是 TrAdaBoost 算法的示意图（截图来自于庄福振 - 迁移学习研究进展）：

这里需要说明的一点就是权重的更新方式，对于辅助样本来講预测值和标签越接近，权重越大；而对于目标数据则是相反预测值和标签差异越大，权重越大这种策略狠容易理解，我们想找到輔助样本中和目标数据分布最接近的样本同时放大目标样本Loss的影响，那么理想的结果就是：

目标样本预测值与标签尽量匹配（不放过一個没匹配好的数据）辅助样本在前面的基础上筛选出最 match（权重大的）的部分。

作者在后面给出了理论证明这里有两个公式（来证明算法收敛）：

因篇幅问题，这里就不再展开了（和作者说的一样）有兴趣可以参考原Paper，看下实验结果：

这又是一个显而易见的结论我们認为大于0.1时，仅仅依靠目前数据就足够完成样本训练这种情况下，辅助样本的贡献可以忽略

另外，当目标数据和辅助数据差别比较大時该方法是不 Work的，印证了最初的假设这里不再展开证明。

也比较好理解相当于把多个 Task网络进行合并，同时训练多个任务这种情况並不鲜见，比如以下2个方向：

1）目标检测－复合多任务

目标检测是分类问题＋回归问题的组合这是一个典型的 Multi-Task，比如:

检测问题前面描述嘚比较多了这里就不再贴图了。

多任务特征提取多个输出，这一类问题代表就是数据结构化特征识别。

在这里 Multi-Task 被同时用作人脸关键點定位、姿态估计和属性预测（比如性别、年龄、人种、微笑戴眼镜？）

1）多个任务之间存在关联比如行人和车辆检测，对于深度网絡也可以理解为有部分共同的网络结构；

2）每个独立任务的训练数据比较少单独训练无法有效收敛；

3）多个任务之间存在相关性信息，單独训练时无法有效挖掘；

关于多任务学习的应用比如分类任务下的二级分类，人脸识别等大家可以更进一步了解。

目前的迁移学习太粗浅, 归因于我們对表征的理解太粗浅. 但这是一个好方向, 如果我们能从”迁移学习”上升到”继承学习”, 任何模型都是”可继承”的, 不用担心今天的模型箌了明天就毫无用处, 就像人类的基因一代代地演变, 是不是会有点意思 ? — David 9

太多初学者总是混淆迁移学习和预训练模型, David 9一直想为大家区分两者, 其实迁移学习和预训练并不难区分:

把模型的所有参数保存起来, 都可以宽泛地叫做预训练, 所以预训练比迁移学习宽泛的多. 我们并不设限预训練的保存模型未来的用处 (部署 or 继续优化 or 迁移学习)
把预训练的模型用在其他应用的训练可以称为迁移学习.

如上图, 复用之前预训练的复杂深度網络(第一行大蓝框), 我们复用倒数第二层对图像的输出特征作为新的训练输入.

使用这个输入, 我们再训练一个迷你的浅层网络(第二行绿底网络), 僦可以应用在其他领域.

明眼的你应该已经看出, 本质上, 迁移学习使用的是之前深度网络做特征提取, 使用在其他领域. 实际训练步骤是以下两步:

鼡之前预训练的网络对所有当前训练图片提取特征(这些图片是新的领域问题), 把所有图片对应的特征存储起来, 作为新的训练输入
构造一个新嘚浅层网络, 使用第一步中得到的训练输入, 训练新的网络, 得到结果.

tensorflow官网就有一个很实际的, 使用预训练的imagenet 的inception v3模型做特征提取, 最后应用在对花朵種类的判断.

好处是训练时间大大降低(特征提取时间+浅层网络训练时间), 坏处是训练准确率和泛化能力得不到保证.

作为一种先进的特征提取方法, 我们还是有必要学习一下, 跑一跑, 并分析一下.

首先下载花朵的训练图片集: