博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
AI学习笔记——End-to-End(端到端)的深度学习
阅读量:5846 次
发布时间:2019-06-19

本文共 1028 字,大约阅读时间需要 3 分钟。

1. 什么是End-to-End 学习

要知道什么是End-to-End学习首先要知道传统的非End-to-End学习是什么。以语义分类(判断评论为正面评论还是负面评论)为例,非End-to-End的学习需要对语音识别之前要经过两步处理:解析器(Parser) 注释文本和情感分类器(Sentiment Classifier)预测文本。

解析器是对文本进行标注,比如形容词(好,坏,糟糕等),情感分类器再来预测文本是正面的还是负面的,整个过程如图:

img_c4601d11cf82cdb8cdad33a28e702aa5.png

End-to-End 学习不需要这些步骤,像黑盒子一样一步到位解决问题。神经网络算法就是一个被广泛应用的End-to-End学习的算法。End-to-End 算法尤其适用于数据量巨大的机器学习任务中。

img_ac52ac99ee45d323d150b8eca5d4e7c8.png

2. 更多End-to-End 的例子

在语音识别领域,非End-to-End 的学习大致经历:计算特征解析得到人工设计的频谱特征,音素(Phonemes)识别器识别语音中的“音素”和最终识别三个步骤:

img_c4a96a19d292cbb854b6a92fbd12e17d.png

然而End-to-End 也只需要一步就搞定了

img_3754d6a1891fbd1b7910f6d8ce6d9027.png

3. End-to-End 学习的优缺点

非End-to-End的学习算法中,需要人类做大量的前期准备工作,比如在上述语音识别的例子中,"音素"是语言学家发明的,在处理过程虽然提高了效率但是无疑会丢失语音中的其他信息。但是这种算法需要的数据量比较小。

End-to-End学习算法虽然不需要太多的人工干预,但是需要大量标记的数据,并不是在所有领域都是最好的选择。

4.非End-to-End 学习算法中pipline(管道)的选择

正如上文提到的,End-to-End的学习方法并不是在所有的领域都是最好的选择。最重要的是到底有没有足够可靠的数据。以自动驾驶为例,通过摄像头识别人和车辆,然后规划驾驶路径。如果用End-to-End的方法,需要积累海量量标记好的数据,各种路况不同的路径规划,非常困难。

然而,如果使用非End-to-End的方法,比如下图,先识别车和人,再进行路径规划

img_323fc7878a2622a147e14e10f067ff54.png

人和车的被标记好的数据很容易找到,完成这一步,再进行路径规划,这样训练起来就容易很多了。而这样设计算法的步骤就是pipline.

再举一个识别图片中猫的品种的例子,我们可以这样设计Pipline: 第一步先识别图片中是否有猫,第二步再识别猫是不是这个品种:

img_3d379dfaa63fc7ef35e0e8b021a4676b.png
————
相关文章
————
文章首发steemit.com 为了方便墙内阅读,搬运至此,欢迎留言或者访问

转载地址:http://stzjx.baihongyu.com/

你可能感兴趣的文章
css 样式使用方法的累积
查看>>
DigCSDN介绍首页
查看>>
23种设计模式用英语怎样表达?
查看>>
3. CONFIGURATION官网剖析(博主推荐)
查看>>
Linux学习——自定义shell终端提示符
查看>>
HDU 5045 5047 5050 5053(上海网络赛E,F,I,L)
查看>>
asp.net <asp:Repeater>下的 asp:LinkButton CommandArgument点击事件
查看>>
空间索引 - GeoHash算法及其实现优化
查看>>
MVC异常过滤器 (错误页)
查看>>
最长公共字序列.cpp
查看>>
数据库设计中的14个技巧
查看>>
程序猿求职之道(《程序猿面试笔试宝典》)之不想签约,但也不想轻易放弃机会,怎么办?...
查看>>
handler机制
查看>>
Vue中过度动画效果应用
查看>>
简洁是智慧的灵魂,冗长是肤浅的藻饰
查看>>
『TensorFlow』函数查询列表_神经网络相关
查看>>
java List集合
查看>>
CSS3 Flex布局整理(三)-项目属性
查看>>
广义线性模型2
查看>>
hdu 4841 圆桌问题(用vector模拟约瑟夫环)
查看>>