Chapter 52、Directly learning rich outputs
直接学习丰富的输出
图像分类算法将输入图像x,并输出一个整数来指示物体类别。算法可以输出描述图像的完整语句么?
例如:
监督学习的传统应用学习了函数 h: X->Y,其中输出y通常是一个整数或实数。例如:
端到端深度学习中最激动人心的发展之一是它让我们直接学习远比数字复杂的多的东西。在上面的图片标题示例中,你可以让神经网络输入图片(x),并直接输出标题(y)。
以下是更多的例子:
这是深度学习的一个加速趋势:当你拥有正确的已标注(输入, 输出)对时,即使输出是比单个数字更丰富的句子、图片、音频或其他输出,你有时也可以学习端到端。