Chapter 47、The rise of end-to-end learning

端到端学习的兴起

假设你想构建一个系统来检查在线产品评论,并自动告诉你作者是否喜欢该产品。例如,你希望识别以下评论为非常正面的:

这是一把极好的拖把!

而以下为非常负面的:

该拖把质量差——我后悔买它。

识别正面和负面观点的问题被称为“情感分类”。为了构建该系统,你可以构建两个组件的“流水线”:

  1. 语法分析器:一个用标识最重要词语的信息来注释文本的系统【1】。例如,你可以使用语法分析器去标注所有的形容词和名词。因此,你可以得到如下带注释的文本:

    这是一把极好的(形容词)拖把(名词)!
    
  2. 情感分类:一个将注释的文本作为输入并预测总体情感的学习算法。语法分析器的注释可以极大地帮助学习算法:通过给形容词更高的权重,算法那可以快速磨炼出重要的词汇,如“great”,并忽略不太重要的词汇,如“this”。

我们可以将两个组件的“流水线”可视化如下:

47-0

最近有一种趋势是使用单一学习算法来取代流水线系统。对于该任务的端到端(end-to-end)学习算法将简单的将原始数据作为输入,原始文本是“这是一把极好的拖把!”,并尝试直接识别情感:

47-1

神经网络通常用于端到端学习算法。术语“端到端”指的是我们要求学习算法直接从输入到期望输出。即,学习算法直接将系统的“输入端”连接到“输出端”。

在数据丰富的问题中,端到端系统非常成功。但它并不总是一个好的选择。接下来几章将给出更多端到端系统的例子,并给出何时该使用和何时不该使用它们的建议。

results matching ""

    No results matching ""