1. ML任务的分类
根据训练数据中的样本和标签的关系,ML任务主要分成五大类:监督学习、半监督学习、无监督学习、迁移学习、增加学习
(1)监督学习
有大量的样本和标签。
ML分析样本和标签之间的关系。
经过学习之后,能够根据新的样本推断它的标签。
根据标签的类型,又可以分为:
- 分类问题:标签是特定范围内的离散的值
- 回归总是:标签是特定范围内的连续的值
- 结构化学习:标签的范围不确定的复杂的值,例如机器翻译
(2)半监督学习
有大量的样本,其中少量样本有标签,其它大部分样本都没有标签。
这种任务常见于对样本打标签成本太高的情况。
ML分析样本和标签之间的关系以及样本自身的规律。
经过学习之后,能够新样本所表现出的规律预测它的标签。
(3)无监督学习
有大量的样本,没有标签
ML分析样本之间的关系,例如聚类问题。
或者ML学习样本的规律,并在些基础上做新的推断,例如GAN
(4)迁移学习
有大量的样本,有大量的标签,但样本和标签不是对应关系。
ML分别分析样本和标签的规律。
经过学习之后,能够根据新的样本的规律推断它的标签的规律,进一步推断出它对应的标签。
(5)增强学习
有大量的样本,没有标签,但可以根据ML对样本推断出的标签做评价。
ML在与环境的互动中学习。
经过学习之后,可以根据样本推断标签,并根据环境的反馈调整自己的推断。
2. ML常见技术
ML的技术主要体现在“定义假设空间”、“定义损失函数”、“定义优化算法”这三个步骤中。每个步骤都有各自的技术。
一个完整的模型应包含以上三步的技术。每个步骤选择什么样的技术通常有些特定的组合,也可以根据实际情况调整。
(1)定义假设空间
这一步的各种技术种类最多。也很难归类。
DL中各种不同的网络结构其中就是在定义各种不同的假设空间。
(2)定义损失函数
西瓜书第二章对这个话题有很完整的介绍。
(3)定义优化算法
花书第八章对这个话题有比较系统的介绍。