监督学习(supervised learning)从训练数据(training data)集合中学习模型,对测试数据(test data)进行预测。
术语解释:
监督( (supervised )是指训练数据集中的每个样本均有一个已知的输出项(类标 label),也就是上述的输出 Y 值。
输入变量 X 和输出变量 Y 有不同类型,可以是连续的,也可以是离散的。人们根据输入、输出变量不同类型,对预测任务给予不同的名称:
通俗易懂地讲:监督学习指的是人们给机器一大堆标记好的数据,比如一大堆照片,标记住那些是猫的照片,那些是狗的照片,然后让机器自己学习归纳出算法或模型,然后所使用该算法或模型判断出其他照片是否是猫或狗。代表的算法或模型有 Linear regression、Logistic regression、SVM、Neural network 等。如下图流程所示:
首先,我们使用带有类标的训练数据套用在相应的机器学习算法中上,经过训练得到一个预测模型,当有新数据来的时候,通过预测模型可以得到具体的输出类别或输出值。
1、利用分类对类标进行预测输出变量为有限个离散值的情况称为分类问题(classification)
如果类别为正类或负类的时候,这个是一个二分类问题
如果类别是一个多类别的时候,这就是一个多分类问题。
分类问题包括了学习和分类两个过程:
(1) 学习:根据已知的训练数据集利用有效的学习方法学习一个分类器。
( 2)分类:利用学习到的算法判定新输入的实例对其进行分类。
分类是监督学习的一个核心问题。在监督学习中,当输出变量 Y 取有限个离散值时,预测问题便成了分类问题。监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(classifer),分类器对新的输入进行输出的预测(prediction),称为分类(classification)。
分类的类别是多个时,称为多类分类问题。
分类问题包括学习和分类的两个过程。在学习过程中,根据已知的训练数据集利用有效的学习方法学习一个分类器;在分类的过程中,利用学习的分类器对新的输入实例进行分类。
如上述的垃圾邮件就是一个 2 分类问题,使用相应的机器学习算法判定邮件属于垃圾邮件还是非垃圾邮件。如下图给出了 30个训练样本集实例:15个样本被标记为负类别(negative class)(图中圆圈表示);15 个样本被标记为正类别(positive class)(图中用加号表示)。
由于我们的数据集是二维的,这意味着每个样本都有两个与其相关的值:
x1 和 x2 ,现在我们可以通过有监督学习算法获得一条规则,并将其表示为图中的一条黑色的虚线将两类样本分开,并且可以根据x1 和 x2值将新样本划分到某个类别中(看位于直线的那一侧)。
另一类监督学习方法针对连续型输出变量进行预测,也就是所谓的回归分析(regression analysis)。回归分析中,数据中会给出大量的自变量和相应的连续因变量(对应输出结果),通过尝试寻找自变量和因变量的关系,就能够预测输出变量。
如下图中,给定了一个自变量 x 和因变量 y,拟合一条直线使得样例数据点与拟合直线之间的距离最短,最常采用的是平均平方距离来计算。如此,我们可以通过样本数据的训练来拟合直线的截距和斜率,从而对新的输入变量值所对应的输出变量进行预测。
比如生活中常见的房价问题,横轴代表房屋面积,纵轴代表房屋的售价,我们可以画出图示中的数据点,再根据使得各点到直线的距离的平均平方距离的最小,从而绘制出下图的拟合直线。根据生活常识随着房屋面积的增加,房价也会增长。
回归问题的分类有:根据输入变量的个数分为一元回归和多元回归;按照输入变量和输出变量之间的关系分为线性回归和非线性回归(模型的分类)。
标注问题是分类问题的一种推荐,输入是一个观测序列,输出是一个标记序列或状态序列。标注问题的目标在于学习一个模型,使它能够对观测序列给出标记序列作为预测。
标注问题常用的方法有:隐马尔科夫模型、条件随机场。
自然语言处理中的词性标注就是一个标注问题:给定一个由单词组成的句子,对这个句子中的每一个单词进行词性标注,即对一个单词序列预测起对应的词性标注序列。
相关知识
[半监督学习论文笔记
[半监督学习] Interpolation consistency training for semi
半监督深度学习小结:类协同训练和一致性正则化
带监督的一致性训练
安徽亳州制定小微权力清单:定事定权定责定监督
【点云语义分割】PointMatch:弱监督三维点云语义分割的一致性训练框架
[总结] 半监督学习方法: 一致性正则化(Consistency Regularization)
强化学习:通过奖励与惩罚驱动智能体学习的方法
动物卫生监督问题及建议
福建省市场监督管理局工业产品
网址: 监督学习 https://m.mcbbbk.com/newsview292726.html
上一篇: 基于DOG的异常行为监测模型的设 |
下一篇: 有以下程序 #include i |