多元分类

本节课主要是上一节二元分类逻辑回归的扩展,将分类结果从两类扩展为多类

sigmoid函数

这个课件展示了多元分类的几种应用场景,比如第一种邮件分类,可以将邮件分为工作、朋友、家庭、兴趣爱好等类别,这个时候可以将工作、朋友、家庭、兴趣爱好这些类别分别对应于输出值y为1、2、3、4。第二种为对疾病进行预测,可以将疾病类型分为未生病、感冒、流感等,同时将这三种结果对应于y的输出为1、2、3。第三种为对天气进行预测,可以将天气分为晴天、多云、下雨、下雪等天气情况。同时对应于y的输出为1、2、3、4,也可以将y的输出对应为0、1、2、3,但是Andrew Ng不建议将y的值设置为0、1、2、3这种情况

sigmoid函数

在二元分类问题中,可以用一条直线或者曲线来确定分类边界,如上如的蓝色直线。那么在三元分类中,我们应该如何确定这种分类边界呢?请看下图说明

sigmoid函数

首先再次说明 的物理意义,它表示在x的情况下,y取值为1的概率。在多元分类问题中,我们可以参照二元分类将分类输出y对应为1、2、3…、n,那么 则表示y分别取1、2、3的概率。对于任意的一种y,例如2,我们可以将y=2的概率类比为二元分类中y=1的情况,将y=1和y=3类比为二元分类中y=0的情况。上图右侧的三幅图形象地说明了这一点。这样我们就可以使用二元分类的思想将多元分类问题拆分为多个二元分类问题来解决了

sigmoid函数

上图概括地说明了如何求解多元分类问题。即:1、将多元分类问题拆分为多个二元分类问题,然后分别对二元分类运行逻辑回归算法,求出各个二元分类的概率。2、选择对应分类使y概率最大的值作为分类预测