angel

Support Vector Machine(SVM)

SVM支持向量机器是一种常用的分类算法

1. 算法介绍

SVM分类模型可以抽象为以下优化问题:

其中: 为正则项; 为正则项系数;为合页损失函数(hinge loss),如下图所示:

2. 分布式实现 on Angel

Angel MLLib提供了用mini-batch gradient descent优化方法求解的SVM二分类算法,算法逻辑如下:

3. 运行 & 性能

输入格式

数据的格式通过“ml.data.type”参数设置;数据特征的个数,即特征向量的维度通过参数“ml.feature.num”设置。 LR on Angel支持“libsvm”、“dummy”两种数据格式,分别如下所示:

参数

性能