美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。

美林新闻/NEWS

首页 美林数据 行业资讯

探讨分类分析和回归分析在机器学习中的实际应用

2023-12-13 19:01:35
分类分析和回归分析是机器学习中两个非常重要的概念,在实际应用中,它们各自有着不同的应用场景。回归分析适合于需要预测连续数值型数据的情况,而分类分析则针对离散类型的问题,比如二分类、多分类等。回归分析和分类分析的本质是一样的,都是有监督学习,但是两者在输出数据类型、得到的算法结果以及模型评估指标等方面存在一些差异。
(1)输出数据的类型。回归输出的是连续数据类型,比如我们通过学习时间预测学生的考试分数,这里的预测结果分数,是连续数据。分类输出的是离散型数据,也就是分类的标签,比如我们通过学生学习预测考试是否通过,这里的预测结果是考试通过或者不通过,这两种离散数据。
(2)我们想要通过机器学习算法得到什么。分类得到是一个决策面,用于对数据集中的数据进行分类。回归得到是一个最优拟合线,这个线条可以最好的接近数据集中的各个点。
(3)模型评估指标不同。分类中我们通常会使用准确率作为指标。回归中我们通常用决定系数R2来评估模型的好坏。
探讨分类分析和回归分析在机器学习中的实际应用
分类分析和回归分析步骤相同,在这里不做过多赘述。区别在于分类算法必须设置自变量,自变量可以是连续型(数值)也可以是离散型(字符),也必须设置因变量,且因变量必须是一个离散型(字符)。
平台内置分类算法:逻辑回归分类、朴素贝叶斯、Xgboost分类、贝叶斯网络分类、BP神经网络分类、随机森林分类、支持向量机分类、 CART、ID3分类、C45+决策树分类、梯度提升决策树分类、L1/2稀疏迭代分类、RBF神经网络分类、KNN、线性判别分类和Adaboost分类。当然也可选择自动分类节点构建模型。
分类的模型评估指标包括准确率、精确率、召回率、F1值、ROC曲线、PR曲线、Lift曲线、Gains曲线、Fini系数、K-S曲线等,具体的指标说明和曲线图可以在平台洞察中查看。
探讨分类分析和回归分析在机器学习中的实际应用
再来看数据集的情况,可以看到属性“prediction”为分类预测结果,“probability”为每个类别的概率值。
探讨分类分析和回归分析在机器学习中的实际应用
同样,我们也可以利用训练好的模型进行类别预测,如下图:
探讨分类分析和回归分析在机器学习中的实际应用
总之,分类分析是机器学习中非常重要的分析方法之一,它的应用广泛,可用于各种分类问题。在实践过程中,我们需要根据具体的任务需求选择合适的分类算法,并综合考虑不同的模型评估指标,以达到更为准确和有效的分类结果。分类分析将会在未来的人工智能领域发挥越来越重要的作用,我们期待着这项技术的日益发展。
服务热线
400-608-2558
咨询热线
15502965860
美林数据
微信扫描二维码,立即在线咨询