🗂️
卡片 16

机器学习分类

监督学习的核心任务,让机器学会区分不同类别

监督学习 | 模式识别

定义

机器学习分类是根据已知类别标签的数据,训练模型以对新数据进行类别划分的监督学习任务。它通过学习已标注数据中的模式,建立从输入特征到输出类别的映射关系。

分类是机器学习中最基础、应用最广泛的任务之一,属于监督学习范畴,需要有"标准答案"(标签)来训练模型。

⚙️
🐱 猫 0
🐶 狗 0
🚗 汽车 0

学习过程

分类任务通常遵循以下流程:

1

数据收集

收集带有标签的训练数据

2

特征提取

从数据中提取有意义的特征

3

模型训练

使用算法学习特征与标签的关系

4

评估验证

在测试集上评估模型性能

5

预测应用

对新数据进行分类预测

常用算法

逻辑回归

线性分类模型,输出概率值

支持向量机

寻找最大间隔超平面

决策树

树状结构,可解释性强

随机森林

决策树的集成方法

神经网络

深度学习,处理复杂模式

K近邻

基于相似度的懒惰学习

应用实例

  • 垃圾邮件识别:将邮件分为垃圾邮件和非垃圾邮件
  • 手写数字识别:识别0-9的手写数字(如MNIST数据集)
  • 情感分析:将文本分为正面、负面或中性情感
  • 疾病诊断:根据症状和检查结果诊断疾病
  • 图像分类:识别图像中的物体类别
  • 欺诈检测:识别异常的交易行为
  • 客户流失预测:预测客户是否会流失
95.2%

准确率

94.8%

精确率

95.6%

召回率

95.2%

F1分数

混淆矩阵示例

预测:猫
预测:狗
实际:猫
45
5
实际:狗
3
47

视觉化提示词

用于生成分类概念图的详细提示词:

"三个不同颜色、半透明的立方体容器悬浮在空中,分别标有'猫'、'狗'、'汽车'的发光标签。一个机械臂正在从一堆混杂的图片中识别并抓取图片,精准地放入对应的容器中。每当图片被正确分类,容器就会发出对应颜色的光芒。错误分类的图片会被机械臂重新抓取并放入正确容器。背景中有一个巨大的分类模型结构图在旋转,显示特征提取、决策边界等概念。数据流像彩虹般从原始图片流向各个容器。风格:未来科技实验室,干净整洁,蓝色主色调,柔和的光线,精确的机械运动,信息可视化风格。"