作业二


机器学习概述及感知机模型

截止时间:2019年10月6日 23:59

参考答案

内容

一、机器学习 – 极大似然估计

证明:模型是条件概率分布,当损失函数是对数损失函数时,经验风险最小化等价于极大似然估计.

对数损失函数: $ L(Y, P(Y|X)) = - \log P(Y|X)$

二、感知机

(二选一)用感知机模型对以下数据进行分类/拟合并绘制结果:

  1. 用感知机模型对dummy_data进行分类,打印并绘制结果
1
2
%matlab读取数据
[X, Y] = dummy_data(200);

dummy_data MATLAB代码

  1. (奖励分1)用感知机模型对Boston房价数据进行拟合,打印并绘制结果
1
2
%matlab读取数据
[X, Y] = house_price();

房价数据 MATLAB代码

三、最近邻KNN

你需要利用以下任意一种方式实现K近邻算法并绘制分类边界:

  • 朴素KNN,即两两比较
  • (奖励分1)KD树

提交

提交内容

  • 机器学习 – 极大似然估计
    • 提供pdf(可以拍照截图)
  • 感知机最近邻KNN
    • 可运行的代码(Matlab或Python)
      • 格式:.m, .mlx, .py, .ipynb
    • [Optional] 补充材料 – 避免代码不可运行导致的扣分
      • 运行结果
      • 说明文档
      • Python代码以课程指定工具箱及其版本为准,若不然需要附带环境配置说明

提交方式

  1. 将所有文件打包成zip并以你的学号命名,例如51160601160.zip
  2. 提交到FTP服务器的AI_homework/Undergraduate/HW2文件夹下
  3. (可选)你可以多次上传,以最后一次上传的结果为准

具体提交方式见作业提交系统

评分 (待定)

总分 5 = 机器学习 1 + 感知机 2 + 最近邻 2

  • 代码不可运行时参考补充材料的内容酌情处理
  • 多个代码版本(不超过两个)以正确的为准
  • 奖励分1记录到总的平时成绩中

参考结果

最近邻 KNN