K-近邻算法简介
1 什么是K-近邻算法
 (1) (1) (1) (1) (1).3dd54a18.png)
- 根据你的“邻居”来推断出你的类别
1.1 K-近邻算法(KNN)概念
K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法
- 定义
如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
来源:KNN算法最早是由Cover和Hart提出的一种分类算法
- 距离公式
两个样本的距离可以通过如下公式计算,又叫欧式距离 ,关于距离公式会在后面进行讨论
 (1) (1) (1) (1) (1).ffecf413.png)
 (1) (1) (1) (1) (1).92e420b7.png)
1.2 电影类型分析
假设我们现在有几部电影
 (1) (1) (1) (1) (1).24237c59.png)
其中? 号电影不知道类别,如何去预测?我们可以利用K近邻算法的思想
 (1) (1) (1) (1) (1).16889df8.png)
分别计算每个电影和被预测电影的距离,然后求解
 (1) (1) (1) (1) (1).8c8ab282.png)