Skip to content

huiluczP/hadoop_kmeans

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

hadoop_kmeans

kmeans achieved by hadoop apis

基于MapReduce的KMeans算法流程如下:

  1. 随机分配簇,初始化中心点,存入HDFS。
  2. Mapper中读取数据文件中的每条数据并与中心点进行距离计算,输出key为最近的中心点序号。
  3. Reducer中进行归并,计算新的中心点,存入新的中心文件。
  4. 判断停机条件,不满足则复制新的中心文件到原中心文件,重复2,3步骤。
  5. 输出聚类结果,包括数据点信息与对应簇序号。

项目说明:基于MapReduce实现的Kmeans算法

About

kmeans achieved by hadoop apis

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages