Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.idea		.idea
src		src
target		target
README.md		README.md
hadoop_kmeans.iml		hadoop_kmeans.iml
new_10000data.txt		new_10000data.txt
pom.xml		pom.xml

Repository files navigation

hadoop_kmeans

kmeans achieved by hadoop apis

基于MapReduce的KMeans算法流程如下：

随机分配簇，初始化中心点，存入HDFS。
Mapper中读取数据文件中的每条数据并与中心点进行距离计算，输出key为最近的中心点序号。
Reducer中进行归并，计算新的中心点，存入新的中心文件。
判断停机条件，不满足则复制新的中心文件到原中心文件，重复2，3步骤。
输出聚类结果，包括数据点信息与对应簇序号。

项目说明：基于MapReduce实现的Kmeans算法

About

kmeans achieved by hadoop apis

Report repository

Releases

No releases published

Packages

No packages published

Languages

Java 100.0%