mahout-examples-0.8-job.jar包

mahout-examples-0.8-job.jar包

版本:官方免费版大小:36.9M

类别:编程辅助系统:WinXP, Win7, Win8, Win10

立即下载
  • mahout-examples-0.8-job.jar包 官方免费版0
  • mahout-examples-0.8-job.jar包 官方免费版1

mahout-examples-0.8-job.jar包是配置mahout环境所必须的文件包,能够为mahout环境提供更多算法实例,更加便捷的辅助软件开发,包括分类、过滤等功能,是一份及其重要的文件包。感兴趣的朋友欢迎前来IT猫扑下载体验吧!

mahout-examples-0.8-job.jar包

mahout基本介绍

Mahout是Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

mahout主要特性

虽然在开源领域中相对较为年轻,但 Mahout 已经提供了大量功能,特别是在集群和 CF 方面。Mahout 的主要特性包括:

Taste CF。Taste 是 Sean Owen 在 SourceForge 上发起的一个针对 CF 的开源项目,并在 2008 年被赠予 Mahout。

一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。

Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。

针对进化编程的分布式适用性功能。

Matrix 和矢量库。

上述算法的示例。

Mahout环境的安装和配置

在安装运行mahout之前,需要配置好hadoop。我的hadoop是vmware8.0+ubuntu12.04+ubuntu12.04.两台虚拟机搭建的集群。网上资料很多。这里主要介绍mahout的安装和运行。

1、首先在下载mahout0.8.我选择是的mahout-examples-0.8-job.jar。(如果你在windows下运行,可以下载zip)

2、下载完毕,我们拷贝到虚拟机ubuntu系统桌面上中,然后把它拷贝到本地目录下cd Desktop/cp mahout-examples-0.8-job.jar/home/sun/(把mahout安装包拷贝到用户sun的目录下)

然后解压 tar zxvf mahout-examples-0.8-job.jar。

解压之后 ls -l 。可以看到解压之后的文件

如果想修改文件名可以使用mv。google 百度之...

3、配置文件

找到etc/profile 进行编辑。

sudo gedit /etc/profile

提示你输入密码,输入密码之后就进入了profile文件里面,在最下面可以看到

修改完毕之后,一定要运行source /etc/profile命令,使其生效。

4、在mahout安装目录下的bin文件内找到mahot 文件

比如这个路径:/home/sun/mahout-examples-0.8-job.jar/bin,在mahout文件里添加hadoop路径,必须要添加的,否则运行出错。打开之后,在#!/bin/bash的下面添加hadoop的安装路径和配置路径  (不要直接复制粘贴,请参照你的安装路径)

#    HADOOP_HOME=/home/sun/hadoop-2.2.0

#    HADOOP_CONF_DIR=$HADOOP_HOME/conf

添加这两行,保存退出!

5、安装完毕。下面我们可以测试是否安装成功。

退回根目录下,运行mahout。如实看到下面两行则表示成功。等待片刻(时间有点长,大概1分钟左右),会列出所包含有的算法。

6、启动hadoop-- 。 ./sbin/start-dfs.sh和./sbin/start-yarn.sh。

运行jps.可以看到

6331 jar

7555 SecondaryNameNode

8308 RunJar

7288 NameNode

5045 FsShell

2906 RunJar

8402 Jps

4733 RunJar

表示已经成功!!!

7、接下来就是测试阶段了。

下载测试文件synthetic_control.data,并把这个文件放在$MAHOUT_HOME目录下。(这个好像是必须,我放到其他目录下,运行时会出错!!!不知why)

然后把synthetic_control.data拷贝到hdfs文件系统下面。新建一个testdata(名字必须为testdata).

hdfs dfs -mkdir testdata

然后拷贝

hdfs dfs -put $MAHOUT_HOME/synthetic_control.data testdata/

我们只用kmeans算法。输入例子为hadoop jar /home/hadoop/mahout-distribution-0.8/mahout-examples-0.8-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

然后就开始运行了。需要一段时间。因为内容比较多。

查看全部

更新时间:2017-07-03
厂商名称:
包名:
MD5:
权限须知点击查看
权限管理须知关闭
玩家评论 QQ群号:203046401
我要跟贴
    取消
    猜你喜欢
    • jar包

    jar包更多>>

    JAR(JavaArchive,Java归档文件)是与平台无关的文件格式,它允许将许多文件组合成一个压缩文件.为J2EE应用程序创建的JAR文件是EAR文件(企业JAR文件).JAR文件格式以流行的ZIP文件格式为基础.与ZIP文件不同的是,JAR文件不

    同类推荐
    热门精品
    显示全部+最新应用