- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
这是个愚蠢的问题,但总得有人问。
我试过在本地运行 Mahout,效果很好。现在,我希望工作由远程集群执行,而不是我的本地机器。
那么,我应该在 Hadoop 机器上部署 Mahout 代码,还是我仍然可以使用 Hadoop 在我的本地机器接口(interface)上远程制作 Mahout?
最佳答案
不,您不会自己在 Hadoop worker 上安装 Hadoop 程序。那将是一场噩梦。当您通过 hadoop jar
向它提供包含所有代码的 JAR 文件时,Hadoop 会为您完成。
当您运行 Mahout 或任何其他基于 Hadoop 的东西时,在您的本地计算机上运行的是一个客户端程序,它使用 Hadoop 代码将信息发送到集群以开始工作。该集群可能是本地的,也可能是远程的——对您运行客户端的方式没有影响,只是客户端与什么对话。
关于hadoop - Hadoop的master节点需要安装Mahout吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11569344/
谁能告诉我 mahout 的 RecommenderIRStatsEvaluator 是如何工作的?更具体地说,它如何随机拆分训练和测试数据以及结果与哪些数据进行比较?基于我的低估,您需要某种理想/预
我正在学习 Mahout 并阅读“Mahout in Action”。 当我尝试运行第 7 章 SimpleKMeansClustering.java 中的示例代码时,弹出了一个异常: 线程“main
我已经在 Mahout 教程中的合成控制数据上运行了 k-Means 聚类算法,并且想知道是否有人可以解释如何解释输出。我运行了 clusterdump 并收到了如下所示的输出(为了节省空间而被截断)
我有一个基于用户相似性的 bool 偏好推荐器。我的数据集本质上包含关系,其中 ItemId 是用户决定阅读的文章。我想添加第二个数据模型,其中包含 ItemId 是对特定主题的订阅。 我能想到的唯一
对于机器学习新手来说,高效使用 Apache Mahout 的学习先决条件是什么? 我知道 Mahout 的提交者需要微积分、线性代数、概率和机器学习才能贡献任何有用的东西。但是 Apache Mah
我正在为我的数据训练 mahout 分类器, 按照我发出的创建 mahout 模型的命令 ./bin/mahout seqdirectory -i /tmp/mahout-work-root/MyDa
我正在读取大约 700 万行数据,当我重新启动应用程序时,加载所有内容需要将近两分钟的时间。我试图找出加快速度的最佳方法,以便最多只需几秒钟即可重新启动应用程序。这是我希望加快速度的代码以及当前所需的
我正在尝试使用 Apache Mahout 创建一个基于项目的推荐器,该推荐器根据其他用户也有共同点的相似项目推荐后备项目。 我首先创建一个数据模型,然后尝试将它传递给各种不同的 ItemSimila
我使用 Mahout 和 Pearson 相关算法来根据用户对多个项目的偏好来比较和查找相似用户。我遇到的问题是 Mahout 和/或 Pearson 忽略了为每个项目选择相同偏好的用户。有谁知道是否
我正在通过 apache mahout 运行朴素贝叶斯分类器算法。我们可以选择在训练和运行算法实例时设置克大小。 将 n-Gram 大小从 1 更改为 2,会极大地改变最终的分类。为什么会出现这种情况
任何人都可以建议 Mahout 到底想要应用 LDA 的输入类型吗?如果有人请详细写下以获取输出,那就太好了 最佳答案 关于 mahout 中最新形式的 LDA 的文档有点稀疏。现在它被称为“cvb”
我有一个包含 5000 万个用户偏好的数据集,其中包含 800 万个不同的用户和 18 万个不同的产品。我目前正在使用 bool 数据模型,并有一个基于谷本相似性的基本推荐器。我正在尝试探索不同的算法
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improve
我正在尝试 Apache Mahout,有很多关于如何使用 LDA 生成主题模型的信息,但是关于如何使用新的 CVB lda 算法执行相同操作的信息很少。我想要做的是生成单词到主题的概率,类似于原始的
我的环境: 驯象师:0.7 Hadoop:1.0.3 我做了什么: 安装了 mahout,并测试了朴素的贝叶斯示例 - 20newsgroup,它运行良好。 我想要达到的目标: 有 trainnb 和
当前的 Mahout 0.8-SNAPSHOT 包括用于主题建模的折叠变分贝叶斯 (cvb) 版本并删除了潜在狄利克雷分析 (lda) 方法,因为 cvb 可以更好地并行化。不幸的是,只有 lda 的
我所说的动态数据评级是指基于时间的推荐系统。 电影推荐的一个示例用例,推荐引擎读取用户历史电影观看数据并发现用户喜欢在周末观看 Action 片,引擎应该对 Action 片评分较高。 然而,由于历史
我有一个包含数据向量的文件,其中每一行都包含一个以逗号分隔的值列表。我想知道如何使用 mahout 对这些数据执行 k 均值聚类。维基中提供的示例提到了创建序列文件,但我不确定是否需要进行某种类型的转
我是 Mahout 的新手,正在尝试使用 0.5 版本的“Mahout in Action”。早期的示例之一要求使用斜率一推荐器。这个推荐器是否仍然包含在 Mahout 0.9 中?我已经浏览了文档,
我是 hadoop 的新手,更不用说 mahout 了。我希望有人可以帮助我通过这里..已经尝试了 2 天.. 我已经有一个 hadoop 集群在运行。 我正在使用 hadoop-2.0.0-alph
我是一名优秀的程序员,十分优秀!