- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
weka SimpleKMeans实现允许用户使用选项 -s 指定“种子值”。我不明白这是什么意思。在 this link , weka 架构师 Mark Hall 说它应该生成随机数。
Weka 实现应该遵循 KMenas++ 上的论文(如文档中所述),如果我理解的话,群集质心点是使用 aforementioned paper 中第 3 页第 2.2 节的方程式 1b 确定的。 ,并且没有其他随机性来源。
谁能指出我哪里错了?
最佳答案
这是 k-means 算法的常见最佳实践(注意:k-means 有不止一种算法;它们是启发式算法,因为据报道寻找最优解是 NP-hard ) 使用不同的随机初始中心进行多次迭代。
所以随机性通常与选择初始中心有关。 K-means++ 是选择初始种子的另一种方法,幸运的是仍然是随机的(有一些不是随机的,所以你不能再尝试通过多次运行来改善你的结果),但尝试选择一个更好的开始情况。
除了初始均值之外,您为什么要寻找另一个随机性来源?
我不推荐将 Weka 用于集群。分类没问题,但对聚类和其他无监督方法的支持非常有限。相反,看看 ELKI。他们的 k-means package例如非常详尽。他们有大约 6 种不同的方法来选择初始方法。大多数是随机的。最简单和最常见的初始化可能只是从数据库中的 k 个随机对象开始。 IIRC,MacQueen 使用了前 k 个对象,因此该变体不是随机的(除非你先洗牌你的数据集,这对于很多算法来说实际上是个好主意 - 永远不要使用排序数据!)因此,这些初始化器中的大多数都带有一个参数 -kmeans.seed
,您猜怎么着,它允许您控制随机生成器播种,以获得可重现的结果。
关于java - weka K中 "seed"的意义表示聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16699851/
2017 年 7 月 19 日更新 在这里找到解决方案:https://stackoverflow.com/a/10021912/5729266 如果您不想读到最后,请快速得出结论。 我之前的代码中随
golang 文档说 Seed, unlike the Rand.Seed method, is safe for concurrent use. rand.Seed 实际上是来自math/rand
我正在尝试重现我之前运行的模拟,以便在文本文件中记录当前日期时间的种子,然后使用记录的日期时间种子来获取与之前获得的相同的值 但是,我不确定为什么得出的值与我在之前的模拟中运行的值不相似。 这是我尝试
rake db:seed 每当您修改种子数据时,重新运行种子数据是否会删除现有种子数据并重新创建或仅添加新记录? 最佳答案 当您运行时 rake db:seed , db/seeds.rb 仅包含在
是否可以在 Laravel 5 中使用以下内容为相关表做种? php artisan db:seed 我有两张 table users id first name projects
我正在尝试为一组足球队和足球位置播种,奇怪的是,rails 根本没有这样做。 rake db:seed --trace ** Invoke db:seed (first_time) ** Execut
我正在寻找网络。我发现这个话题https://iamtrask.github.io/2015/07/12/basic-python-network/ 一切顺利,但我无法理解那部分: # seed ra
在Python的numpy库中,np.random.seed方法可以接受两种不同类型的参数:int和array_like[int] . 它们有什么区别?如:np.random.seed(2) 和np.
我正在使用 scikit-learn 和 numpy,我想设置全局种子,以便我的工作可重现。 我应该使用 numpy.random.seed 还是 random.seed? 从评论中的链接,我了解到它
出于某种原因,当我尝试通过 heroku 执行此操作时,我的 db:seed 无法正常工作。当我在本地执行时,它工作正常。 paul@paul-laptop:~/rails_projects/fogl
我正在尝试同步转换我的图像和 mask 标签,但随机增强以不同方式应用于两个生成器(当我将两个图像保存到一个目录时证明)。 我试过了 在我的库堆栈中播种所有生成器 禁用随机播放和多处理 确保图像和蒙版
我想在特定行之后结束set.seed()的范围,以便对其余代码进行真正的随机化处理。这是一个我想让set.seed()用于“ rnorm”(第4行)而不是“ nrow”(第9行)的示例 set.see
想知道你是否可以帮助我: 我有一个名为initializeAll的方法: public final void initializeAll() { //other stuff........ rand
我有一行代码使用高精度时钟的纳秒抓取来为 mersenne twister 伪随机数生成器播种。类似这样的事情: rng.seed(duration_cast(high_resolution_cloc
我正在浏览一些关于 ASP.NET MVC 的教程(here 和 here),并决定自己尝试一些东西。现在,我有三个表,Resume、Descriptions、SubDescriptions。这是三者
我正在使用 random.seed() 来尝试保持 random.sample() 与我从列表中采样更多值相同,并且在某些时候数字会发生变化......我认为那个seed() 函数的目的是保持数字相同
我正在研究中等规模的数据集,比如从具有 100,000 个观察值的大型数据集中采样的 9000 个观察值。 我可以使用以下 set.seed() 函数来保证每次都获得完全相同的子集吗? set.see
我在 Laravel 中有一个 Seeder public function run() { $user = App\Admin::create([ '
在确信学习和使用 Angular.js 后,我打算启动一个具体的 Web UI 应用程序,以便启动经验学习轮。 (该应用程序将是某种个人计划、待办事项列表、提醒、番茄工作法导向等等......) On
在启动程序之前,我多次看到 R 中的 set.seed 函数。我知道它基本上用于随机数生成。有什么具体需要设置吗? 最佳答案 需求是对可重现结果的可能渴望,例如,这可能来自尝试调试程序,或者当然来自尝
我是一名优秀的程序员,十分优秀!