- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
嗨,上周 Facebook 宣布了 Fasttext,这是一种将单词分类到桶中的方法。 Latent Dirichlet Allocation 也是进行主题建模的另一种方法。我的问题是,有没有人对这两个方面的优缺点进行过比较。
我没有尝试过 Fasttext,但根据我的经验,这里有一些 LDA 的优缺点
专业版
迭代模型,支持Apache spark
接收文档语料库并进行主题建模。
不仅要找出文档讲的是什么,还要找出相关文档
Apache spark 社区不断为此做出贡献。早些时候他们让它在 mllib 上工作,现在在 ml 库上工作
反对
需要很好地定义停用词。它们必须与文档的上下文相关。例如:“文档”是一个出现频率很高的词,可能在推荐主题的图表中名列前茅,但它可能相关也可能不相关,因此我们需要更新它的停用词
有时分类可能无关紧要。在下面的示例中,很难推断出这个桶在说什么
主题:
术语:纪律
Term:disciplines
Term:notestable
Term:winning
术语:路径
Term:chapterclosingtable
术语:元程序
术语:突破
Term:distinctions
术语:救援
如果有人对 Fasttext 做过研究,你能更新你的学习吗?
最佳答案
fastText 提供的不仅仅是主题建模,它还是一种使用浅层神经网络生成词嵌入和文本分类的工具。作者表示其性能可与更复杂的“深度学习”算法相媲美,但训练时间要短得多。
优点:
=> 训练自己的 fastText 模型非常容易,
$ ./fasttext skipgram -input data.txt -output model
只需提供您的输入和输出文件、要使用的架构等等,但如果您希望稍微自定义您的模型,fastText 也提供更改超参数的选项。
=> 在生成词向量时,fastText 会考虑称为字符 n-gram 的词的子部分,这样即使相似的词恰好出现在不同的上下文中,它们也具有相似的向量。例如,“supervised”、“supervise”和“supervisor”都被分配了相似的向量。
=> 先前训练的模型可用于计算词汇表外单词的单词向量。这个是我的最爱。即使您的语料库的词汇量是有限的,您也可以获得世界上几乎所有存在的词的向量。
=> fastText 还提供了为段落或句子生成向量的选项。通过比较文档的向量可以找到相似的文档。
=> 预测一段文本的可能标签的选项也已包括在内。
=> 在维基百科上训练的大约 90 种语言的预训练词向量在官方 repo 中可用。
缺点:
=> 由于 fastText 是基于命令行的,所以我在将它整合到我的项目中时遇到了困难,但这对其他人来说可能不是问题。
=> 没有内置的方法来查找相似的单词或段落。
对于那些希望阅读更多内容的人,这里是官方研究论文的链接:
1) https://arxiv.org/pdf/1607.04606.pdf
2) https://arxiv.org/pdf/1607.01759.pdf
并链接到官方仓库:
关于facebook - fasttext与LDA的比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39071317/
我为我们的业务创建了一个 Facebook 页面,我创建了一个 Facebook 应用程序来获取 AppID,以便在 Facebook 插件中使用它。 我注意到 Facebook 应用程序的页面看起来
是否有可能知道哪个 Facebook 用户点击了我的应用用户在 Facebook 上分享的链接? 为了清楚起见,让我改写一下:我想知道我的应用用户的哪些 friend 点击了他的共享链接。 感谢任何提
我正在浏览 facebook pixel,对 facebook pixel 如何知道哪个转化来自哪个 facebook 广告感到很困惑? 假设我有这个 url http://example.com安装
我正在开发 sucsongmoi.net(越南语),当浏览者从他们的墙上分享网站链接时,一些链接 facebook 获得描述和图像,一些链接 facebook 无法获得描述和图像。 例如:分享 suc
一位同事错误地设置了个人 Facebook 页面;它应该是一个企业 Facebook 页面。 个人页面上有几个 friend 需要重定向到正确的 Facebook 业务页面。 我可以将用户从错误的个人
在 Facebook 上,当您转到“编辑我的个人资料”>“艺术和娱乐”时,会有一个“电影”自动完成小部件,它会在您输入电影时推荐电影。 因此,如果您输入“Jones”,它将开始建议: 印第安纳琼斯 布
我在我的网页上使用 Facebook 登录。首次登录时,Facebook 登录应用程序会请求获取用户数据的权限。 有什么方法可以改善这个问题,以请求喜欢我的 Facebook 页面的许可?用户点击后,
我需要知道是否可以将现有的 Facebook 页面(类别:应用程序页面)链接到 Facebook 应用程序?当我进入 Facebook 应用程序设置时,他们建议创建一个新页面。但我需要的只是链接到现有
我的网站应用程序具有通过 Facebook 登录进行登录的功能。为此,我的应用程序出现在 Facebook 上。使用 Facebook 登录工作正常。 但应用程序具有将 Facebook 帐户链接和取
我正在制作一个应用程序,让人们可以在 Facebook 上与特定的 friend 分享内容。示例:Alice 使用我的应用程序,她与 Bob 分享了一篇文章,Bob 是她的 Facebook 好友。现
我正在按照列出的说明进行操作 http://docs.appcelerator.com/platform/latest/#!/api/Modules.Facebook 并查看 Arrow 示例目录中的
假设我有一个餐厅的商业网站,一位顾客为一大群人预订了一张 table 。有没有一种方法可以让客户有机会在餐厅网站上创建 Facebook 事件,作为预订流程的一部分。我知道客户必须以某种方式从餐厅网站
我想让我的用户将他们的用户帐户与 Facebook 或 Twitter 相关联,并允许他们使用他们的 Facebook/Twitter 帐户登录我的服务器,而不是使用传统的用户名/密码。与StackO
我们有一个面子书页面。我们添加了一个自定义 FBML 选项卡。现在我们要添加评论面子书插件。我尝试添加一个脚本,我从 Face book Social Plug in .代码是 之后我将此脚本放入自
大家好 请帮我找到关于以下的官方信息: 1) 什么是“FaceBook 登录” 2) 什么是“FaceBook Connect” 谢谢 最佳答案 你可以在那里找到你需要的一切: http://deve
这是最奇怪的事情。我有非常简单的 CF 代码,查看 cgi.HTTP_REFERER。简单地说,它查看推荐人。如果链接是从我们的主要网站域之外单击的,它会显示一些内容。否则,什么也不会发生。所以,如果
我还是 Facebook Graph API 的新手,正在尝试开始使用 Facebook 地点搜索。 (按位置搜索地点) https://graph.facebook.com/search?type=
我不想开设 Facebook 帐户,但我被要求为需要使用 Facebook API 的应用程序开发功能。有没有一种方法可以开发这些功能并使用 Facebook API,而无需开设个人 Facebook
我已经按照指示实现了 DotNetOpenAuth 提供的示例应用程序 here . 正如您在下面看到的,这要求用户安装此 facebook 应用程序。 我只是想让用户使用他们的 Facebook 登
我的主页上有标准的 Facebook 登录按钮,我不希望人们仅在用户单击登录按钮时使用他们的 Facebook 帐户自动登录我的网站。 如果用户未登录 Facebook,将出现一个弹出窗口询问他的凭据
我是一名优秀的程序员,十分优秀!