- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
{
“博客”:11,
“博客作者id”:2,
"blog_content": "(这是博客完整内容:在base64上编码的html,例如) PHNlY3Rpb24+PGRpdiBjbGFzcz0icm93Ij4KICAgICAgICA8ZGl2IGNsYXNzPSJjb2wtc20tMTIiIGRhdGEtdHlwZT0iY29udGFpbmVyLWNvbnRlbn",
"blog_timestamp": "2018-03-17 00:00:00",
"blog_title": "亚马逊印度时装周:秋季-",
"blog_subtitle": "",
"blog_featured_img_link": "图片链接",
"blog_intropara": "文章的介绍性段落",
“博客状态”:1,
"blog_lastupdated": "\"2018 年 3 月 19 日上午 7:42:23\"",
"blog_type": "博客",
"blog_tags": "1,4,6",
"blog_uri": "亚马逊-印度-时装周-秋季",
“博客类别”:“1”,
“blog_readtime”:“5”,
“浏览次数”:0
}
以上是根据我的 API 编写的一个示例博客。我有一个此类博客的 JsonArray。
我试图根据博客的属性(例如:标签、类别、作者、标题/副标题中的关键字)和内容来预测 3 个类似的博客。我没有用户数据,即没有登录的用户数据(例如评分或评论)。我知道如果没有用户数据,它就不会准确,但我刚刚开始接触数据科学或机器学习。任何建议/链接表示赞赏。我更喜欢使用 java,但 python、php 或任何其他语言也适合我。因为我是初学者,所以我需要一个易于实现的模型。提前致谢。
最佳答案
我的直觉是这个问题可能不在正确的地址。
但是
我会执行以下操作:
您的算法应该比 k-NN 短一两步,k-NN 被认为是更简单的 ML 之一,是一个很好的起点。
祝你好运。
您想要使用文本、标签、数字以及时间序列数据构建推荐引擎。这是一个广泛的要求。就像您一样,当面对这个请求时,我需要深入研究数据和研究最佳方法。有些方法需要不同的数据集。例如。协作过滤与基于内容的过滤。
我知道这有点夸张,但这里没有实际的代码问题。重申一下我的直觉,这个问题可能没有提出正确的地址。我真的很想帮忙,但这是我能做的最好的了。
如果我正确理解您的新评论,每个博客都有以下内容:
我会创建一个 heuristic并允许流程调整每个统计数据的重要性。
挑战在于量化 TF-IDF 输出的单词分数。您可以将这些(超过一定分数)视为标签并运行另一个相似性分析,或计算重叠。
您已经开始走这条路,并且此答案假设您将继续。 IMO 的最佳途径是查看哪些专用推荐引擎可以帮助您,而无需构建零散的统计数据(带欧几里德的数字、带 Jaccard 的标签、带 TF-IDF 的文本)。
关于machine-learning - 仅根据博客 Prop 和内容预测 3 个相似博客的最佳算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49063169/
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我基本上有三个环境用于在我的主站点上工作。我的计算机上有我的本地一个,而我的网络服务器上有开发和实时的。我在本地环境中使用 Wordpress 开发了该站点,并希望通过 svn 使所有内容保持最新。
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 5年前关闭。 Improve thi
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我有 gatsby 博客,在我创建新帖子并构建静态文件后,将它们上传到我的主机上,每个用户都必须在我的博客上进行硬刷新才能看到更改。 上传新版本后如何在下次访问时自动刷新? 最佳答案 这种行为的另一个
我需要博客链接,以及涵盖 GroovyFx 的教程。我试过在谷歌上搜索它,我没有得到任何有用的教程。我需要从上到下全面覆盖 GroovyFx! 提前致谢。 最佳答案 您的意思是您想要全面覆盖的博客条目
我最近更换了计算机,并且不小心删除了所有源(Markdown 文件等)的本地版本。不管我怎么想,这一切都在 Github(我使用 GitHub 页面)中,所以我可以从那里开始。但是,我已经进入 Git
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
标题几乎说明了一切。博客在同一个帐户下。 Asked this question on Quora几乎没有回应。 我正在寻找一个网络应用程序,它可以自动执行该过程。如果那里还没有任何东西,我准备使用
在浏览一些关于 Java 反射和泛型的 Jakov Jenkov 博客时,我发现了以下段落: When runtime inspecting a parameterizable type itself
我进退两难:我已经做了rake deploy我的 Octopress 博客运行良好。文档说我必须再做 3 个步骤: git add . git commit -m 'message' git push
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我尝试了几种方法,但似乎无法完成其中的每一部分。我为某人制作了一个 wordpress 博客,她对此很满意,但最近想要更改标题。我把它放宽了,她想要它装箱/居中。基本上,标题包含 Logo 、导航和左
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我已经尝试在我的网络服务器上安装 Ghost.io 有一段时间了。我有一个带有 Centos 6 和 Cpanel 的 VPS。 今天我在 http://www.allaboutghost.com/o
这里我有一个网站,tinywolf.uk,我目前正在使用它。主页是一个独立于 wordpress 的静态网站,但网站的博客部分 http://www.tinywolf.uk/blog将由 wordpr
我是 Django Web 开发的半菜鸟。我已经成功添加了一个文件字段,实际上允许我将图像上传到帖子中(图像显示在帖子列表和帖子详细信息中),但是如果我想在帖子中添加多个图像该怎么办? 我目前正在撰写
我特别想了解 Web 开发和 Windows azure。我认为为个人网站创建一个博客应用程序将是一个很好且简单的项目来实现这一目标。 有谁知道演练/教程可以帮助我走上这条路,或者更好地涵盖这个确切的
我遇到了一个小问题,因为我目前正在尝试以编程方式同时登录两个 wordpress 博客。我有一个自定义登录页面,必须为两个 wordpress 博客创建 session 。一个博客工作得很好,但因为我
我是一名优秀的程序员,十分优秀!