gpt4 book ai didi

javascript - 将网页文章内容在线自动发布到现有模板的最佳方法(使用 FTP?)

转载 作者:行者123 更新时间:2023-12-03 04:58:46 24 4
gpt4 key购买 nike

假设我有一个包含文章的新闻网站,我有一个空白的文章页面,其中包含除标题、照片和我通常手动填写的文本文章本身之外的所有内容。假设我已经从网页中提取了整个 div 类,而不是填写它。我想将此内容直接导入到页面上并以最少的步骤发布。

(我希望我能给你图片。想象一下,除了缺少发动机之外,我的汽车已经完全制造好了,我希望我雇来偷发动机的猴子不要让发动机堆积在外面,而是把发动机也带到外面将它们放入车内并将其安装到汽车中,然后将它们开到汽车经销商处。)我将在网上抓取诸如高尔夫维基百科页面之类的内容,并将其放入我的页面中。我不想一遍又一遍地复制、粘贴和单击发布。我想要网络抓取工具(我已经知道如何构建)再迈出一步,在我的空白页面网站上查找并替换某个 div 类,而不是将数据写入计算机硬盘驱动器上的文件中(尽管也许用Python在我的硬盘上写入,然后让JS或其他东西读取我硬盘上的HTML文件,然后将其写入我的网页将是一种方法。

是否有程序可以执行此操作?您知道可以通过 Python 执行此操作的模块吗?您知道有人在 GitHub 上编写并发布过类似的内容吗?

我不打算抄袭新闻网站,只是为了用一个对象给出一个更简单的例子...如果我从这里拥有整个 div 类“内容”... http://www.zerohedge.com/news/2017-02-18/merkel-says-there-problem-euro-blames-mario-draghi在我的硬盘上另存为 HTML 文件(您可以通过单击主文章文本上的“检查”> 右键单击​​“复制”> 复制为外部 HTML> 并在文本编辑器中粘贴为 HTML 来查看该文件(再次,某些内容)我本来可以使用网络抓取工具来完成),我怎样才能将其粘贴到空白的“新文章”页面中并通过按按钮自动发布在我的网站上?我可以接受必须单击几个按钮,但不能复制并粘贴。

我将一次又一次地(合法地)对网页的某些部分进行此操作,并且我确信这可以以某种方式实现自动化。我听说财经新闻网站一直在根据数据撰写文章,所以像我需要的东西可能存在。我可能会运行通过基本神经网络抓取的文本或将其输入 GAN。如果您好奇我在做什么,我认为可以通过这种方式制作一些有趣的东西。

最佳答案

如果您使用 Python 来执行此操作,我认为最快的方法是让网络爬虫将其结果保存到您的网站前端共享访问权限的 JSON 文件或 SQL 数据库(存储您的 HTML)拉为文本字符串)。

如果您采用 JSON 路线,只需向其发送一个针对网站的 AJAX 请求,然后使用 innerHTML 将其放置在您要将代码转储到的元素上。

如果您采用 SQL 路线,只需使用一个带有网站的 Python 脚本,您可以向该网站发送 POST 请求,并让该 Python 脚本从数据库中提取您想要的网站数据,并将其作为 JSON 返回到浏览器,然后执行以下操作与上面相同。

直接使用 JSON 的好处是不必设置与 SQL 服务器的连接并处理 SQL 查询到 JSON 的转换步骤。但是,SQL 数据库的好处是,如果您的爬网程序使用多个线程,则不必担心写入 JSON 文件时出现任何问题,并且如果您没有正确锁定文件,则可能会出现写入冲突。

关于javascript - 将网页文章内容在线自动发布到现有模板的最佳方法(使用 FTP?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42320163/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com