- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我有一个包含文章的新闻网站,我有一个空白的文章页面,其中包含除标题、照片和我通常手动填写的文本文章本身之外的所有内容。假设我已经从网页中提取了整个 div 类,而不是填写它。我想将此内容直接导入到页面上并以最少的步骤发布。
(我希望我能给你图片。想象一下,除了缺少发动机之外,我的汽车已经完全制造好了,我希望我雇来偷发动机的猴子不要让发动机堆积在外面,而是把发动机也带到外面将它们放入车内并将其安装到汽车中,然后将它们开到汽车经销商处。)我将在网上抓取诸如高尔夫维基百科页面之类的内容,并将其放入我的页面中。我不想一遍又一遍地复制、粘贴和单击发布。我想要网络抓取工具(我已经知道如何构建)再迈出一步,在我的空白页面网站上查找并替换某个 div 类,而不是将数据写入计算机硬盘驱动器上的文件中(尽管也许用Python在我的硬盘上写入,然后让JS或其他东西读取我硬盘上的HTML文件,然后将其写入我的网页将是一种方法。
是否有程序可以执行此操作?您知道可以通过 Python 执行此操作的模块吗?您知道有人在 GitHub 上编写并发布过类似的内容吗?
我不打算抄袭新闻网站,只是为了用一个对象给出一个更简单的例子...如果我从这里拥有整个 div 类“内容”... http://www.zerohedge.com/news/2017-02-18/merkel-says-there-problem-euro-blames-mario-draghi在我的硬盘上另存为 HTML 文件(您可以通过单击主文章文本上的“检查”> 右键单击“复制”> 复制为外部 HTML> 并在文本编辑器中粘贴为 HTML 来查看该文件(再次,某些内容)我本来可以使用网络抓取工具来完成),我怎样才能将其粘贴到空白的“新文章”页面中并通过按按钮自动发布在我的网站上?我可以接受必须单击几个按钮,但不能复制并粘贴。
我将一次又一次地(合法地)对网页的某些部分进行此操作,并且我确信这可以以某种方式实现自动化。我听说财经新闻网站一直在根据数据撰写文章,所以像我需要的东西可能存在。我可能会运行通过基本神经网络抓取的文本或将其输入 GAN。如果您好奇我在做什么,我认为可以通过这种方式制作一些有趣的东西。
最佳答案
如果您使用 Python 来执行此操作,我认为最快的方法是让网络爬虫将其结果保存到您的网站前端共享访问权限的 JSON 文件或 SQL 数据库(存储您的 HTML)拉为文本字符串)。
如果您采用 JSON 路线,只需向其发送一个针对网站的 AJAX 请求,然后使用 innerHTML 将其放置在您要将代码转储到的元素上。
如果您采用 SQL 路线,只需使用一个带有网站的 Python 脚本,您可以向该网站发送 POST 请求,并让该 Python 脚本从数据库中提取您想要的网站数据,并将其作为 JSON 返回到浏览器,然后执行以下操作与上面相同。
直接使用 JSON 的好处是不必设置与 SQL 服务器的连接并处理 SQL 查询到 JSON 的转换步骤。但是,SQL 数据库的好处是,如果您的爬网程序使用多个线程,则不必担心写入 JSON 文件时出现任何问题,并且如果您没有正确锁定文件,则可能会出现写入冲突。
关于javascript - 将网页文章内容在线自动发布到现有模板的最佳方法(使用 FTP?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42320163/
我有一个如下图所示的情节。对于这个情节,我想在情节(右下角或左下角)的某处添加类似的线图。我正在使用的子图的命令是 plot( 1:121, sample(1:121),type='l' ) 它绘制在
我有一个单表数据库,我继承并迁移到 SQL Server,然后通过创建、链接和填充一大堆表示主表中项目的查找类型表来规范化它。我现在想用它们的外键替换原始表中的那些项目。我是不是一直在写一堆查询或 U
我有一个 Web 应用程序,它当前正在从服务器获取 PDF 的 base64 表示。我可以使用 Mozilla 的 pdf.js 在 上显示它并使用下拉菜单切换页面。 根据我所能找到的一切和Can
在 DB2 上运行的 Moodle 2 安装中,删除用户不成功,返回从数据库读取错误: Debug info: [IBM][CLI Driver][DB2/LINUXX8664] SQL0206N "
我在grails项目的RH包中添加了一个名为Authorization的新域类。 然后,我从grails菜单自动生成了 Controller 和 View 。 但是当我尝试输入 Controller
今天,我发现了一个有趣的plunker,经过谷歌大量搜索后一无所获,希望我能在这里找到答案。我只是想要那个笨蛋的副本。我不想使用复制和粘贴技术。有什么方法可以获取已建立的 plunk 的副本吗?我如何
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: Migrate normal sqlite3 database to core data? 是否可以将现有的 sql
我正在尝试在我的应用程序上添加启动画面。我干净地构建了程序,但我选择了错误的文件。现在我第二次编辑了 VM 选项并再次干净构建,现在我收到此错误: C:\Users\User\Documents\Ne
我已经查看了很多问题,我不相信这是重复使用单元格的结果,因为新的单元格图像是正确的,但是现有的单元格图像不正确并且曾经是正确的。我会先发布图片,以便更容易理解问题。 我有一个图像单元的 Collect
我在来自 Vaadin 的 ContainerHierarchicalWrapper 的这段代码中有一个非常奇怪的错误: for (Object object : children.keySet())
到目前为止,我正在使用 Globalize用于我的 JavaScript 应用程序的 i18n 和 l10n(使用 jQuery UI 构建)。这行得通,但它将我的代码与另一个特定的库联系在一起。现在
我正在创建一个 JHipster 应用程序,现在确定了 full text search 的必要性.我知道 JHipster 与 Elasticseach 集成,但我在创建项目时没有启用它。有没有一种
我一直在寻找堆栈中的建议,但我仍然不能 100% 确定改进它的最佳方法。我有一个存储大约 130K 条记录的 mysql INNODB“产品”表。杂项产品数据等大约有 80 个字段,然后我们一直在为每
我在一本书上看到,它说:当我们使用另一个初始化新创建的对象时 - 使用复制构造函数创建一个临时对象,然后使用赋值运算符将值复制到新对象! 后来在书中我读到:当使用另一个对象初始化新对象时,编译器创建一
我第一次安装现有的 Django 项目时遇到了启动服务器 python manage.py runserver 的问题 这是我做的 1.克隆仓库, 2.制作虚拟环境 3.pip安装要求.txt 4.生
我有一个网站,还有一个登录表单。我不想使用 PHP 来检查我的 MySQL 数据库,因此我正在寻找一种方法来检查用户凭据以查看是否已有 Linux 用户。我知道 PAM,但我还没有找到任何有关如何从网
我有一个现有的 Umbraco 项目在 IIS 服务器上运行。当我开始这个项目时,我基本上是将 Umbraco 直接安装到服务器上,并通过管理界面进行编码,直到网站启动并上线。 现在,客户想要一些更改
我是 Android 开发新手,目前正在学习一些教程。当我在 Eclipse 中设置一个新的 Android 项目,并选择 Windows -> Android SDK and AVD Manager
我有这个注册页面可以正常工作,但对于电子邮件字段,我需要确保电子邮件正确有效1:正确2 : 有效 为了正确添加电子邮件,我正在使用 Java 脚本验证来维护abc@def.com 很好用 但我的问题是
首先让我说我不熟悉 COM 引用,并且我在 Windows 7 64 位计算机上使用 VS2010。今天早上,我从 TFS 中删除了一个现有项目。然后我尝试构建项目并收到此错误: The type o
我是一名优秀的程序员,十分优秀!