- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我之前在大学学习过 Java 的为期 3 个月的短期类(class)(唯一的项目是编写数独游戏)。
我想学习一种对于一般自动化任务来说最流行的编程语言。到目前为止,我已经选择了 AHK,它帮助我完成了很多文本扩展/应用程序快捷方式等等。
希望进一步推进并完成以下任务,例如:
1 转到此站点:https://carousell.com/search/products/?query=12-35mm
2 抓取所有包含“Panasonic”、“12-35mm”的数据(抓取这些结果的每一页会很困难吗?)
3 获取价格栏的价格。如果价格具有误导性(例如 1 美元或低于 $X 4 值),请在商品描述中搜索价格值 ("$)。
4 在 Excel 中对结果进行制表
5 将最新结果与平均价格进行比较。
6 如果最新价格低于平均价格 > 通过电子邮件提醒我。
我的大多数自动化项目都是这样的。最好的编程语言是什么?哪些付费教程可以指导我做到这一点?
我已将范围缩小到 Import.IO 和 Python;但我可能是错的。
这门类(class)似乎很有用,但我不确定它是否能教会我完成这个个人项目所需的所有知识。
https://www.udemy.com/automate/
请指教,谢谢!
最佳答案
Python 非常适合此类网络抓取和处理。您的工作需要几个模块:
通过 HTTP(S) 获取页面:由于您要抓取的页面不使用 Javascript 来输出您需要的信息,我建议使用很棒的 requests就足够了。
解析 HTML 并提取信息:这里有很多选择,我个人最喜欢的是 BeautifulSoup 。如果你想深入挖掘,有一个question about this .
将结果保存到 Excel 中:有几个模块可以再次完成这项工作,我最喜欢的是 openpyxl 。如果您不需要保存非常大的文件,这应该就可以了。
价格比较:您可以仅使用脚本来比较价格,Excel 工作表充当“数据库”。
电子邮件:您可以使用 Python standard library 发送电子邮件。这是fine tutorial怎么做..
<小时/>不要尝试编写脚本,如果您需要任何特定阶段的提示,请返回特定代码,该代码不适用于该特定部分,然后我们可以为您提供帮助。
关于python - 抓取价格 > 制表 > 提醒我,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42037398/
如何使用 tabulate 包在 python 中合并多个表? append 在 python 中连接两个表时不起作用。这些表是使用 python 中的 tabulate 包实现的。 table_1
我想使用制表法将两个表格并排显示。 我的方法: test_table1 = tabulate([['Alice', 24], ['Bob', 19]]) test_table2 = tabulate(
我之前在大学学习过 Java 的为期 3 个月的短期类(class)(唯一的项目是编写数独游戏)。 我想学习一种对于一般自动化任务来说最流行的编程语言。到目前为止,我已经选择了 AHK,它帮助我完成了
我的脚本有问题.. 用户需要向一个 div 输入数据,当一个 div 已满(4 个字符)时,脚本应自动移动到下一个字段。 在处理输入时,这非常有效: http://jsfiddle.net/4m5fg
我正在使用 MySQL Workbench 来编写一些查询。我想设置 MySQL 编辑器,以便在按 Enter 键换行时在下一行中保持对齐或水平制表。就像编程编辑通常所做的那样,我想你就是我的意思。
我正在尝试:(1) 估计只有因变量发生变化的多个模型 (2) 使用 Stargazer 包将结果制表 以下代码有效,但我必须为每个模型重复一行代码: library(stargazer)
我是一名优秀的程序员,十分优秀!