gpt4 book ai didi

bash - 使用 wget 和正则表达式抓取数据

转载 作者:行者123 更新时间:2023-11-29 09:10:41 25 4
gpt4 key购买 nike

我刚刚在学习 bash 脚本,我试图从网站上抓取一些数据,主要是维基词典。这就是我现在在命令行上尝试的,但它没有返回任何结果

wget -qO- http://en.wiktionary.org/wiki/robust | egrep '<ol>{[a-zA-Z]*[0-9]*}*</ol>'

我正在尝试的是获取标签之间的数据,只是想让它们显示出来。你能帮我找出我做错了什么吗?

谢谢

最佳答案

您需要将输出发送到标准输出:

wget -q http://en.wiktionary.org/wiki/robust -q -O - | ...

获取所有<ol>你可以用 grep 标记:

wget -q http://en.wiktionary.org/wiki/robust -O - | tr '\n' ' ' | grep -o '<ol>.*</ol>'

关于bash - 使用 wget 和正则表达式抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7361229/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com