gpt4 book ai didi

regex - 如何从 HTML 文件中提取标签的属性值?

转载 作者:行者123 更新时间:2023-11-29 09:01:19 25 4
gpt4 key购买 nike

我知道,不要使用 curl、grep 和 sed 进行解析。但我正在寻找一种简单的方法,而不是一种非常安全的方法。

所以我得到了一个带有 curl 的 HTML 文件,我需要从中获取标签中某个属性的值。我使用 grep 获取显示 token 的行。这只会发生一次。这给了我一个完整的 div:

<div class="userlinks">
<span class="arrow flleft profilesettings">settings</span>
<form class="logoutform" method="post" action="/logout">
<input class="logoutbtn arrow flright" type="submit" value="Log out">
<input type="hidden" name="ltoken" value="a5fc8828a42277538f1352cf9ea27a71">
</form>
</div>

我怎样才能只获取值属性(例如“a5fc8828a42277538f1352cf9ea27a71”)?

最佳答案

不需要grep:

sed -n '/token/s/.*name="ltoken"\s\+value="\([^"]\+\).*/\1/p' input_file

关于regex - 如何从 HTML 文件中提取标签的属性值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11523809/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com