gpt4 book ai didi

javascript - 使用 Python 从 Javascript 中提取文本

转载 作者:行者123 更新时间:2023-11-30 15:47:24 26 4
gpt4 key购买 nike

我一直在查看有关如何执行此操作的示例,但不太明白。我正在使用 beautifulsoup 来抓取一些数据——我可以使用它来查找我想要的数据,但它包含在以下代码块中。我正在尝试从中提取时间戳信息。我有一种正则表达式在这里工作的感觉,但我似乎无法弄清楚 - 有什么建议吗?

    <script class="code" type="text/javascript">
$(document).ready(function(){
line1 = [['2009-02-23 10 AM', 5203], ['2009-02-08 10 AM', 3898], ['2009-02-09 10 AM', 4923], ['2009-02-22 10 AM', 3682], ['2009-02-21 10 AM', 3238], ['2009-02-20 10 AM', 4648]];
options1 = {
etc other text
}
});
</script>

最佳答案

您不能使用 BS 获取此数据 - BS 仅适用于 HTML/XML,不适用于 JavaScript。

您必须使用正则表达式 或标准字符串函数。


编辑:

text = '''<script class="code" type="text/javascript">
$(document).ready(function(){
line1 = [['2009-02-23 10 AM', 5203], ['2009-02-08 10 AM', 3898], ['2009-02-09 10 AM', 4923], ['2009-02-22 10 AM', 3682], ['2009-02-21 10 AM', 3238], ['2009-02-20 10 AM', 4648]];
options1 = {
etc other text
}
});
</script>'''

import re

re.findall("'([^']*)'", text)

结果:

['2009-02-23 10 AM',
'2009-02-08 10 AM',
'2009-02-09 10 AM',
'2009-02-22 10 AM',
'2009-02-21 10 AM',
'2009-02-20 10 AM']

关于javascript - 使用 Python 从 Javascript 中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39863723/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com