gpt4 book ai didi

python - 使用 urllib 解析/拆分 pandas 数据框中的 URL

转载 作者:太空宇宙 更新时间:2023-11-03 14:05:29 24 4
gpt4 key购买 nike

我正在尝试拆分 URL 并将片段放入数据框中。我找到了这个帖子pythonic way to parse/split URLs in a pandas dataframe并尝试应用它,但由于某种原因它给了我一个错误。

我使用的是 Python 3.x,所以我使用了以下内容:

import pandas
import urllib

urls = ['https://www.google.com/something','https://mail.google.com/anohtersomething', 'https://www.amazon.com/yetanotherthing']
df['protocol'],df['domain'],df['path'],df['query'],df['fragment'] = zip(*df['url'].map(urllib.parse.urlsplit))

我收到一条错误消息 KeyError: 'urls',不确定它的含义。

如果有人能帮忙那就太好了。谢谢。

最佳答案

您使用的示例假设链接位于数据框中。正确的解决方案如下:

import urllib
import pandas as pd

df = pd.DataFrame()
urls = ['https://www.google.com/something','https://mail.google.com/anohtersomething', 'https://www.amazon.com/yetanotherthing']
df['protocol'],df['domain'],df['path'],df['query'],df['fragment'] = zip(*[urllib.parse.urlsplit(x) for x in urls])

结果

  protocol           domain               path query fragment
0 https www.google.com /something
1 https mail.google.com /anohtersomething
2 https www.amazon.com /yetanotherthing

关于python - 使用 urllib 解析/拆分 pandas 数据框中的 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48927719/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com