gpt4 book ai didi

python - 使用pyspark直接从网站读取json文件

转载 作者:行者123 更新时间:2023-11-28 21:50:06 27 4
gpt4 key购买 nike

是否可以使用 sqlContext 直接从网站读取 json 文件?例如我可以这样读取文件:

myRDD = sqlContext.read.json("sample.json")

但是当我尝试这样的事情时出现错误:

myRDD = sqlContext.read.json("http://192.168.0.13:9200/sample.json")

我正在使用 Spark 1.4.1提前致谢!

最佳答案

这是不可能的。您使用的路径应指向本地文件系统或 Hadoop 支持的其他文件系统。只要 sample.json 具有预期的格式(每行一个对象),您就可以尝试这样的操作:

import json
import requests

r = requests.get("http://192.168.0.13:9200/sample.json")
df = sqlContext.createDataFrame([json.loads(line) for line in r.iter_lines()])

关于python - 使用pyspark直接从网站读取json文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32418829/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com