gpt4 book ai didi

artificial-intelligence - 历史库存数据来源

转载 作者:行者123 更新时间:2023-12-03 04:07:02 26 4
gpt4 key购买 nike

我正在尝试制作一个股票市场模拟器(也许最终会成长为一个预测人工智能),但我很难找到可以使用的数据。我正在寻找历史股票市场数据的(希望是免费的)来源。

理想情况下,这将是一个非常细粒度(秒或分钟间隔)的数据集,其中包含纳斯达克和纽约证券交易所(如果我敢于冒险的话,也许还有其他交易品种)的每个交易品种的价格和交易量。有谁知道此类信息的来源吗?

我找到了this question这表明雅虎提供了 CSV 格式的历史数据,但我无法通过粗略检查链接的网站来找到如何获取它。

我也不喜欢在 CSV 文件中零碎下载数据的想法......我想雅虎会在最初的几千个请求后感到不安并关闭我。

我还发现了another question这让我觉得我中了大奖,但不幸的是 OpenTick 网站似乎已经关门了……太糟糕了,因为我认为它们正是我想要的。

我还可以使用每天每个品种的开盘/收盘价和交易量的数据,但如果我能得到的话,我更喜欢所有数据。还有其他建议吗?

最佳答案

让我加上我的 2 美分,我的工作是为对冲基金获取良好且干净的数据,我见过很多数据源和历史数据提供商。这主要是关于美股数据。

首先,如果您有钱,不必费心从雅虎下载数据,请直接从 CSI data 获取日终数据。 ,这也是雅虎获取 EOD 数据的地方。他们有一个 API,您可以将数据提取为您想要的任何格式。我认为每年的数据订阅费用是几百美元。

从免费服务下载数据的主要问题是您只能获得仍然存在的股票,这称为 Survivorship Bias如果您查看许多股票,可能会给出错误的结果,因为您只会包括迄今为止成功的股票,而不包括已退市的股票。

为了处理一些日内数据,我会研究 IQFeed ,它们提供了几个 API 来提取历史数据,尽管它们主要是用于实时提要的装备。但这里有很多选择,一些经纪商甚至通过他们的 API 提供历史数据下载,所以只要选择你的毒药即可。

但通常所有这些数据都不是很干净,一旦你真正开始回溯测试,你会发现某些股票丢失或显示为两个不同的符号,或者股票分割没有得到正确的解释,等等。然后你意识到历史股息数据也是需要的,因此您开始兜圈子,将来自 100 个不同数据源的数据拼凑在一起,等等。因此,从“折扣”数据源开始就可以了,但是一旦您运行更全面的回测,您可能会遇到问题,具体取决于您所做的事情。如果你只看标准普尔 500 指数股票,这不会是一个太大的问题,“便宜”的日内提要就可以了。

您找不到的是免费的日内数据。我的意思是你可能会找到一些例子,我确信某个地方有 5 年的 MSFT 报价数据,但这不会让你走得太远。

然后,如果您需要真实的东西(二级订单簿,所有交易所中发生的所有价格变动),一个“负担得起”但绝佳的选择是Nanex 。他们实际上会给您提供一个包含 TB 数据的驱动器。如果我没记错的话,每年的数据量约为 3000-4000 美元。但请相信我,一旦您了解获得良好的日内数据有多么困难,您就不会认为这根本不是多少钱。

并不是让您灰心丧气,而是获得良好的数据非常困难,事实上,许多对冲基金和银行每月花费数十万美元来获得他们可以信任的数据。同样,您可以从某个地方开始,然后从那里开始,但最好在上下文中看到它。

<小时/>

编辑:以上答案来 self 自己的经验。 This write-up from Caltech关于可用数据源将提供更多见解,特别推荐 QuantQuote

关于artificial-intelligence - 历史库存数据来源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/754593/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com