- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试将一堆历史定价数据连接到一个数据框中,但我似乎随机删除了部分数据。
这是我正在尝试做的事情:
“v”代表值,浮点类型
系列 1:
Ticker1
Date1 v1
Date2 v2
Date3 v3
Date4 v4
.
.
.
.
Date100 v5
系列 2:
Ticker2
Date101 v6
Date102 v7
Date103 v8
Date104 v9
.
.
.
.
Date200 v10
最终期望的 df
Ticker1 Ticker2
Date1 v1 np.nan
Date2 v2 np.nan
Date3 v3 np.nan
Date4 v4
.
.
Date100 v5
Date101 np.nan v6
Date102 np.nan v7
Date103 np.nan v8
Date104 np.nan v9
.
.
.
.
Date200 np.nan v10
这是我的做法:
data_dict = {}
for ticker in tickers:
try:
data_dict[ticker] = data.DataReader(ticker,'iex',start_date, end_date)
data_dict[ticker] = data_dict[ticker].reset_index()
data_dict[ticker]['date'] = pd.to_datetime(data_dict[ticker]['date'], format="%Y-%m-%d")
data_dict[ticker]['date'] = data_dict[ticker]['date'].dt.date
data_dict[ticker].index = data_dict[ticker]['date']
data_dict[ticker] = data_dict[ticker].drop('date', axis=1)
except:
pass
pricing_df = pd.DataFrame()
volume_df = pd.DataFrame()
for ticker in data_dict.keys():
temp_series = pd.Series(data = data_dict[ticker]['close'].values,
index = data_dict[ticker].index,
name = ticker
)
pricing_df[ticker] = temp_series
temp_series = pd.Series(data = data_dict[ticker]['volume'].values,
index = data_dict[ticker].index,
name = ticker
)
volume_df[ticker] = temp_series
我得到的返回本质上是我想要的,但在数据集的开头截断了任意数量的日期。具体来说,我有一系列日期可以追溯到 2014 年,但是当我进入最终数据集时,但 df 从 2015 年中期开始......
预先感谢您的所有帮助!
最佳答案
在您的情况下,我会使用 join
,这很容易允许给定日期在 Ticker1
和 Ticker2
中都有值,不过您仍然必须首先将它们转换为数据帧(如 @dportman 的答案):
pd.DataFrame(series1).join(pd.DataFrame(series2), how='outer')
Ticker1 Ticker2
Date1 v1 NaN
Date100 v5 NaN
Date101 NaN v6
Date102 NaN v7
Date103 NaN v8
Date104 NaN v9
Date2 v2 NaN
Date200 NaN v10
Date3 v3 NaN
Date4 v4 NaN
注意:您可以对 merge
执行相同的操作,但需要添加 left_index=True, right_index=True
参数:
pd.DataFrame(series1).merge(pd.DataFrame(series2),
left_index=True, right_index=True, how='outer')
您还可以在 2 系列上使用 pd.concat
来获得相同的结果:
pd.concat([series1, series2], axis=1)
Ticker1 Ticker2
Date1 v1 NaN
Date100 v5 NaN
Date101 NaN v6
Date102 NaN v7
Date103 NaN v8
Date104 NaN v9
Date2 v2 NaN
Date200 NaN v10
Date3 v3 NaN
Date4 v4 NaN
假设您的日期是实际日期,或者至少是日期字符串,那么您可以按索引排序。例如,如果它看起来像这样:
>>> df
Ticker1 Ticker2
2018-06-25 v1 NaN
2018-06-28 v5 NaN
2018-06-26 NaN v6
2018-07-01 NaN v7
2018-06-24 NaN v8
2018-06-23 NaN v9
2018-06-29 v2 NaN
2018-06-30 NaN v10
2018-06-22 v3 NaN
2018-06-27 v4 NaN
使用df.sort_index()
:
Ticker1 Ticker2
2018-06-22 v3 NaN
2018-06-23 NaN v9
2018-06-24 NaN v8
2018-06-25 v1 NaN
2018-06-26 NaN v6
2018-06-27 v4 NaN
2018-06-28 v5 NaN
2018-06-29 v2 NaN
2018-06-30 NaN v10
2018-07-01 NaN v7
关于python - 如何根据日期索引连接一系列数据以形成 df 而不会丢失数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50992034/
我的数据库中有两张表,一张用于 field ,另一张用于预订。我需要的是一个查询来选择所有未预订的 field 。见下文: 餐 table 预订具有以下字段: bk_id venue_id 作为(预订
嗨,我是编码新手,我有一些培训项目,其中包括从 HTML 表单输入 MySQL 数据库。它就像你玩过的游戏的日志。第一个日期输入是您开始游戏的时间,第二个日期输入是您完成游戏的时间。但我需要检查器或类
我是这个 sql 编码的新手,我正在尝试学习新的东西。因此,我创建了一个交货表,其中包含一些属性,如商品代码、交货日期、交货数量。所以如何从同一张表中获取第一个交货日期(最小日期)和交货数量以及最晚交
我从支付网关返回了这个日期 2014-05-15T08:40:52+01:00 我得到 2014-05-15T08:40:52 但我无法识别时区 +01:00 的含义 我的位置时区是 UTC−06:0
我快要疯了,请帮忙。 我有一列包含日期时间值。 我需要找到每天的最小值和最大值。 数据看起来像这样 2012-11-23 05:49:26.000 2012-11-23 07:55:43.000
我从 json 数据中获取日期为 2015 年 4 月 15 日晚上 10:15我只想在 html 页面中显示 json 响应数据的时间,例如 10:15 PM这里我放了我的js函数和html代码 J
是否有 javascript 库或其他机制允许我将 .NET 日期/时间格式字符串(即 yyyy-MM-dd HH:mm:ss)传递给 javascript函数并让它相应地解析提供的日期时间值?我一直
我正在使用以下代码以正确的格式获取当前的 UTC 时间,但客户返回并要求时间戳现在使用 EST 而不是 UTC。我搜索了 Google 和 stackoverflow,但找不到适用于我现有代码的答案。
我有以下日期的平均温度数据。我想找到连续至少 5 天低于或高于 0 摄氏度的开始日期。 date_short mean.temp 1 2018-05-18 17.54 2 2018-05-19
它可以在其他网络浏览器中使用,但 IE11 返回无效日期。 为了调试我使用了下面的代码。 console.log('before - ' + date.value); date.value = new
我在 Excel 中有一个数据的 Web 提取,其中日期列带有/Date(1388624400000)/。我需要在 Excel 中将其转换为日期。 最佳答案 能够从 here 中推断出它. 假设字符串
嗨,我的 Schmema 有一个带有 ISO 日期的字段: ISODate("2015-04-30T14:47:46.501Z") Paypal 在成功付款后以该形式返回日期对象: Time/Date
我的 table : CREATE TABLE `tbdata` ( `ID` INT(10) NOT NULL AUTO_INCREMENT, `PatientID` INT(10) NOT
我正在 Ubuntu 服务器 12.04 中编写一个 shell 脚本,它应该比较日志文件中的一些数据。在日志文件中,日期以以下格式给出: [Mon Apr 08 15:02:54 2013] 如您所
我想使用 GROUP BY WITH ROLLUP 创建一个表并获取总行数而不是 null。 $sql ="SELECT IF(YEAR(transaktioner.datum
我正在创建博客文章,在成功迁移我的博客文件后,当我转到我网站的博客页面时返回一个错误(无法解析其余部分:':“Ymd”'来自'post.date|date: "Ymd"') 我似乎无法确定这是语法错误
我正在尝试获取要插入到 CAML 查询中的月份范围,即:2010-09-01 和 2010-09-30。 我使用以下代码生成这两个值: var month = "10/2010"; var month
如何将代码document.write("直到指定日期")更改为writeMessage(date)中的日期?此外,writeMessage(date) 中的日期未正确显示(仅显示年份)。感谢您帮助解
我在 Windows (XP) 和 Linux 上都尝试过 utime()。在 Windows 上我得到一个 EACCES 错误,在 Linux 上我没有得到任何错误(但时间没有改变)。我的 utim
我正在尝试计算发生在同一日期的值的总和(在 XYZmin 中)。 我的数据看起来像这样, bar <- structure(list(date = structure(c(15622, 15622,
我是一名优秀的程序员,十分优秀!