- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我原来的 data.table
由三列组成。site
、observation_number
和 id
。
例如以下是 id = z 的所有观察结果
|site|observation_number|id
|a | 1| z
|b | 2| z
|c | 3| z
这意味着 ID z
已经从 a
移动到 b
再到 c
。
每个 id 没有固定数量的网站。
我希望将数据转换为这样的边列表
|from |to||id|
|a | b| z |
|b | c| z |
sox <- data.table(site = c('a','b','c','a','c','c','a','d','e'),
obsnum =c(1,2,3,1,2,1,2,3,4),
id =c('z','z','z','y','y','k','k','k','k'))
我目前这样做的方式感觉很复杂而且非常慢(sox 有 1.5 mio 行,dt_out 有大约 7.5 mio.rows)。我基本上在 observation_number
上使用 for 循环将数据分成 block ,其中每个 ID 只出现一次(即 - 只有一次旅程,到 - 从)。然后我转换数据,并将所有 block 剥离到一个新的 data.table。
dt_out <- data.table()
maksimum = sox[,max(observation_number)]
for (i in 1:maksimum-1) {
i=1
mini = i
maxi = i+1
sox_t <- sox[observation_number ==maxi | observation_number ==mini, ]
temp_dt <- dcast(sox_t[id %in% sox_t[, .N, by = id][N>=2]$id,
.SD[, list(site, observation_number, a=rep(c('from', 'to')))] ,by=id],
id='id', value.var='site', formula=id~a)
dt_out <- rbind(dt_out, temp_dt)
i=max
}
我希望有人能帮我优化这个,最好创建一个函数,我可以在其中输入 data.table、站点 ID、observationnumber id 和 id。出于某种原因,我无法创建函数,不管它是否有效。
使用系统时间(并多次运行系统时间):
User - System - Elapsed
make_edgelist (data.table): 5.38 0.00 5.38
Data.table. with shift: 13.96 0.06 14.08
dplyr, with arrange: 6.06 0.36 6.44
附注make_edgelist 已更新以订购 data.table
make_edgelist <- function(DT, site_var = "site", id_var = "id", obsnum_var = "rn1") {
DT[order(get(obsnum_var)),
list(from = get(site_var)[-.N], to = get(site_var)[-1]), by = id_var]
}
令我惊讶的是,dplyr(使用 lead
)几乎和 make_edgelist 一样快,并且比使用 shift
的 data.table 快得多。我想这意味着 dplyr 实际上会更快,更复杂的领先/滞后/转变。
我也觉得这很令人费解 - 但不知道它是否有任何意义,dplyr 使用的“系统”时间比两个 data.table 解决方案中的任何一个都多。
输入数据:150 万行。结果:60 万行。
最佳答案
使用dplyr
,你可以尝试:
sox %>%
group_by(id) %>%
transmute(from = site,
to = lead(from)) %>%
na.omit()
id from to
<chr> <chr> <chr>
1 z a b
2 z b c
3 y a c
4 k c a
5 k a d
6 k d e
正如@Sotos 指出的那样,首先排列数据可能会很有用:
sox %>%
arrange(id, obsnum) %>%
group_by(id) %>%
transmute(from = site,
to = lead(from)) %>%
na.omit()
关于r - 如何从访问过的地方列表(有效地)构建边缘列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58372627/
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
操作无法完成。 Places API 库中发生内部错误。如果您认为此错误代表错误,请使用我们社区和支持页面 (https://developers.google.com/places/support)
我正在尝试在我的项目中使用 google places,我将其设置在 fragment 中而不是 Activity 中,我的自动完成 fragment 在 fragment 中。但是,当我尝试搜索它时
我的目的是使用R来查询google api。 我有一个地址和名称列表(属于商店、餐馆等),我需要为每个地址和名称存储: “纬度”、“经度”、“业务类型” 我的想法是使用 google place ap
我正在寻找设置一个自动完成的谷歌地方小部件。 我有一个带有“searchFieldText”id 的输入类型文本。 这是我的 JS 代码: var inputsec = document.getEle
是否可以使用图形 API(或地址/ zip )按纬度/经度和半径获取地点?我在文档中的任何地方都看不到它 最佳答案 搜索 URL 的以下格式将返回某个位置附近的地点列表: https://graph.
我正在探索 Google API,主要是 Places API。由于对 Google Places API 的请求数限制为 100,000,因此我正在寻找方法来最大限度地减少发送到 API 的请求数。
伙计们,我在我的应用程序中有一个功能,可以使用 GetFiles 在特定目录中搜索特定文件。方法 System.IO.Directory.GetFiles(string path, string
我已经在 Laravel 5.3 上使用 where 查询成功创建了许多函数,但是这次发生了一些奇怪的事情。 public function show($id){ $artikel = Art
我正在为我的 iPhone 应用程序使用 Facebook 图形 API 来获取附近地点的列表,我使用带有一些参数的“搜索”请求。我得到的响应是一个包含以下信息的地点列表:“纬度”、“经度”、“名称”
我有一个 Android 应用程序,我在其中使用 Google map 显示附近的地方,如加油站、药店等。我正在使用 map 和地点 API。 https://maps.googleapis.com/
我是一名优秀的程序员,十分优秀!