- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个返回纬度和经度信息的函数。我想在数据框中为这 4 个变量创建列。
这是我的代码:
import geocoder
import pandas as pd
import geolib
from geolib import geohash
df = pd.read_csv('New_DP2.csv')
key = [redacted]
fields = ['NWLat', 'NWLong', 'SELat', 'SELong']
def getData(address, key):
g = geocoder.mapquest(address, key=key)
lat = g.lat
lng = g.lng
h = geolib.geohash.encode(lat, lng, 7)
hashes = geolib.geohash.neighbours(h)
NW = geohash.decode(hashes.nw)
SE = geohash.decode(hashes.ne)
nwlat = NW.lat
nwlon = NW.lon
selat = SE.lat
selon = SE.lon
我想在数据框中创建四列,这些列将为“nwlat”、“nwlon”、“selat”、“selon”创建列。
通常我会简单地返回 nwlat 然后创建一个 lambda
df['NWLong'] = df.apply(lambda row: getData(row['a'], key), axis = 1)
然后我会为我想要返回的其他 3 个变量的每个案例执行此操作。但是后来我总共运行了 4 次而不是一次。
最佳答案
你们很接近。您需要做的就是弄清楚如何适本地返回结果。您的函数需要如下所示:
def getData(address, key):
...
NW = geohash.decode(hashes.nw)
SE = geohash.decode(hashes.ne)
return pd.Series(dict(zip(fields, [NW.lat, NW.lon, SE.lat, SE.lon])))
然后您可以使用 Series.apply
:
df = pd.DataFrame({'address': ['Los Angeles, CA']}) # for example
df['address'].apply(getData, key=key)
NWLat NWLong SELat SELong
0 34.0541839599609375 -118.2451629638671875 34.0541839599609375 -118.2424163818359375
这通过让 getData
返回一个 Series 对象(以 fields
作为索引)来实现。 apply
会自动构造一个 DataFrame 并返回结果。
旁注:要将这些列连接到现有的 df
,请调用 pd.concat
:
res = pd.concat([df, df['address'].apply(getData, key=key)], axis=1)
如果您的 DataFrame 中没有 NaN,另一种选择是使用列表理解。这是性能(和内存)微优化。
def getData2(address, key):
...
NW = geohash.decode(hashes.nw)
SE = geohash.decode(hashes.ne)
return [NW.lat, NW.lon, SE.lat, SE.lon]
pd.DataFrame([getData2(a, key) for a in df['address']], columns=fields)
NWLat NWLong SELat SELong
0 34.0541839599609375 -118.2451629638671875 34.0541839599609375 -118.2424163818359375
有关列表推导及其优势的更多信息已在我的帖子中进行了详细说明:For loops with pandas - When should I care?
关于python - 从 pandas apply 构造一个 DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54916019/
谁能解释一下原因: (define a (lambda() (cons a #f))) (car (a)) ==> procedure ((car (a))) ==> (procedure . #f)
这是 PyBrain 网站的摘录。我了解大部分正在发生的事情,但是一行让我完全难住了。我以前从未在 python 代码中看到过这样的东西。这是整个循环,对于上下文: for c in [0,
我是gradle / groovy的新手。我想创建将做一些事情的自定义任务。我的第一个问题是任务完成时该如何做?我可以覆盖doFirst / doLast闭包吗?也许我可以重写某些在开始和结束时都会执
我刚刚开始评估 MS 企业库。他们使用以下指令来获取实例: var customerDb = EnterpriseLibraryContainer.Current.GetInstance("C
这是我的 if else Ansible 逻辑.. - name: Check certs exist stat: path=/etc/letsencrypt/live/{{ rootDomain
我正在使用construct 2.8 对一些失传已久的 Pascal 程序创建的一些文件的 header 进行逆向工程。 header 由许多不同的记录组成,其中一些是可选的,我不确定顺序是否固定。
我在将 getchar() 的输入放入 char *arr[] 数组时遇到问题。我这样做的原因是因为输入数据(将是一个带有命令行参数的文件)将存储在一个 char 指针数组中以传递给 execvp 函
通常我们不能约束类型参数 T派生自密封类型(例如 struct 类型)。这将毫无意义,因为只有一种类型适合,因此不需要泛型。所以约束如下: where T : string 或: where T :
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
#include using namespace std; class A { private: int m_i; friend int main(int argc, char cons
这个问题在这里已经有了答案: Are there legitimate uses for JavaScript's "with" statement? (33 个答案) 关闭 9 年前。 我有这个代
在this answer我看到了下一个 Bash 结构。 yes "$(< file.txt)" 什么意思 "$(< file.txt)" ? 我明白了 命令替换 - $(command)用命令的结
if (a == 1) //do something else if (a == 2) //do something else if (a == 3) //do somethi
关于构造的快速简单的问题。 我有以下用于将项目添加到 ListView 的代码。 ListViewItem item = new ListViewItem(); item.Text = file; i
我想使用 std::vector 来控制给定的内存。首先,我很确定这不是好的做法,但好奇心占了上风,无论如何我都想知道如何做到这一点。 我遇到的问题是这样的方法: vector getRow(unsi
下面显示了一段简单的javascript: var mystring = ("random","ignored","text","h") + ("ello world") 这个字符串会生成 hello
在 Java 中,创建对象的标准方法是使用 MyClass name = new MyClass(); 我也经常看到构造 new MyClass() { /*stuff goes in here*/
我正在编写 C++ ndarray 类。我需要动态大小和编译时大小已知的数组(分别分配自由存储和分配堆栈)。我想支持从嵌套的 std::initializer_list 进行初始化。 动态大小的没问题
我正在将一个项目从 Visual Studio 2005 转换为 Visual Studio 2008,并提出了上述结构。 using Castle.Core.Resource; using Cast
我想知道我在这里的想法是否正确,我主要针对接口(interface)进行编程,所以我想知道下面的类是否应该通过 DI 注入(inject),或者我应该自己实例化一个类... 注意:这些服务保存在我的核
我是一名优秀的程序员,十分优秀!