python - 试图将邮政编码从一个数据帧拉到另一个地址数据帧-6ren

python - 试图将邮政编码从一个数据帧拉到另一个地址数据帧

转载作者：行者123 更新时间：2023-11-28 20:55:19

26

4

我有一个没有邮政编码的地址数据框:

df1 = pd.DataFrame({'address1':['1 o\'toole st','2 main st','3 high street','5 foo street','10 foo street'],
                   'address2':['town1',np.nan,np.nan,'Bartown',np.nan],
                   'address3':[np.nan,'village','city','county2','county3']})
df1['zipcode']=''
df1

        address1 address2 address3 zipcode
0   1 o'toole st    town1      NaN        
1      2 main st      NaN  village        
2  3 high street      NaN     city        
3   5 foo street  Bartown  county2        
4  10 foo street      NaN  county3

我还有第二个包含地址和邮政编码的数据框。请注意，这与 df1 的顺序相同，但在我处理的真实数据中不是这样的:

df2 = pd.DataFrame({'address1':['1 o\'toole st','2 main st','7 mill street','5 foo street','10 foo street'],
                   'address2':['town1','village','city','Bartown','county3'],
                   'address3':[np.nan,np.nan,np.nan,'county2','USA'],
                   'zipcode': ['er45','qw23','rt67','yu89','yu83']})
df2

        address1 address2 address3 zipcode
0   1 o'toole st    town1      NaN    er45
1      2 main st  village      NaN    qw23
2  7 mill street     city      NaN    rt67
3   5 foo street  Bartown  county2    yu89
4  10 foo street  county3      USA    yu83

我想检查 df1 中的地址是否在 df2 中，如果是，则将邮政编码拖到 df1 中。

这是我遇到了一些麻烦的地方，不确定这是否是处理它的最佳方法。

到目前为止，我所做的是为两个数据帧创建一个主键，使用地址的前两行:address 1 和 address 2，剥离所有空格和 nonalpha，转换为较低的:

df1['key'] = (df1['address1'] + df1['address2']).str.lower().str.replace(' ', '').str.replace('\W', '')


df2['key'] = (df2['address1'] + df2['address2']).str.lower().str.replace(' ', '').str.replace('\W', '')


print(df1)

        address1 address2 address3 zipcode                key
0   1 o'toole st    town1      NaN             1otoolesttown1
1      2 main st      NaN  village                        NaN
2  3 high street      NaN     city                        NaN
3   5 foo street  Bartown  county2          5foostreetbartown
4  10 foo street      NaN  county3                        NaN

print(df2)

        address1 address2 address3 zipcode                 key
0   1 o'toole st    town1      NaN    er45      1otoolesttown1
1      2 main st  village      NaN    qw23      2mainstvillage
2  7 mill street     city      NaN    rt67     7millstreetcity
3   5 foo street  Bartown  county2    yu89   5foostreetbartown
4  10 foo street  county3      USA    yu83  10foostreetcounty3

现在我要使用 np.where 将信息拖到 df1 中的空 zipcode 列，返回 no_match 如果找不到匹配的地址:

df1['zipcode'] = np.where(df1['key'].isin(df2['key']), df2['zipcode'], 'no_match')

print(df1)

        address1 address2 address3   zipcode                key
0   1 o'toole st    town1      NaN      er45     1otoolesttown1
1      2 main st      NaN  village  no_match                NaN
2  3 high street      NaN     city  no_match                NaN
3   5 foo street  Bartown  county2      yu89  5foostreetbartown
4  10 foo street      NaN  county3  no_match                NaN

我的问题是为 df1 创建的 key。如您所见，其中一些是 NaN。这是由于地址格式与 df2 不同。这就是我目前正在使用的数据集。

我试图通过跳过任何 NaN 并添加下一行来解决这个问题，但得到一个 ValueError:

# add address1 + address2 if it's not null, otherwise use address3

df1['key'] = (df1['address1'] + (df1['address2'] if pd.notnull(df1['address2']) else df1['address3']))

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

非常感谢任何有关如何解决此问题的反馈或建议。如果有更简单的方法来做到这一点，我很想知道。

最佳答案

使用Series.fillna用 df1['address3'] 替换缺失值:

df1['key'] = df1['address1'] + df1['address2'].fillna(df1['address3'])

改为:

df1['key'] = (df1['address1'] + (df1['address2'] if 
                                   pd.notnull(df1['address2']) else df1['address3']))

有关您的错误的更多信息在 using if truth statements with-pandas 中.

关于python - 试图将邮政编码从一个数据帧拉到另一个地址数据帧，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57072834/

26

4

0

文章推荐： ios - Xcode 测试导航器卡在使用 KIF 测试的微调器上

文章推荐： testing - CUnit 输出不符合 Jenkins Junit

文章推荐： android - 让 Mockito 与 RoboGuice 和 Robolectric 一起工作

文章推荐： Python如何获取变量名的值？

JQuery 拉
我试图让我的 jQuery 脚本从单击的链接中提取 url，然后将其插入到我的视频标签中。有什么建议吗？我试过拼接我从 .html() 中得到的内容，但引号总是搞砸了。

Docker 拉 “unexpected EOF”
我遇到了 docker 的问题。场景是这样的:我们使用Codebuild+Packer+docker创建AMI，用于deploy。在这一步中，我们从 Artifactory 中提取图像，并且除了提取
Javascript 拉/推单个/多个
我目前正在学习 RxJS。在文档中，我找到了这个数组。我尝试在谷歌上搜索“pull and push javascript”，但我什至不知道如何调用这些实体/概念。我不明白那是什么意思？我假设 S
html - 推/拉 - 基础
Title 在小屏幕上，我首先需要标题，然后是文本字段，但在中等以上的屏幕上，我需要相反的方式 - 我已经尝试过推和拉，但它们无法工作 - 有什么想法吗？最佳答案根据 Swa
c++ - ZeroMQ 推/拉
zmq 的某些部分未以可预测的方式运行。我正在使用 VS2013 和 zmq 3.2.4。为了不在我的 pubsub 框架中“丢失”消息 [旁白:我认为这是一个设计缺陷。我应该能够首先启动我的订阅者
html - Bootstrap 嵌套列利用推/拉
我正在编写一个使用嵌套 Bootstrap 列的页面。我正在使用推/拉让列在移动设备上切换位置，而且效果很好。但是，在桌面上我遇到了一些奇怪的间距问题。嵌套列偏移到父列的右侧。我设置了一个 fidd
docker 拉: operation not permitted
在拉取一些 docker 镜像(但不是全部)时出现此错误: failed to register layer: Error processing tar file(exit status 1): op
docker - 无法从本地 docker 注册表推/拉
我创建了一个 Kubernetes 集群，并为每个节点安装了 docker。当我尝试使用 docker push local_registry_addr:port/image_id 将图像拉取或推送
mercurial - 何时隐式推/拉 Mercurial 书签？
没有明确地推/拉单个书签，书签何时从 repo 复制/更新到 repo？在我对两个本地存储库的测试中，我无法推断出一致的行为。有时从 A 到 B 或 B 到 A 的推/拉会复制/更新书签，有时不会。
html - Bootstrap 列排序的实际用例(推、拉)
在 Bootstrap 3 文档中，他们给出了以下使用 push 和 pull 类更改列顺序 (http://getbootstrap.com/css/#grid-column-ordering) 的
css - 拉/推中的 Bootstrap 故障
从这个问题开始Three column Bootstrap layout with left sidebar at bottom我了解了 Bootstrap 列推拉。下面的代码片段几乎可以得到我想要
python - 如何将单个选项传递给 gitpython 的推/拉？
许多 Repo 函数的签名包括 **kwargs，其中文档说，您可以将参数传递给底层包装的 git 命令。但是，*args 没有位置。为了传递类似标志的参数，如 --all。我原以为它们会像 my_r
android - 带进度条的 adb 推/拉
如果您将大文件推送/拉到设备上，这真的很烦人，现在无法知道它有多远。是否可以运行 adb push 或 adb pull 并使用“bar”实用程序获取进度条？这里的主要问题是我认为 adb 需要两个
heroku - 如何使用 Gitkrakent 推/拉 Heroku？
当我尝试使用 Gitkrakent 向/从 Heroku 推/拉时，GitKraken 告诉我: "Please log in to continue" 请求的“用户/登录”是什么？ (我个人 Her
docker - 拉 github 项目时 Jenkins 出现无效凭证错误
我在 docker 容器中有一个 Jenkins 2.150.1。要安装这个 Jenkins，我只需使用 jenkinsci/blueocean:1.9.0图片。我创建了一个管道，然后尝试使用我的
jenkins - 用 Jenkins 做 docker 拉
我想使用 Jenkins 做下一步: 1- docker pull 2- docker run -i -t 我已经在jenkins上安装了docker插件，但是这可行吗？ docker plugi
eclipse - 如何在本地 Mercurial 存储库中保留未提交的更改，同时仍然推/拉？
如果我正在处理一些我不想提交的文件，我只需保存它们。然后我有其他文件想要推送到服务器，但是如果其他人对存储库进行了更改，并且我将它们拉下来，它会要求我 merge 或 rebase ..但是这些选项中
拉 og :image 时 Facebook 错误
无论出于何种原因，我在 FB 上共享链接时尝试使用的图像都无法加载。给出的确切错误是: 提供了og:image，无法下载。发生这种情况的原因有多种，例如您的服务器使用不受支持的内容编码。爬虫接受 de
Android 4.3 ADB 推/拉
今天我买了三星 Galaxy Note 3，它配备了 Android 4.3。由于它太新了，我找不到根植我设备的方法，所以我尝试使用 adb 连接……我失败了。所以，我用了这个 D:\android
testing - Airflow 测试模式 xcom 拉/推不工作
我尝试通过 airflow cli test 命令测试 2 个任务` 第一个任务运行，自动将最后一个控制台推送到 xcom，我按预期在 Airflow GUI 中看到了值 some value 当我通

首页

博学

6Ren·AI

商城

python - 试图将邮政编码从一个数据帧拉到另一个地址数据帧