- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
在过去的 2 或 3 个月里,我一直让这个脚本运行得很好,然后出于我不知道的原因,它决定它会破坏我。我没有更新 Python 或我在此脚本中使用的任何库,但无论如何,现在我需要帮助修复它。
启动dataframe如下
Company, Registered date, Contact name, Contact email, Contact phone
我通过将所有列转换为小写并将空格替换为“_”来清理这些列
下一步是拆分以“(first)(last)”开头的“contact_name”列,即“John Doe”,我想为第一个和最后一个添加 2 列。新DF如下,
company, registered_date, contact_name, first_name, last_name, contact_email, contact_phone
程序中断了联系人姓名的拆分和/或新列的创建。我一直用来执行此操作的代码行是:
df1['first_name'], df1['last_name'] = zip(*df1['registrant_name'].apply(lambda x: x.split(' ', 1)))
回溯说:
File "(name).py", line 123
df1['first_name'], df1['last_name'] = zip(*df1['registrant_name'].apply(lambda x: x.split(' ', 1)))
ValueError: need more than 1 value to unpack
当我浏览一些东西时,我发现有人在使用 line.split 时遇到同样的问题(不是在 Pandas 内部,一般来说只是 python),有人说这可能是因为两个值都不存在。果然,这似乎是 3 个月来我第一次以某种方式在“contact_name”列中得到一个值,而不是“John Doe”,它只是“John”(幸运的是,这实际上是第一个条目在这个 CSV 中,否则我会被难住一段时间试图浏览每一行)。
所以我的问题是,如何使我的代码更健壮,以便在再次出现此问题时我们可以解决它。我在想我想做的是,如果没有空格,它只会将当前值作为“first_name”,然后添加“NaN”作为姓氏。我只是不知道如何在 DF 中执行此操作,因为循环并不理想。
感谢您的帮助!
最佳答案
也许将 itemgetter 与 str.partition 一起使用:
import pandas as pd
df = pd.DataFrame(["foo bar" , "foo", "bar barf"],columns=["name"])
from operator import itemgetter
df['first_name'], df['last_name'] = zip(*df['name'].apply(lambda x: itemgetter(0,2)(x.partition(' '))))
这会给你一个空字符串来表示缺少姓氏,所以我不确定这是否可取。
name first_name last_name
0 foo bar foo bar
1 foo foo
2 bar barf bar barf
不确定这是否会更快但它避免了 lambda:
import pandas as pd
df = pd.DataFrame(["foo bar" , "foo", "bar barf"],columns=["name"])
from operator import itemgetter
df['first_name'], df['last_name'] = zip(*map(itemgetter(0, 2), df['name'].str.partition(" ").values))
print(df)
关于python - ValueError : need more than 1 value to unpack, 如何让我的代码更健壮?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36188208/
我正在寻找一种解决方案来透明地保留 Perl 数据结构(甚至不是对象,但对象支持将是一个加号)而无需循环引用。我不太关心后端,但我更喜欢 JSON。对象的数量会相对较少(几千个 hashref,每个都
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
在我的办公室,我们正在使用 (https://docs.microsoft.com/en-us/dotnet/api/system.io.filesystemwatcher?view=netframe
我是一名优秀的程序员,十分优秀!