- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我在包含数据库设置的 Pandas DataFrame 中有一个字符串列,我想将键/值对转换为 DataFrame 中的新列,用 True
填充任何缺失值.
这是其中一个字符串的样子:
Status=ONLINE, Updateability=READ_WRITE, UserAccess=MULTI_USER, Recovery=SIMPLE, Version=706, Collation=SQL_Latin1_General_CP1_CI_AS, SQLSortOrder=52, IsAutoCreateStatistics, IsAutoUpdateStatistics, IsFullTextEnabled
我希望输出看起来像这样:
| Status | Updateability | UserAccess | Recovery | Version | Collation | SQLSortOrder | IsAutoCreateStatistics | IsAutoUpdateStatistics | IsFullTextEnabled |
| ONLINE | READ_WRITE | MULTI_USER | SIMPLE | 706 | SQL_Latin1_General_CP1_CI_AS | 52 | True | True | True |
我尝试遍历行,用 re.sub
解析字符串和 split()
,这让我进入了 key=value
之后的设置的键/值对格式。我对已知的 bool 键进行了硬编码(如下面的代码所示),但我希望对未知的 bool 值进行这项工作。
我现在遇到的问题是将特定键/值对的结果回滚到它应该进入的正确列/行。
import re
_status = ['Status=ONLINE, Updateability=READ_WRITE, UserAccess=MULTI_USER, Recovery=SIMPLE, Version=706, Collation=SQL_Latin1_General_CP1_CI_AS, SQLSortOrder=52, IsAutoCreateStatistics, IsAutoUpdateStatistics, IsFullTextEnabled', 'Status=OFFLINE, Updateability=READ, UserAccess=SINGLE_USER, Recovery=SIMPLE, Version=706, Collation=SQL_Latin1_General_CP1_CI_AS, SQLSortOrder=53, IsAutoCreateStatistics, IsAutoUpdateStatistics, IsTornPageDetectionEnabled']
_status = [re.sub('IsAutoCreateStatistics', 'IsAutoCreateStatistics=True', _s) for _s in _status]
_status = [re.sub('IsAutoUpdateStatistics', 'IsAutoUpdateStatistics=True', _s) for _s in _status]
_status = [re.sub('IsFullTextEnabled', 'IsFullTextEnabled=True', _s) for _s in _status]
_status = [re.sub('IsTornPageDetectionEnabled', 'IsTornPageDetectionEnabled=True', _s) for _s in _status]
_rows = []
for _row in _status:
_kvs = []
for _kv in _row.split(','):
_key, _val = _kv.split('=')
_d = {_key.strip(): _val.strip()}
_kvs.append(_d)
_rows.append(_kvs)
_rows
让我兴奋的是:
[[{'Status': 'ONLINE'},
{'Updateability': 'READ_WRITE'},
{'UserAccess': 'MULTI_USER'},
{'Recovery': 'SIMPLE'},
{'Version': '706'},
{'Collation': 'SQL_Latin1_General_CP1_CI_AS'},
{'SQLSortOrder': '52'},
{'IsAutoCreateStatistics': 'True'},
{'IsAutoUpdateStatistics': 'True'},
{'IsFullTextEnabled': 'True'}],
[{'Status': 'OFFLINE'},
{'Updateability': 'READ'},
{'UserAccess': 'SINGLE_USER'},
{'Recovery': 'SIMPLE'},
{'Version': '706'},
{'Collation': 'SQL_Latin1_General_CP1_CI_AS'},
{'SQLSortOrder': '53'},
{'IsAutoCreateStatistics': 'True'},
{'IsAutoUpdateStatistics': 'True'},
{'IsTornPageDetectionEnabled': 'True'}]]
这是迄今为止我想出的最好的办法,看起来我已经很接近了,但我确信还有更多的 Pythonic 方法可以做到这一点。
最佳答案
您可以使用 str.partition 进行简化,不需要任何正则表达式,只需拆分字符串即可:
s = "Status=ONLINE, Updateability=READ_WRITE, UserAccess=MULTI_USER, Recovery=SIMPLE, Version=706, Collation=SQL_Latin1_General_CP1_CI_AS, SQLSortOrder=52, IsAutoCreateStatistics, IsAutoUpdateStatistics, IsFullTextEnabled"
def repl(s):
for sub in s.split(", "):
k, _, v = sub.partition("=")
yield (k, v) if v else (k, "True")
在 =
上分割后的任何子字符串对于 v 有一个空字符串意味着我们没有配对,所以我们不需要也不关心任何先验知识潜在 key :
In [9]: s = "Status=ONLINE, Updateability=READ_WRITE, UserAccess=MULTI_USER, Recovery=SIMPLE, Version=706, Collation=SQL_Latin1_General_CP1_CI_AS, SQLSortOrder=52, IsAutoCreateStatistics, IsAutoUpdateStatistics, IsFullTextEnabled"
In [10]: dict(repl(s))
Out[10]:
{'Collation': 'SQL_Latin1_General_CP1_CI_AS',
'IsAutoCreateStatistics': 'True',
'IsAutoUpdateStatistics': 'True',
'IsFullTextEnabled': 'True',
'Recovery': 'SIMPLE',
'SQLSortOrder': '52',
'Status': 'ONLINE',
'Updateability': 'READ_WRITE',
'UserAccess': 'MULTI_USER',
'Version': '706'}
此外,如果空格可能不存在,您可以在 ","
上拆分并去除空格或使用 csv lib settin skipinitialspace=True
将处理 "foo, bar"
和 "foo,bar"
:
from csv import reader
from itertools import chain
def repl(s):
for sub in chain(*reader([s], skipinitialspace=True)):
k, _, v = sub.partition("=")
yield (k, v) if v else (k, "True")
print(dict(repl(s)))
如果你只是想创建一个新的 df 并且所有的键都相同:
from csv import reader
from itertools import chain
import pandas as pd
def repl(s):
d = {}
for sub in chain(*reader([s], skipinitialspace=True)):
k, _, v = sub.partition("=")
d[k] = v if v else "True"
return d
df = pd.DataFrame.from_records(map(repl ,status))
print(df)
但是根据讨论,如果您稍后看到一个您在第一个字典中没有看到的键,您将得到 nan 因为行值不是 True
关于python - 如何从具有默认值的字符串列表中解析(可能未知的)键/值对?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38214322/
我有一个交叉表函数,我过去曾多次成功使用它,但现在它在最后转储所有数据,而不是将其旋转到输出表中。它似乎无法找到交叉表。我通过以下方式对其进行了研究; 如果 tablefunc 不存在则创建扩展; -
表1(客户表) Id, CustomerId, IsKnownCustomer,phonemacaddress 1, 空 0 00:9a:34:cf:a4 2, 004024 1 00:6f:64:c
知道为什么我总是收到这个烦人且无用的错误代码/描述吗? Failed to pull image myapidemodocker.azurecr.io/apidemo:v4.0: rpc error:
我正在进行 PHP 登录,并且之前可以正常工作,但我尝试使用户名功能不区分大小写,但此后代码一直无法正常工作。我删除了我添加的所有内容,以尝试使其不区分大小写,即 strtolower()。页面上显示
有人会帮助我提供有关此错误的任何可能信息吗?原因?登录?在哪里寻找/开始? Cannot use output buffering in output buffering display handl
我已经添加了这样的脚本 我在我的 test.js 中做了这个 var app = angular.module('MyApp', ['ngRoute']).config
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
我有这个sql语句: selectAllUsersByCriteria = 连接.prepareStatement( “从用户那里选择*?=?” ); 下面的方法运行该语句: public Array
我有一个白色的 EditText,在 Android 3.1 及更高版本中,光标不显示(因为它也是白色的)。有关信息,我使用 android:background="@android:drawable
我正在尝试使用 Keras 实现深度学习模型。但是我有一个未知形状实现的问题。我一直在寻找类似的错误,但没有找到。 这是我的代码。 Xhome = dataset[:,32:62] Xaway = d
关注此introduction可以通过导入命名空间 System.Xml 来使用 XMLReader 类。在我的 Visual Studio 项目中,我使用 .NET 4.0,但 System.Xml
我有一个动态链接库的程序。该程序将函数指针传递给该库以执行。 但是 ubsan(Undefined Behavior Sanitizer)指定指针位于错误的函数类型上。那只会发生 如果回调函数有一个类
我正在尝试在我的 Swift SpriteKit 应用程序中使用 AVAudioSession。我遇到了奇怪的“未声明类型”问题。例如…… import AVFoundation var audioS
如果在编译期间(在实际编译和运行程序之前)其参数之一的值已知/未知,如何专门化模板函数? 我还不知道怎么做。 想法 1: #include #include int main(void){
我看到一些人的代码是这样的: while (!(baseType == typeof(Object))) { .... baseType = baseType.BaseType;
我正在尝试使用 GoColly 框架获取所有 HREF 链接,但是只允许任何域的 url 为根 URL 或子域(否路径)。我已经注释掉了我的 REGEXP。文件扩展名没有事情。我只是在“/”之后不想要
我有一个包含多个实体的数据库,特别是 Book 和 User。它们之间存在这样的 ManyToMany 关系: 书: @Entity @Table(name = "Books") public cla
如果我将范围的初始部分设置为 Range("A:A"),如何确保将整行传递给排序? 数据 id、fname、mname、lname、后缀、状态、位置、时区 通过在 id 中搜索起点和终点来选择范围。
我对kubernetes很陌生,而对于docker来说就不那么多了。 我一直在研究示例,但是我对自动缩放器(似乎无法缩放)感到困惑。 我在这里通过示例https://kubernetes.io/doc
我在 ChildWindow 中使用 SL Toolkit 5 中的 BusyIndicator 控件。 在某些解决方案中,它可以工作,但在其他解决方案中,使用完全相同的代码(至少看起来),我在运
我是一名优秀的程序员,十分优秀!