- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试遍历数据列表以清理它。
这是列表的一小部分:
lines =['Wirkstoffliste 1 – ','',' ', 'Gaschromatographie (GC) ', 'LOQ ', '[mg/kg] ', 'Acibenzolar-S-methyl', 'Aclonifen', 'Acrinathrin', 'Alachlor', 'Aldrin', 'Allethrin', 'Ametryn', 'Antrachinon', 'Atrazin', 'Atrazin-desethyl', 'Atrazin-desisopropyl', 'Azinphos (-ethyl)', 'Azinphos-methyl', 'Benalaxyl', 'Benfluralin', 'Benzoylprop-ethyl',' Seite 13 von 14 ', ' ', ' ', ' ', 'Wirkstoffliste 4 - ','Version 7.2 ']
我想删除任何包含单词“Version”、“Seite”和“Wirkstoffliste”的列表项。您还会看到一些字符串要么是空白,要么只包含空格(不同长度)。
我已经用正则表达式清理了很多这些数据,但现在我只想要化学名称。还有一些我不想要的其他项目不断出现,例如“版本”,但它们永远不会完全相同,因此可能是“版本 7.2”或“版本 8.1”。因此我想如果我尝试“如果字符串中的‘版本’”,这会在字符串中找到它,然后我可以选择删除它。但是,这似乎不起作用。
我真的需要对此也使用正则表达式吗?
这是我尝试过的一堆东西。
我试过 if string in item.
if "Wirkstoffliste" in item:
lines.remove(item)
我尝试过使用 OR 逻辑,这样我就可以在其中放置更多搜索字符串。例如
if "Seite" or "Wirkstoffliste" or "Version" in item:
lines.remove(item)
我在声明中同时使用了 enumerate with del 和 if,例如
for n,item in enumerate(lines):
if "Wirkstoffliste" in item:
del lines[n]
最后我尝试使用搜索字符串列表:
removables=["Seite","Version","Wirkstoffliste","Gaschromatographie","LOQ"]
for line in lines:
for r in removables:
if r in line:
lines.remove(line)
要删除我试过的空格和空格:
"""delete empty items"""
lines = list(filter(None, lines))
lines = list(filter(bool,lines))
和
for item in lines:
if item=="" or " ":
lines.remove(item)
我发现以上都不起作用,所以我有点困惑我做错了什么。
最佳答案
l1 = ['Wirkstoffliste', 'Seite','Version']
#i am with lines[:] (slicing) to play with the fact a list is mutable
lines[:] = list(filter(str.strip,lines)) #suppress items whitespace or empty
lines[:] = [x for x in lines if not any(sub in x for sub in l1)]
# you could write these lines too if using a new list:
#lines = list(filter(str.strip,lines))
#lines = [x for x in lines if not any(sub in x for sub in l1)]
print(lines)
输出:
['Gaschromatographie (GC) ', 'LOQ ', '[mg/kg] ', 'Acibenzolar-S-methyl',
'Aclonifen', 'Acrinathrin', 'Alachlor', 'Aldrin', 'Allethrin', 'Ametryn',
'Antrachinon', 'Atrazin', 'Atrazin-desethyl', 'Atrazin-desisopropyl',
'Azinphos (-ethyl)', 'Azinphos-methyl', 'Benalaxyl',
'Benfluralin', 'Benzoylprop-ethyl']
另一种使用过滤器编写编码的方法: 如果返回函数为真,则过滤器保留数据
def remove_whitespaces_and_items(item):
if item.strip() == '': return False # if item is blank, dont keep
for x in l1:
if x in item:
return False # if item of l1 is in lines, dont keep
return True # item is not blank and not in l1, so keep it
lines =list(filter(remove_whitespaces_and_items,lines))
关于python - 清理数据 : How to iterate through a list find if item contains a string, 空白或空白并在 Python 中删除该项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55572776/
大家好,所有rdf/sparql开发人员。这是一个困扰了我一段时间的问题,但是自从发布rdf和sparql规范以来,似乎没人能准确回答这个问题。 为了说明这种情况,RDF定义了几种方法来处理资源的多值
我在我的应用程序中使用 Bootstrap ,现在遇到了一个大问题。问题是 .container 元素在 1360 px 的屏幕上具有 274px 的左右边距,这是相当大的。结果,一切看起来都被挤到了
我在删除Docker容器时遇到问题-当我使用前一个命令时,它不起作用(Docker报告了容器ID,但没有删除它)。后者起作用了。据我所知,Docker语法是相同的: C:\Users\user>doc
std::back_inserter 仅适用于带有 push_back 的容器,因此它不适用于 set 和 map 另一方面,std::inserter 适用于所有容器类型。那么我可以一直使用 std
我正在开发 Spring Boot + Redis 示例。在此示例中,我开发了一些自定义方法,这些方法基于 RoleName 提取详细信息。对于以下方法 userRepository.findByRo
在我的 Swift 应用程序中尝试实现 Google Tag Manager v5 时,我遇到了以下警告,这给我带来了一些麻烦: GoogleTagManager warning: No defaul
安装了新的 Laravel 8 项目并在加载第一个实例时,出现以下错误。这很奇怪,因为我把它放在一边,后来从 Laravel 5.8 -> 6 升级了另一个项目(工作正常),当我去检查网站时遇到了类似
我有以下测试代码,它只创建一个空的 hashmap (containers.map) 并在之后填充它: hashtable = containers.Map('KeyType','char','Va
我对它们之间的差异有一点了解,但是拥有专家意见将是很棒的。 Container-Optimized Google Compute Engine Images Google Container Engi
我会模板化一个函数,以便将它与 vector、set 或任何其他 STL 容器(具有正确的 API...)一起使用 我的函数当前原型(prototype)是: vector> f ( const ve
我正在尝试匹配包含和不包含某些字符串的 Pandas DataFrame 的行。例如: import pandas df = pandas.Series(['ab1', 'ab2', 'b2', 'c
我需要在一个非常庞大的全文索引数据库中找到一些文本,但我不知道在我的查询术语变体中使用什么更好。 我看过一些使用的例子 SELECT Foo.Bar FROM Foo WHERE
Traceback (most recent call last): File "demo.py", line 132, in `result = find_strawberry(image
我正在尝试编写一个函数,其中一列包含一个子字符串并且不包含另一个子字符串。 在下面的示例中,如果我的行包含“某些项目”并且不包含“开销”,我希望我的函数返回 1。 row| example strin
我试图在文本文件中 append 包含给定字符串集的任何行。我创建了一个测试文件,在其中放置了这些字符串之一。我的代码应该将文本文件中包含这些字符串之一的任何行打印在与文本文件中的上一行相同的行上。这
我正在尝试学习如何使用 std.container 中可用的各种容器结构,但我无法理解如何执行以下操作: 1) 如何创建一个空容器?例如,假设我有一个用户定义的类 Foo,并且想要创建一个应该包含 F
$contains: [1, 2] // @> [1, 2] (PG array contains operator) $contained: [1, 2] // <@ [1,
我看到 CSS 中使用了这种“div#container”语法,我想知道它是如何工作的。有人有它的资源吗? 最佳答案 除了作为上面提到的唯一引用之外,ID 还增加了特异性(我强烈建议您阅读这篇文章或一
我有一个生成很多子对象的应用程序,每个子对象都与一些全局应用程序对象一起工作,例如在全局应用程序注册表中注册自己,更新应用程序统计信息等。 应用程序应该如何将访问这些全局对象的能力传递给 child
Here is a Sencha fiddle of my tab panel setup.按钮被动态添加到 vbox 选项卡容器中,该容器是 hbox 布局设置的一部分。选项卡容器的宽度由 flex
我是一名优秀的程序员,十分优秀!