- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
请建议根据其他单元格向单元格批量添加值的正确方法。
我有 csv 文件,我需要搜索第 1 列中的行是否包含关键字 AAA 或 BBB 或 CCC,然后将字符串 XXX 添加到第 3 列中的单元格,并将字符串 YYY 添加到同一行中第 4 列中的单元格。
如果第 1 列中的行包含关键字 DDD 或 EEE 或 FFF,则将字符串 VVV 添加到同一行中第 3 列的单元格中,并将字符串 WWW 添加到第 4 列的单元格中。
大约有一千个关键字,它们可以是不同的大小写。
原始 csv:
1,"AAA 329823 3298","23"
2,"BBB 87682 23423","64"
3,"ccc 73838 72653","45"
4,"DDD 86738 86398","23"
5,"EEE 64833 34322","45"
我想要:
1,"AAA 329823 3298","23",XXX,YYY
2,"BBB 87682 23423","64",XXX,YYY
3,"ccc 73838 72653","45",XXX,YYY
4,"DDD 86738 86398","23","VVV","WWW"
5,"EEE 64833 34322","45","VVV","WWW"
现在我使用以下代码,但我认为这是错误的方式:
with open(r_file,'r') as csvinput:
with open(w_file, 'w') as csvoutput:
writer = csv.writer(csvoutput)
reader = csv.reader(csvinput)
all = []
for row in reader:
if any(c in row[1] for c in ("AAA", "BBB", "CCC")):
row.append("XXX")
row.append("YYY")
if any(c in row[1] for c in ("DDD", "EEE", "FFF")):
row.append("VVV")
row.append("WWW")
最佳答案
您可以使用numpy.select
对于通过多个条件设置值 contains
用于检查子字符串:
m1 = df[1].str.contains("AAA|BBB|CCC")[:,None]
m2 = df[1].str.contains("DDD|EEE|FFF")[:,None]
df[[3,4]] = pd.DataFrame(np.select([m1, m2], [['XXX','YYY'],['VVV','WWW']], ['','']))
print (df)
0 1 2 3 4
0 1 AAA 329823 3298 23 XXX YYY
1 2 BBB 87682 23423 64 XXX YYY
2 3 ccc 73838 72653 45
3 4 DDD 86738 86398 23 VVV WWW
4 5 EEE 64833 34322 45 VVV WWW
设置:
如果没有 csv header ,请使用 header=None
参数:
import pandas as pd
temp=u'''1,"AAA 329823 3298","23"
2,"BBB 87682 23423","64"
3,"ccc 73838 72653","45"
4,"DDD 86738 86398","23"
5,"EEE 64833 34322","45"'''
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=None)
print (df)
0 1 2
0 1 AAA 329823 3298 23
1 2 BBB 87682 23423 64
2 3 ccc 73838 72653 45
3 4 DDD 86738 86398 23
4 5 EEE 64833 34322 45
编辑:
#setup dictionary
d = {'AAA':['XXX','YYY'], 'BBB':['XXX','YYY'], 'CCC':['XXX','YYY'],
'DDD':['VVV','WWW'],'EEE':['VVV','WWW'], 'FFF':['VVV','WWW']}
#create DataFrame
df1 = pd.DataFrame.from_dict(d, orient='index', columns=['a','b'])
print (df1)
a b
AAA XXX YYY
BBB XXX YYY
CCC XXX YYY
DDD VVV WWW
EEE VVV WWW
FFF VVV WWW
#extract valus of dictionary keys to new column
pat = '|'.join(r"\b{}\b".format(x) for x in d.keys())
df['new'] = df[1].str.extract('(' + pat + ')')
print (df)
0 1 2 new
0 1 AAA 329823 3298 23 AAA
1 2 BBB 87682 23423 64 BBB
2 3 ccc 73838 72653 45 NaN
3 4 DDD 86738 86398 23 DDD
4 5 EEE 64833 34322 45 EEE
#join df1 by column new
df = df.join(df1, on='new')
print (df)
0 1 2 new a b
0 1 AAA 329823 3298 23 AAA XXX YYY
1 2 BBB 87682 23423 64 BBB XXX YYY
2 3 ccc 73838 72653 45 NaN NaN NaN
3 4 DDD 86738 86398 23 DDD VVV WWW
4 5 EEE 64833 34322 45 EEE VVV WWW
关于python - 建议向单元格批量添加值的正确方法取决于其他单元格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51035607/
这是我在阅读了几个关于 jpa 批量插入的主题后创建的简单示例,我有 2 个持久对象用户和站点。一个用户可以有多个站点,所以我们在这里有一对多的关系。假设我想创建用户并将多个站点创建/链接到用户帐户。
我有文档列表(对象),该对象有多个文档,即存在 Json 记录,但是当我尝试上传文档束(记录)时,它没有上传到文档数据库,但当我上传单个文档记录时,它上传成功。 List listObj = ne
我希望进行批量域名查找,看看是否有一些域名可供购买。我找不到 perl 模块,但似乎应该有一种方法可以在 perl 中执行此操作。我正在寻找免费的东西。谢谢! 最佳答案 从这里:http://www.
我制作了一个批处理类来检查 FTP 上的文件、下载它们并在 FTP 上删除它们。 当我手动运行它(不是批量运行)时,它运行完美,下载 FTP 中的所有文件并在下载完成后删除它们。 当我尝试批量运行时,
我有一个 *+* 形式的字符串 base。我想得到+之前的所有内容。例如,如果 base=foo+bar,我想获取 foo。 我尝试过使用字符串替换来实现 set left=%base:+*=% 但这
我需要创建几十个表,并且我需要它们是innodb, 有没有办法做到这一点,而不是将 engine=innodb 附加到每个 create table 语句? 最佳答案 可以在服务器级别指定默认引擎,在
我正在尝试制作显示 unix/linux 提示符的 dos shell。代码是: @echo off :hi set tmpdrv=%cd:~0,2% if %homedrive% == %tmpdr
我有以下代码,基本上是在二维矩阵的每一行上进行一维卷积。卷积核是一样的。所以真的是 SIMD 案例。 a = [ 1,2,3,4,5; 6,7,8,9,7; 7,6
情况: 我尝试在 shell 中的循环内移动文件,但我的代码无法正常工作。 for /D %%F in (*) do ( if "%%F" NEQ "%directoryToPutFilesIn
目录包含 2 个(或更多)任意名称的视频文件。 video1.mkv video2.mkv 需要找出每个视频的持续时间。为此,我们使用 MediaInfo . setlocal EnableDelay
如何在 Windows 中批量删除数千个文件中的空格(而不是替换为下划线)?我可以从 DOS 命令执行此操作吗? 目前: file one.mp3 file two.mp3 所有文件需要变成: fil
我想创建一个批处理文件,它读取 2 个不同的值,并根据它们的比较方式进行相应处理。但是,比较永远不会起作用。代码是: REM string1 and string2 contain the follo
我正在尝试将一个文件夹的子文件夹复制到许多其他名称未知的文件夹中。目的是在所有使用它的员工文件夹中备份程序的源文件。如果在员工文件夹中找不到程序文件夹,则不应执行任何操作。这看起来如下: 来源: F:
我正在寻找一种简单的方法来检测一小段文本(几句话)是否为英语。在我看来,这个问题比尝试检测任意语言要容易得多。有没有可以做到这一点的软件?我正在用 python 编写,并且更喜欢 python 库,但
我们正在尝试向 8k 种不同的设备发送促销推送消息。我们正在成功响应推送通知 URL https://fcm.googleapis.com/fcm/send 但只有部分用户收到此通知,并非全部。那么
基本上我只是用这一段来替换我的 var 中的一个字符串,但我无法让嵌套延迟扩展正常工作。这甚至可能吗? set replace=!replace:!search!=!replaceVal!! 我知道执
如何使用 ffmpeg 对一批视频文件进行编码,使用相同的设置? 我找到了 one-line solution将当前文件夹中的 .avi 文件转换为 .mov。请注意,我要编码 .mov -> .mo
我正在尝试制作一个批处理文件,每次循环时都会将变量增加 1,然后检查变量是否等于 5,如果不是,则再次循环。我知道这可能有一个 while 循环,但我不知道如何做到这一点,我现在只是享受学习 Batc
我正在尝试创建一个循环,读取多个 CSV 文件,这些文件都具有相同类型的气温数据。但是,我想跳过数据上方的行。这些是数据集中的“警报”。每个文件可能有不同数量的警报,因此要跳过不同数量的行。见下文:
因此,我正在批量创建一个Mail程序,而消息传递部分出现了问题。 消息传递部分是无限循环。 当我输入多个单词时,它会崩溃。 这是代码。请帮忙! :rep set line= set /p line=
我是一名优秀的程序员,十分优秀!