- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 pandas 的新手,但我正在尝试创建一个大型数据框,我在其中按序列 ID (Seq_ID) 组织有关大量序列的信息,并将有关序列的信息添加到数据框。目前 df 看起来像这样:
Seq_ID mol_type
0 4_cDNA_v RNA
1 2_133+_v RNA
2 5_BM4D_g RNA
. .
. .
1301 4_PB_g RNA
我想写一个函数来查看我当前的 df,source_df,如果列“Seq_source”不存在,它会添加它。然后填写“Seq_Source”列,我有一系列称为 cell_type 的键值对。我想搜索 Seq_ID 列以查看是否在 Seq_ID 中找到了任何值,如果是,则将键添加到新列“Seq_Source”的相应行中,使其如下所示:
Seq_ID mol_type Seq_Source
0 4_cDNA_v RNA PB
1 2_133+_v RNA HSPC
2 5_BM4D_g RNA BMMC
.
.
1301 4_CD4_g RNA PBMC
我写了一些伪代码来帮助解释我对一种方法的想法。
cell_type = {
'PBMC':['CD4','NK', 'CD8'],
'HSPC': ['133+', '133+F'],
'PB': ['cDNA', 'cDNAA', 'cDNAB', 'cDNAC'],
'BMMC':['cDNABM', '34D_Vc','BM4_Vs', 'BM4_Vc', 'BM4n_Vs']
}
def find_cell_source(dictionary, df, reference, new_header):
'''
takes in a dictionary where key corresponds to list of values.
If new_header does not exist, the new column is created.
If a value from key:value pair is found within any of the string entries under reference column
in the database, key is added to reference row under new_header.
'''
# add new_header if does not exist
df[new_header] = [df[new_header] if new_header not in df]
# read rows of reference column and see if values from dict is in references
# add key to row under new_header if it exists, pass if it doesn't
for i in df['reference']:
for k,v in dictionary:
for j in v:
if j in i:
df['new_header'] = k
else:
pass
return df
find_cell_source(cell_type, source_df, 'Seq_ID', 'Seq_Source')
最佳答案
您可以通过多种方式获取Seq_ID
的相关部分,在这种情况下,您似乎可以只使用.str.split
,然后映射值。如果在 _
上拆分还不够,也许可以使用 regex
d = dict((k,v) for v, x in cell_type.items() for k in x)
df['Seq_Source'] = df.Seq_ID.str.split('_', expand=True)[1].map(d)
输出:
Seq_ID mol_type Seq_Source
0 4_cDNA_v RNA PB
1 2_133+_v RNA HSPC
2 5_BM4D_g RNA NaN
1301 4_CD4_g RNA PBMC
请注意,由于 BM4D
不在 cell_type
的任何列表中,因此它被映射到 NaN
关于python-3.x - pandas df : add column if doesn't exist, 将值添加到字典中的新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51546445/
我在 SQL 查询中使用了一个简单的 IF NOT EXISTS/WHERE NOT EXISTS 语句(我都尝试过),但我总是收到 mysql 错误,不知道为什么。尝试使用不同的引号,检查我的 My
我有 2 个表:tbl1 和 tbl2。我想从 tbl1 返回一行,其中包含以下列:col1、col2、col3、can_be_deleted 、有重要项目。这个想法是,can_be_deleted
如果您是 "t1".persona_1_id = 2,则预期结果应返回 persona_id = 4。 like --- id persona_1_id persona_2_id liked 1 2
我遇到了这个用于执行幂等插入的 github SQL 代码示例。完全按照我想要的方式工作。我不想使用 EXISTS,因为我觉得它有点困惑。可以使用联接对相同的操作进行编码吗? 下面是我在 github
public bool CheckTblExist(string TblName) { try { string cmTxt = "s
表1 Id Name DemoID 1 a 33 2 b 44 3 c 33 4 d 33 5 e 44 表2 Id DemoID IsT
我对 SQL 非常陌生。我想知道当我使用“IF EXISTS”或“IF NOT EXISTS”时会发生什么。例如:以下两个语句有什么区别: 语句 1:(存在) IF EXISTS( SELECT OR
我正在更新 exist-db 集合中的 XML 文件,我必须检查是否存在 id 以决定是否必须在我的文档中替换或插入某些内容。 我注意到随着文件的增长,查询执行时间显着恶化,我决定为我的文件添加一个索
我有一个正在尝试更新的数据库,但我不明白为什么会收到有关不存在的列的奇怪错误。当我使用“heroku pg:psql”访问数据库时,我完全可以看到该列。我找到了couple其他questions遇到类
我有一个这样的查询 SELECT ... FROM ... WHERE (SELECT EXISTS (SELECT...)) which did not return anything th
我有一个可以对数据库执行插入和更新的程序,我从 API 获取数据。这是我得到的示例数据: $uname = $get['userName']; $oname = $get['offerNa
我的批处理文件中有这个脚本 -- if not exist "%JAVA_HOME%" ( echo JAVA_HOME '%JAVA_HOME%' path doesn't exist) -
有没有办法让 Directory.Exists/File.Existssince 区分大小写 Directory.Exists(folderPath) 和 Directory.Exists(folde
考虑使用这两个表和以下查询: SELECT Product. * FROM Product WHERE EXISTS ( SELECT * FROM Codes
我正在使用 Subclipse 1.6.18 使用 Eclipse 3.72 (Indigo) 来处理 SVN 1.6 存储库。这一切都在 Ubuntu 下运行。 我有一个项目,在我更新我的 Ecli
我正在尝试使用 Terraform 配置 Azure 存储帐户和文件共享: resource "random_pet" "prefix" {} provider "azurerm" { versi
我有兴趣为需要使用 NOT EXISTS 的应用程序编写查询。子句来检查一行是否存在。 我正在使用 Sybase,但我想知道一般 SQL 中是否有一个示例,您可以在其中编写具有 NOT EXISTS
我正在尝试使用 Terraform 配置 Azure 存储帐户和文件共享: resource "random_pet" "prefix" {} provider "azurerm" { versi
下面是代码示例: CREATE TABLE #titles( title_id varchar(20), title varchar(80)
我曾经这样编写 EXISTS 检查: IF EXISTS (SELECT * FROM TABLE WHERE Columns=@Filters) BEGIN UPDATE TABLE SET
我是一名优秀的程序员,十分优秀!