- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
问题
我想将 pandas 数据框中的一列拆分为 2 列,在百分比列(见下文)中,每个条目都以大写字母字符开头,我想在这封信之后立即拆分“百分比”列,新列标记为“氨基酸”。
当前代码:
import pandas as pd
df = pd.read_csv('foo.csv')
df['Amino Acid'], df['Percentage'] = zip(*df['Percentage'].map(lambda x: x.split('[^a-zA-Z]')))
df.to_csv('bar.csv',index=False)
输入数据示例
+-----------------------------+-------+-----+-----------+---------------------------------------------------------------------------------------------+
| Species | ID | OGT | DB | Percentage |
+-----------------------------+-------+-----+-----------+---------------------------------------------------------------------------------------------+
| Halogeometricum borinquense | 60847 | 37 | ATCC/DSMZ | E is 8.333003365670164% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 | 37 | ATCC/DSMZ | R is 6.310991522830762% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 | 37 | ATCC/DSMZ | A is 10.22668778459711% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
+-----------------------------+-------+-----+-----------+---------------------------------------------------------------------------------------------+
所需输出示例
+-----------------------------+-------+-----+-----------+------------+--------------------------------------------------------------------------------------------+
| Species | ID | OGT | DB | Amino Acid | Percentage |
+-----------------------------+-------+-----+-----------+------------+--------------------------------------------------------------------------------------------+
| Halogeometricum borinquense | 60847 | 37 | ATCC/DSMZ | E | is 8.333003365670164% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 | 37 | ATCC/DSMZ | R | is 6.310991522830762% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 | 37 | ATCC/DSMZ | A | is 10.22668778459711% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
+-----------------------------+-------+-----+-----------+------------+--------------------------------------------------------------------------------------------+
最佳答案
可以直接提取第一个字母:
df['Amino Acid'] = df['Percentage'].str[0]
df['Percentage'] = df['Percentage'].str[1:]
关于python - 在单元格中的第一个字母之后拆分 Pandas 数据框列(一分为二),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51243702/
我正在尝试使用 double 来表示数据库中的一种双值类型,它有时必须接受两个值,有时只接受一个值 (int)。 所以该字段在数据库中是一个 float ,而在我的 C# 代码中,它是一个 doubl
假设我有一个带有非常快速测试脚本的小项目,我只想将所有内容一分为二,从初始提交到当前提交。我该怎么做? 澄清一下,我不想浪费时间来识别好提交和坏提交,所以我正在寻找一种快速方法来将最新提交标记为坏提交
我有这个代码 $second_half = $items; //ArrayIterator Object; $first_half = array_slice($second_half ,0,ceil
我正在尝试解析以字符串形式接收的二进制数据。我对按位运算不是很熟悉。 我的字符串中的一个字节(我假设它是一个无符号短整数)包含 2 个重要数字:版本和计数。位 1 到 4 包含版本,位 5 到 8 包
我想在点击某处时将 UITableView 分成两部分,顶部和底部。隐藏的部分将打开动画。谁能告诉我该怎么做? 这种效果就像在桌面上的 iOS 应用程序组中一样。 我认为“如何将 anyview 分成
我正在尝试拆分一个 TD(表格单元格),使其看起来就像是两个单元格。问题是,当单元格的高度增长时,我无法让里面的两个 div 占据所有可用的高度。由于这些单元格可以动态增长,我也无法设置固定高度(这可
我有一个很大的代码差异需要审查,但它确实应该分成两个单独的差异。 每个差异都有很多提交,我可以找出哪一个(大部分)将提交字符串拆分为两个不同的任务,尽管更清晰的拆分将基于文件名(即 N 个文件与 w/
我如何将一个数据帧除以另一个?这两个数据框具有相同的列和相同的行,但我需要将每个相交与其对应的相交划分为一个新的数据框,例如以下: DF1 Name Jan Feb Mar Aaro
我编写了一个 MFC 程序来读取文件、存储数据并将其绘制为客户端 View 上的文本。 我想制作一个菜单按钮 View->Split,将客户区分成两个,分别滚动显示相同数据的 View 。 我在网上看
我试图在一个页面上放置两个注册表单,但为了有效地执行此 id,我想将中心 div 分成两个单独的列来实现此目的。 我贴出了下面的代码:
是否有一种简单且运行时高效的方法可以在 C++ 中采用 std::vector<> 并将其分成两半分成另外两个 vector ? 因为现在我正在这样做: std::vector<> v1, v2; f
问题 我想将 pandas 数据框中的一列拆分为 2 列,在百分比列(见下文)中,每个条目都以大写字母字符开头,我想在这封信之后立即拆分“百分比”列,新列标记为“氨基酸”。 当前代码: import
我正在尝试将一个 div 分成两个并排的 div。我知道这里有几个例子,但我已经搜索过但没有找到一个允许 div 在垂直方向占用所有可用空间,没有任何内容。 看看http://jsfiddle.net
我有一个数据框: col_1 Agent AB 7:00 AM Agent AB 7:00 AM Cust XY 8:00 AM Cust XY 9:00 AM Agent AB 11:00 AM 我
我正在使用 C# 和 ASP.NET 3.5。基本上我从数据集中检索一列数据并将其放入列表中,如下所示: List dates = new List(); foreach (DataR
我想将我的 div“划分”为两部分,以便在左侧显示文本,在右侧显示图像。关于主题中提到的 div 具有橙色背景色和红色线条。这只是为了向您展示它应该是什么样子。 HTML #header { he
我正在尝试将一串文本分成两半,注意不要: 断词 破坏 html 为了给你一些背景知识,我想拍一篇博客文章并在其中插入一个广告。 我四处寻找答案,但我在 SO 上能找到的唯一选项建议剥离所有 HTML—
我需要用 JQuery 将一个列表分成两部分。假设我有以下列表: item item item item item 我试过使用: $("li#POI").after("");
我正在使用一个画廊,它代表一个包含一个或两个的列 跨越整个宽度的元素。包含多个 的列元素还包含具有不同高度和宽度属性的图像。我希望这些列具有相同的高度,然后在它们之间有额外空间时尽可能填充宽度。 我
我是一名优秀的程序员,十分优秀!