python - 如何去除和大写从 Excel 文件派生的数据框中的列—

python - 如何去除和大写从 Excel 文件派生的数据框中的列——避免 unicode/str 错误消息

转载作者：太空宇宙更新时间：2023-11-04 00:58:05

24

4

我有以下 excel 表 downloadable here .

对于 pandas，我是这样读的:

import pandas as pd
infile = "sample1_neu_input_deconv.xlsx"
outdf = pd.read_excel(infile)
outdf.head()

看起来像这样:

In [8]: outdf.head()
Out[8]:
     ID_REF Gene.Symbol  GSM1711905  GSM1711906  GSM1711907
0  10344620     Gm10568      78.496      70.582      78.496
1  10344622     Gm10568      87.940      85.746      94.670
2  10344624      Lypla1     324.306     450.037     231.723
3  10344633       Tcea1     361.733     758.949     917.704
4  10344637     Atp6v1h     236.272     275.910     453.972

现在我要做的是使用以下命令删除 Gene.Symbol 列并将其大写:

outdf["Gene.Symbol"].map(str.strip).map(str.upper)

但它给了我以下错误:

TypeError: descriptor 'strip' requires a 'str' object but received a 'unicode'

正确的做法是什么？

最佳答案

您可以链接连续的矢量化 str调用来实现你想要的:

In [4]:
outdf['Gene.Symbol'] = outdf['Gene.Symbol'].str.strip().str.upper()
outdf['Gene.Symbol']

Out[4]:
0              GM10568
1              GM10568
2               LYPLA1
3                TCEA1
4              ATP6V1H
5                OPRK1
6               RB1CC1
7              FAM150A
8                 ST18
9               PCMTD1
10                RRS1
11              ADHFE1
12       3110035E14RIK
13                SGK3
14       6030422M02RIK
15               CSPP1
16               CSPP1
17               CSPP1
18               CSPP1
19               CSPP1
20               CSPP1
21               CSPP1
22               CSPP1
23               CSPP1
24               CSPP1
25               CSPP1
26               CSPP1
27               CSPP1
28               CSPP1
29               PREX2
             ...      
24649        LOC380994
24650     LOC100504530
24651            SSTY2
24652        LOC665698
24653        LOC380994
24654            SSTY2
24655     LOC100039147
24656        LOC665746
24657            SSTY2
24658        LOC665128
24659            SSTY2
24660           RBM31Y
24661     LOC100039753
24662            SSTY1
24663            SSTY1
24664            SSTY1
24665        LOC380994
24666     LOC100504530
24667     LOC100039753
24668             SRSY
24669              SLY
24670     LOC100504530
24671              SLY
24672     LOC100039753
24673            SSTY2
24674     LOC100042196
24675        LOC380994
24676     LOC100040235
24677     LOC100041704
24678            SSTY2
Name: Gene.Symbol, dtype: object

关于python - 如何去除和大写从 Excel 文件派生的数据框中的列——避免 unicode/str 错误消息，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34130416/

24

4

0

文章推荐： python - abs(v) 比 python 中的 (v + mask) ^ mask 快？

文章推荐： html - bootstrap 4 下拉没有右对齐

文章推荐： python - Django Rest Framework如何自定义ListAPIView

swift - str = str + "abc"比 str = "abc"+ str 慢？
你信吗？我有一个这样的循环(请原谅任何错误，我不得不大量编辑大量信息和变量名称，相信我它有效)。 ...旧示例已删除，请参见下面的代码... 如果我将那些中间的 str = "Blah\(odat.c
c# - 为什么是 str = str.Replace().Replace();比 str = str.Replace(); 快str = str.替换()？
我正在做一个本地测试来比较 C# 中 String 和 StringBuilder 的 Replace 操作性能，但是对于 String 我使用了以下代码: String str = "String
c++ - 使用 str += "A"或 str = str + "A"连接字符串之间的性能差异
我想知道为什么str += "A"和 str = str + "A"有不同的表现。在实践中， string str = "cool" for(int i = 0; i approximately
python - 转换类型列表 [ ("[' str' ]", int), ("['str' ]", int)] to [(' str', int), ('str' , int)]
我有一个类型列表 [("['106.52.116.101']", 1), ("['45.136.108.85']", 1)] 并想将其转换为 [('106.52.116.101', 1), ('45.
python - 转换类型列表 [ ("[' str' ]", int), ("['str' ]", int)] to [(' str', int), ('str' , int)]
我有一个类型列表 [("['106.52.116.101']", 1), ("['45.136.108.85']", 1)] 并想将其转换为 [('106.52.116.101', 1), ('45.
string - 为什么遍历 HashMap<&str,&str> 会产生 &&str？
我正在遍历 HashMap并通过一些本地变量中的模式匹配将值放入其中。委托(delegate)者 fn lyrics_no_bottles(song_template:&mut String){
python - 为什么是 str.count ('' ) ≠ (from str.count ('A' ) + str.count ('B' ) + ... + str.count ('Z' ))
如果字符串(短语)中只有元音，它(对我而言)说True；否则说 False。我不明白为什么它总是返回 False，因为 (x >= x) 总是返回 True。我感谢任何人检查此查询的解决方案。 (st
rust - 我如何实现一种方法来处理 &str、Box、Rc 等？
我有代码以某种方式转换字符串引用，例如取第一个字母 trait Tr { fn trim_indent(self) -> Self; } impl Tr for &'a str { f
c++ - char* str ="ab", str 和 &str 的混淆
我正在学习指针，这是我的代码。我定义了一个指向 char(实际上是字符串)的指针 *str 和一个指向 int *a 的指针，它们的定义方式相同。我认为 str 和 a 都应该是一个地址，但是当我试图
python - Mypy 索引类型 "str"为 "Union[str, Dict[str, str]]"无效；预期类型 "Union[int, slice]"
为什么我会收到错误消息？我已经正确添加了类型，对吗？ Invalid index type "str" for "Union[str, Dict[str, str]]"; expected type
javascript - ['null' ,'' ,'undefined' ].indexOf(str) < 0 和 (str !== null || str !== '' || str !== undefined) 等价吗？
你知道下面两个函数是否等价吗？ function validate(str) { return ( ['null','','undefined'].indexOf(str) [v, valida
python - pd.Series.str.lower.replace ('str' , 'replace_str' ) 不起作用但 pd.Series.str.replace。 ('STR' , 'replace_str' ) 呢？
我正在解决这里的 Dataquest 问题:https://app.dataquest.io/m/293/data-cleaning-basics/5/removing-non-digit-chara
python - 将 str 列表排序为成对的 str，其中一个 str 具有 -R
我有一个字符串列表，如下所示: ["A TB", "A-R TB", "B TB", "B-R TB", "C TB", "C-R TB"...] 但字符串的顺序是随机的。我如何编写一个将元素配对的函
python - Pandas str.extract : AttributeError: 'str' object has no attribute 'str'
我正在尝试将此函数从使用 split 改为使用 str.extract (正则表达式)。 def bull_lev(x): spl = x.rsplit(None, 2)[-2].strip(
python - 将 [{str :int}, {str :int}, ... ] 的字典列表转换为 {str:int} 的单个字典
给定这样的数据结构: [{'a':1, 'b': 2}, {'c':3 }, {'a':4, 'c':9}, {'d':0}, {'d': 0, 'b':6}] 目标是解析数据以产生: {'a': 2
python - 将 [{str :int}, {str :int}, ... ] 的字典列表转换为 {str:int} 的单个字典
给定这样的数据结构: [{'a':1, 'b': 2}, {'c':3 }, {'a':4, 'c':9}, {'d':0}, {'d': 0, 'b':6}] 目标是解析数据以产生: {'a': 2
python - pyside/pyqt : when converting str() to QTreeWidgetItem() the str() is shortened to the [0] of str()
s = 'someString' s = QTreeWidgetItem(s) print(s.text(0)) # 0 being 'column' 输出: 's' 如果我对另一
c++ - 黑白 char* str[]、char *str 和 char str[] 的区别
黑白有什么区别: function(char* str ) function(char* str[] ) function(char str[] ) 它们是如何被调用的(通过什么类型的string/c
javascript - JavaScript 中的 str.fun()/str.fun/fun(str) 有什么区别？
我试过谷歌搜索但找不到准确的答案，所以请允许我尝试在这里提问。如果问题看起来不合适，请告诉我，我会删除它。在 JS 中，您可以通过三种不同的方式编写特定的内置功能: 字符串长度 str.toStri
c - *str 和 *str++
我有这段代码(我的 strlen 函数) size_t slen(const char *str) { size_t len = 0; while (*str) {

首页

博学

6Ren·AI

商城

python - 如何去除和大写从 Excel 文件派生的数据框中的列——避免 unicode/str 错误消息