- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个 pandas 数据框,其中有一些带有空字符串的观察结果,我想将其替换为 NaN (np.nan
)。
我使用
成功地替换了这些空字符串中的大部分df.replace(r'\s+',np.nan,regex=True).replace('',np.nan)
但我仍然发现空字符串。例如,当我运行
sub_df = df[df['OBJECT_COL'] == '']
sub_df.replace(r'\s+', np.nan, regex = True)
print(sub_df['OBJECT_COL'] == '')
输出全部返回True
我应该尝试其他方法吗?有没有办法读取这些单元格的编码,这样我的 .replace()
可能因为编码很奇怪而无效?
最佳答案
另一种选择。
sub_df.replace(r'^\s+$', np.nan, regex=True)
或者,用空格替换空字符串和记录
sub.df.replace(r'^\s*$', np.nan, regex=True)
备选方案:
将 apply()
与函数 lambda 结合使用。
sub_df.apply(lambda x: x.str.strip()).replace('', np.nan)
>>> import numpy as np
>>> import pandas as pd
具有空字符串和空格的示例 DataFrame..
>>> sub_df
col_A
0
1
2 somevalue
3 othervalue
4
最佳解决方案:
1)
>>> sub_df.replace(r'\s+',np.nan,regex=True).replace('',np.nan)
col_A
0 NaN
1 NaN
2 somevalue
3 othervalue
4 NaN
2) 这对两种情况都有效,但部分无效:
>>> sub_df.replace(r'^\s+$', np.nan, regex=True)
col_A
0
1 NaN
2 somevalue
3 othervalue
4 NaN
3) 这也适用于这两种情况。
>>> sub_df.replace(r'^\s*$', np.nan, regex=True)
col_A
0 NaN
1 NaN
2 somevalue
3 othervalue
4 NaN
4) 这也适用于这两种情况。
>>> sub_df.apply(lambda x: x.str.strip()).replace('', np.nan)
col_A
0 NaN
1 NaN
2 somevalue
3 othervalue
4 NaN
关于python - 使用 Pandas.DataFrame.replace() 用 NaN 替换空字符串时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54390606/
我正在尝试创建一个程序,其中字符串的前三个字符重复给定次数,如下所示: foo('Chocolate', 3) # => 'ChoChoCho' foo('Abc', 3) # => 'AbcAbcA
我有以下字符串: std::string str = "Mode:AAA:val:101:id:A1"; 我想分离一个位于 "val:" 和 ":id" 之间的子字符串,这是我的方法: std::st
DNA 字符串可以是任意长度,包含 5 个字母(A、T、G、C、N)的任意组合。 压缩包含 5 个字母(A、T、G、C、N)的 DNA 字母串的有效方法是什么?不是考虑每个字母表 3 位,我们可以使用
是否有一种使用 levenstein 距离将一个特定字符串与第二个较长字符串中的任何区域进行匹配的好方法? 例子: str1='aaaaa' str2='bbbbbbaabaabbbb' if str
使用 OAuth 并使用以下函数使用我们称为“foo”(实际上是 OAuth token )的字符串加密 key public function encrypt( $text ) { // a
我是一名优秀的程序员,十分优秀!