- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一种情况,我将数据从一个数据帧添加到另一个数据帧,但我无法删除 nan 值。
示例数据
df1 = pd.DataFrame(
{
'Journal' : ['US Drug standards.','Acta veterinariae.','Bulletin of big toe science.','The UK journal of dermatology.'],
'ISSN_1': ['0096-0225', '0567-8315','0007-4977','0007-0963'],
'ISSN_2': ['0096-0225','nan','0007-4977','0007-0963'],
'ISSN_3': ['nan','1820-7448','nan','0366-077X'],
'ISSN_4': ['nan','0567-8315','nan','1365-2133']
}
)
df1 = df1[['Journal'] + df1.columns[:-1].tolist()]
df2 = pd.DataFrame(
{
'Full Journal Title': ['Drug standards.','Acta veterinaria.','Bulletin of marine science.','The British journal of dermatology.'],
'Abbreviated Title': ['DStan','Avet','Marsci','BritSkin'],
'Total Cites': ['223','444','324','166'],
'ISSN': ['0096-0225','0567-8315','0007-4977','0007-0963']
})
#this makes list of ISSNs from df1 to combine into a column to add to df2
xx=df1.set_index('Journal').values.tolist()
df2['New']=df2.ISSN.apply(lambda x : [y for y in xx if x in y] )
df2=df2[df2.New.apply(len)>0]
df2['New']=df2.New.apply(pd.Series)[0].apply(lambda x : ','.join(x))
我尝试过替换: df2 = df2.replace(np.nan, '', regex=True)
我尝试过 dropna: print(df2.dropna(subset=['New']))
我尝试过 fillna: 打印(df2.fillna(''))
我尝试过替换列表理解: xx = [xx 中值的值 if str(value) != 'nan']
无论我如何尝试,“New”列仍然充满了 nan。
0 0096-0225,0096-0225,nan,nan
1 0567-8315,nan,1820-7448,0567-8315
2 0007-4977,0007-4977,nan,nan
3 0007-0963,0007-0963,0366-077X,1365-2133
我希望它们被跳过或删除。我只想要有效的 ISSN。
预先感谢您的帮助。
最佳答案
这里发生了一些事情。首先,问题显示 'nan'
在数据框中,但注释表明这实际上应该是 nan
(字符串与 null)。
第二个是您存储列表,然后将这些列表的字符串存储在数据框中,这通常是不鼓励的 - 正是您遇到的原因 - 经常会出现意外的行为。
我将解决所提出的问题,尽管您也应该能够将其适应nans
导致问题的代码是:
xx=df1.set_index('Journal').values.tolist()
df2['New']=df2.ISSN.apply(lambda x : [y for y in xx if x in y] )
df2=df2[df2.New.apply(len)>0]
df2['New']=df2.New.apply(pd.Series)[0].apply(lambda x : ','.join(x))
这里的第二行是将 xx
中的所有值添加到包含 'nan 的
然后后续行将它们转换为列表,然后转换为字符串。一旦这些值存在于字符串或列表中,您将无法使用普通的 pandas 方法访问它们。df2['New']
'
我的建议是将它们从 xx 中删除,然后它们就不会出现在 df2
中:
xx=df1.set_index('Journal').values.tolist()
#get rid of nans here
xx=[[y for y in x if y != 'nan'] for x in xx]
df2['New']=df2.ISSN.apply(lambda x : [y for y in xx if x in y] )
df2=df2[df2.New.apply(len)>0]
df2['New']=df2.New.apply(pd.Series)[0].apply(lambda x : ','.join(x))
请注意,这里的第二行是在可以轻松访问时删除'nan'
。
这应该可以满足您的需要,但我再次警告您不要在数据框中存储列表(如果可能的话),并确保使用 nan
而不是 'nan'
。希望这有帮助!
关于python - Dropna 没有下降,fillna 没有填充,我的列表理解无法理解如何摆脱 nans (python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46610007/
我想循环遍历 gpx 文件并计算总上升和下降。我有一个函数可以计算两组经纬度点之间的高程差异,我已经设置了 simplexml 来读取和循环遍历 gpx 文件 trkseg 点。 问题是,这不准确(实
我有两个在不同时间段拍摄的数组。如何通过将新玩家标记为上升来检查哪些玩家在列表中上升/下降? 附言- 数组已经根据分数排序。 pastData:[ { playerName:'Jo
我想捕获 ctrl/alt/etc 键的起伏,无论表单上的哪个控件获取 keyup 或 keydown 事件。由于我的表单上有大约 100 个控件,如果我要为每个单独的控件添加代码,那将非常难看。我怎
vector1 = c(2, 2, 2, 2, 2, 2) vector2 = c(2, 2, 3, 3, 3, 3) vector3 = c(2, 2, 1, 2, 2, 2) 我想知道向量中的数字
我不知道如何遵循编译器的建议:consider using a let binding to create a longer lived value。 Playground #![allow(unus
我希望有人能帮助我理解 AngularJS 中的 $scope 遇到的一个恼人的问题。请参阅下面我的代码中的注释: app.controller('MyController', function ($
我有一个 flex 搜索集群,其中有2个节点在2核CPU 8GB ram实例上运行。每个节点都传入了参数“ES_JAVA_OPTS = -Xms3g -Xmx3g”。我有4个索引,每个索引有2个分片和
我正在学习 R(及其通过 quantmod lib 在交易任务中的应用)并定期浏览社区以从这里获得许多新知识和技巧。我对 R 的总体印象和特别是 quantmod lib 的印象 - 它很棒。 在这一
当我们点击屏幕时,我正在绘制纹理正方形。我正在使用相同的纹理。在新 ios 设备中点击几次后,FPS 从 120 下降到 4 左右。每次手指点击时,我都会将点击的点以及纹理和纹理的大小传递给着色器。
只有当对象被点击并且需要从列表中移除时它才会掉落。这是代码: if(event.type == TouchEvent.TOUCH_DOWN){ for(Bottle bottl
我有一个基于SpriteKit的小游戏。 在这个游戏中,我使用了很多带有字母(或字母组合)的节点,用户可以四处移动来构建单词。 这些节点基本上是带有 SKLabelNode 的 SKSpriteNod
我有一个简单的CSS布局 wrapper header left-sidebar / main-content / right-sidebar footer 但我的主要内容似乎下降了(float dr
在标题中,我给出了四个不同的部分,并使用 float 属性使所有内容都显示在一条水平线上。 当我调整浏览器窗口大小时,最后一个 div 位于黑色边框线下方。 如何解决。 http://jsfiddle
CSS: .desc{ text-align: center; color:#60A8D5; padding-top: 17px;
这是一段简单的代码,但我为这个问题尝试过的解决方案都没有奏效。 #ONE { float: left; border: 1
我有一个 SceneKit 设置,其中有一个 Sphere 设置为 Dynamic body。 我能够运行该应用程序并看到球体落在静态 body 地板上。 我想做的是设置场景,这样 sfere 最初就
首先,我的类(class): export class FooBar { ... isFavorite: boolean = false; constructor() { this.isF
我正在尝试删除所有端口上的所有传出 RST 和传入 RST。我正在使用 Debian Linux。我尝试了互联网上列出的所有可能的命令组合,但似乎没有任何效果。 例如,我试过: iptables -A
我正在做这样的事情: fn main() { //[1, 0, 0, 0, 99]; // return [2, 0, 0, 0, 99] //[2, 3, 0, 3, 99]; //
我正在使用 Rusqlite,它可以让你做这样的查询: statement.query_row(params!([1, 2, 3]), ...); params!()定义如下: macro_rules
我是一名优秀的程序员,十分优秀!