- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有 50 个 DataFrame ,它是制表符分隔的并且有两列。我需要向这些文件中添加列名。
这是文件的示例,
==> PE07_ID.count <==
ENSG00000000003 0
ENSG00000000005 0
ENSG00000000419 586
ENSG00000000457 97
==> PE07_REL.count <==
ENSG00000000003 2
ENSG00000000005 0
ENSG00000000419 954
==> PE08_ID.count <==
ENSG00000000003 0
ENSG00000000005 0
ENSG00000000419 317
我需要的是为每个列添加列名,我的意思是第一列可以命名为“基因”,第二列应该以文件名命名
这是我到目前为止尝试过的,
首先我调用了所有文件,
path = '/user/home/files'
files = os.listdir(path)
files_txt = [os.path.join(path,i) for i in files if i.endswith('count')]
## Change it into dataframe
dfs_patty = [pd.DataFrame.from_csv(x, sep='\t') for x in files_txt]
50 个数据帧的 files_txt 看起来像这样
['/user/home/AE02_REL.count',
'/user/home/AE04_REL.count',
'/user/home/AE05_ID.count',
'/user/home/AE05_REL.count'....]
在此之后,我尝试为以下内容添加两个标题名称或列名称
path = '/home/user/dir/'
file_names = []
data_frames = []
for filename in os.listdir(path):
name = os.path.splitext(filename)[0]
file_names.append(name)
df = pd.read_csv(path + filename, header=None,sep='\t')
df.rename(columns={1: name, 0:'Gene'}, inplace=True)
#df.columns = ["Gene",filename]
data_frames.append(df)
combined = pd.concat(data_frames, axis=1)
然后,
combined.head()
Gene AE02_REL Gene AE04_REL Gene AE05_ID Gene AE05_REL Gene AE07_REL ... Gene PL08_REL Gene PL09_ID Gene PL09_REL Gene PL10_ID Gene PL10_REL
0 ENSG00000000003 0 ENSG00000000003 1 ENSG00000000003 2 ENSG00000000003 16 ENSG00000000003 29 ... ENSG00000000003 2 ENSG00000000003 9 ENSG00000000003 1 ENSG00000000003 1 ENSG00000000003 4
5 rows × 100 columns
当我尝试删除重复的列时,它抛出以下错误,
Columns_dup_droped =combined.drop_duplicates(cols=['Gene'])
pandas/hashtable.pyx in pandas.hashtable.PyObjectHashTable.get_labels (pandas/hashtable.c:13820)()
ValueError: Buffer has the wrong number of dimensions (expected 1, got 2)
最后,我需要为每个文件这样的东西,例如,
==> PE07_ID.count <==
ENSG00000000003 0
ENSG00000000005 0
ENSG00000000419 586
ENSG00000000457 97
ENSG00000000460 44
ENSG00000001167 978
应该是,
Gene PE07_ID.count
ENSG00000000003 0
ENSG00000000005 0
ENSG00000000419 586
ENSG00000000457 97
ENSG00000001167 978
此外,Dataframe 的尾部有以“__”开头的行,我需要删除最后五行,
我试过以下,
combined.irow(slice(-5, None))
但它只是给他们最后一行..而我需要从整个数据帧中删除它们
所以对于所有 50 个数据帧..
非常感谢任何帮助。
最佳答案
如评论中所述,您需要引用完整路径名。
如果您将路径更改为:
path = '/user/home/files/'
你的循环到:
for filename in os.listdir(path):
name = os.path.splitext(filename)[0]
file_names.append(name)
df = pd.read_csv(path + filename, header=None)
df.columns = ["Gene",filename]
data_frames.append(df)
如果读入 Dataframe 的数据有两列,它应该可以工作。
关于python - 如何从 Dataframe 中删除重复的列和最后 5 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36404374/
这个问题在这里已经有了答案: “return” and “try-catch-finally” block evaluation in scala (2 个回答) 7年前关闭。 为什么method1返
我有一个动态列表,需要选择最后一项之前的项目。 drag your favorites here var lastLiId = $(".album
我想为每个线程执行特定操作,因此,我认为tearDown Thread Group 不起作用。 是否有任何替代方法可以仅在线程的最后一次迭代时运行“仅一次 Controller ”? 谢谢。 最佳答案
在我的书中它使用了这样的东西: for($ARGV[0]) { Expression && do { print "..."; last; }; ... } for 循环不完整吗?另外,do 的意义何
我想为每个线程执行特定操作,因此,我认为tearDown Thread Group 不起作用。 是否有任何替代方法可以仅在线程的最后一次迭代时运行“仅一次 Controller ”? 谢谢。 最佳答案
有没有可能 finally 不会被调用但应用程序仍在运行? 我在那里释放信号量 finally { _semParallelUpdates.Re
我收藏了 对齐的元素,以便它们形成两列。使用 nth-last-child 的组合和 nth-child(even) - 或任何其他选择器 - 是否可以将样式应用于以下两者之一:a)最后两个(假设
我正在阅读 Jon Skeet 的 C# in Depth . 在第 156 页,他有一个示例, list 5.13“使用多个委托(delegate)捕获多个变量实例化”。 List list = n
我在 AM4:AM1000 范围内有一个数据列表(从上到下有间隙),它总是被添加到其中,我想在其中查找和总结最后 4 个结果。但我只想找到与单独列相对应的结果,范围 AL4:AL1000 等于单元格
我最近编写了一个运行良好的 PowerShell 脚本 - 然而,我现在想升级该脚本并添加一些错误检查/处理 - 但我似乎被第一个障碍难住了。为什么下面的代码不起作用? try { Remove-
这个问题在这里已经有了答案: Why does "a == x or y or z" always evaluate to True? How can I compare "a" to all of
使用 Django 中这样的模型,如何检索 30 天的条目并计算当天添加的条目数。 class Entry(models.Model): ... entered = models.Da
我有以下代码。 public static void main(String[] args) { // TODO Auto-generated method stub
这个问题在这里已经有了答案: Why does "a == x or y or z" always evaluate to True? How can I compare "a" to all of
这个问题已经有答案了: Multiple returns: Which one sets the final return value? (7 个回答) 已关闭 8 年前。 我正在经历几个在工作面试中
$ cat n2.txt apn,date 3704-156,11/04/2019 3704-156,11/22/2019 5515-004,10/23/2019 3732-231,10/07/201
我可以在 C/C++ 中设置/禁用普通数组最后几个元素的读(或写)访问权限吗?由于我无法使用其他进程的内存,我怀疑这是可能的,但如何实现呢?我用谷歌搜索但找不到。 如果可以,怎样做? 因为我想尝试这样
我想使用在这里找到的虚拟键盘组件 http://www.codeproject.com/KB/miscctrl/touchscreenkeyboard.aspx就像 Windows 中的屏幕键盘 (O
我正在运行一个 while 循环来获取每个对话的最新消息,但是我收到了错误 [18-Feb-2012 21:14:59] PHP Warning: mysql_fetch_array(): supp
这个问题在这里已经有了答案: How to get the last day of the month? (44 个答案) 关闭 8 年前。 这是我在这里的第一篇文章,所以如果我做错了请告诉我...
我是一名优秀的程序员,十分优秀!