- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想优化下面的代码。它有效,但如果可以更简洁有效地完成,我想提出建议。
import os
import glob
import pandas as pd
import numpy as np
files = glob.glob(os.path.join('data','*.csv'))
dfs = []
for file in files:
variable = os.path.basename(file).split("_")[0] #split filename
df= pd.read_csv(file)
df['variable'] = variable #assign variable
dfs.append(df)
finalDf = pd.concat(dfs, ignore_index = True)
有什么想法吗?提前谢谢你
Pandas 0.21.1 和 Python 3.6.5
最佳答案
您的代码结构非常好。连接数据帧列表比重复附加到现有数据帧更有效。
您可以尝试和优化的是读取您的 csv 文件,即 df = pd.read_csv(file)
。我唯一的建议是使用将列名映射到类型的字典来指定 dtype
参数。特别是,如果您有包含分类数据的列,请映射到 'category'
以确保优化内存使用。
你提到了更简洁的代码。您可以利用 pd.DataFrame.assign
创建一个新系列并将其设置为您的文件名。此外,您可以使用列表理解:
dfs = [pd.read_csv(file).assign(variable=os.path.basename(file).split('_')[0]) \
for file in glob.glob(os.path.join('data','*.csv'))]
finalDf = pd.concat(dfs, ignore_index=True)
如果您选择这种方法,您可能会失去可读性,因此请记录您正在做的事情。
关于python - 如何使用 Pandas concat 导入多个 csvs、分配变量并连接到一个 DataFrame 中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50764548/
数据库设置: http://sqlfiddle.com/#!2/4d1c2/1 以下查询选择属于productID的所有标签及其位置,逗号分隔: SELECT CONCAT_WS(',', GROUP
要连接两个文件,它看起来像这样: concat: { src: ['common.js','js/app.js'], dest: 'assets/js/app.js' } 如果
我有一个执行 SQL 脚本的 PDI(Kettle)转换,脚本的输出是一列,如下所示: val1 val2 val3 val4 "more values"... 我需要像这样在一个 Excel 单元格
我正在尝试传递一个参数 [例如@X nvarchar(MAX)] 转换成变量 [例如@message nvarchar(MAX)] 在存储过程中。该变量使用 CONCAT 组合字符串值和变量,它最终成
我不知道如何解释我的问题... 这是我的sql请求: SELECT DISTINCT CONCAT (nompropre, ' ', Auteur, ' de ', localite) AS aute
如何在与另一个表连接的表中使用 concat 和 group concat。架构如下所示: 第一表: MariaDB [ittresnamuda]> select * from tb_tipe_req
在我的 CREATE VIEW 中,我想: SELECT CONCAT( t.str1, t.str2 ) AS Title, CHAR_LENGTH( Title ) AS Length 但这会产生
我正在使用 CriteriaBuilder.concat 连接 2 个字符串,代码如下: Expression concat = criteriaBuilder.concat(expr1, expr2
我有以下继承 IEnumerable 的类 public class LinesEnumerable : IEnumerable { protected readonly IPointSeri
_.concat 和有什么区别lodash 和 Array.prototype.concat() ?. 最佳答案 欢迎来到 Stackoverflow! 这些函数的工作方式相同,但语法不同: _.co
我有一个非常大的表(几百万条记录)。表中的列 A 目前是这样的:id、道路名称、纬度、经度,其中 id 是自动增量 PK。 目前,1 个道路名称可以在表中包含多个条目,因为每条道路都映射到多个(纬度、
我测试了各种数组连接技术,并不是因为它实际上对我的代码很重要,而只是顺便说一句,看看我们现在在哪里。正如预期的那样,非常新的 ES 2015 传播运算符在 JavaScript 数组上被旧的 conc
我有一个数组,我需要使用一些编辑重新编译。我是在 async.concat() 的帮助下完成的,但有些东西不起作用。告诉我,哪里错了? async.concat(dialogs, function(d
在 JavaScript 中,我遇到过以两种主要方式编写的代码,用于连接两个(或更多)使用 .concat() 的数组。 Array 上的方法目的。 (假设在下文中,arr1 和 arr2 是作为 .
我之前曾使用 stack over flow 来解决我的 sql 问题并且成功了。 这一次我的下一期可能不会那么成功。 我有一个名为 Statements_1 的表,该表大约有 50 列,假设有 10
我在想以一种相当奇怪的方式从数据库获取东西时遇到了一些麻烦。假设我有下一张 table ID | Rating 229 | 3 229 | 2 229 | 4 229 | 2 2
我有类似表中的内容 mysql> select uuid , short-uuid FROM sampleUUID WHERE identifier ="test123"; +------------
我有一个查询,用于获取我离开加入两个表的帖子: 类别和标签:LEFT JOIN 到链接表→‖INNER JOIN 到类别和标签名称表。 LEFT JOIN wp_term_relationships
我目前正在开发一个大型 angular.js 项目。我使用 grunt 将所有文件合并/丑化为一个大的 target.js 文件,然后将其包含在索引页中。 我已经意识到,这使得在开发环境中调试变得非常
我的表中有三列:firstName、lastName 和 jobTitle。我想将 firstName 和 lastName 连接为 Fullname,然后连接 Fullname 和 jobTitle
我是一名优秀的程序员,十分优秀!