- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个包含 10000 多个文件的文件夹,其中包含 10 个变量(X1、X2、...、X10)的数据。
文件的名称只是 File1.json、File2.json 等。
我需要为每个变量创建一个数据框,即 10 个数据框。
输入
期望的输出
我正在做以下事情
for i in range(0, len(VARIABLES)):
%reset_selective -f "^DATA$"
DATA=pd.DataFrame()
Data_name=VARIABLES[i]
print(Data_name)
for ii in range(0, len(FILES)):
file_name1='Directory/'
file_name2= FILES[ii]
file_name=file_name1+file_name2
with open(file_name, 'r') as fer:
data1 = json.load(fer)
df = pd.DataFrame({'count': data1})
Var_namei=df['count']['consistname']
if Var_namei==Data_name:
#create Dataframe
代码对于第一个变量工作正常,因为我不知道哪些文件包含 X1 的数据。
但是,从第二次迭代开始,重新打开每个文件以查找 X2 的数据就没有意义了。同样,当我到达最后一次迭代时,我应该只打开 X10 的文件。
我想避免打开/考虑其数据已用作 DataFrame 输入的文件,例如File2 包含 X1 的值,因此我不想在查找 X2、X3 等的值时再次打开 File2
我试过添加
k.iloc[ii,i]= ii
其中 k 是 if 条件后的零大小 (File, VAriable) 的数据帧,以便在打开变量 i 的文件 ii 时在 i 列和 ii 行中放置 1。这样,我可以在接下来的迭代中跳过这样的 ii 行文件。但是,我无法在 for 循环期间访问 k 值。
有什么建议吗?谢谢
最佳答案
欢迎来到 SO。如果稍微重构一下,您的代码会简单得多。
file_name1='Directory/'
FileDATA={}
for file_name2 in FILES:
file_name=file_name1+file_name2
with open(file_name, 'r') as fer:
data1 = json.load(fer)
if data1['consistname'] in VARIABLES:
# Save the data1 object to FileDATA
# Assuming that every element in VARIABLES is unique
Data_name=data1['consistname']
FileDATA[Data_name] = data1
for Data_name in VARIABLES:
data1 = FileDATA[Data_name]
df = pd.DataFrame({'count': data1})
# create Dataframe
第一个循环遍历所有文件一次,并将对应于 [X1, X2, ..., X10]
变量的数据保存在字典 FileDATA
中.然后您可以遍历变量来处理数据。
删除不需要的行后,
FileDATA={}
for file_name2 in FILES:
with open('Directory/' + file_name2, 'r') as fer:
data1 = json.load(fer)
if data1['consistname'] in VARIABLES:
FileDATA[data1['consistname']] = data1
for Data_name in VARIABLES:
df = pd.DataFrame({'count': FileDATA[Data_name]})
# create Dataframe
关于python - For循环根据指定值排除一些DataFrame行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54806806/
我有一个名为“members”的数据库表。分配给成员的是一个职位。 职位 来自部门。我有 Departments,然后是那些中的 Sub-Departments 和 Sub-Departments 中
我正在尝试为 Solr 搜索应用过滤器标记 Tagging_and_excluding_Filters . 挑战在于同时应用多个标记(对于单个页面上的多个选择选项)。例如 q=mainquery&fq
我知道这个问题已经被问过很多次了,我已经尝试了所有建议,并阅读了有关不同选择器等的所有内容,但没有任何对我有用 给出以下 HTML 片段: link
是否有直接的 LINQ 语法来查找集合 B 中不存在的集合 A 的成员?在 SQL 我会写这个 SELECT A.* FROM A LEFT JOIN B ON A.ID = B.ID WHERE B
我试图排除并在现有xpath中包括以下xpath,但不太确定如何做到这一点 //exclude -> //*[@id="ires"]/ol/li[6]/div/a[1]/img //include
我有 30 个站点,我需要在其中 24 个站点上回显某些内容。我怎样才能排除其他人?该代码不起作用,因为我认为它的逻辑是假的:) $currentsite = get_bloginfo('wpurl'
我需要对目标文件夹进行检查,并检查文件是否来自今天,并且超过5kb 下面的命令根据使用今天的日期存在的文件来提供bool值,但是我还要添加-gt5kb之类的排除项 我尝试使用-Exlcude,但不确定
我编入索引的Elasticsearch文档包含许多字段。我一直在使用match_all查询来获取结果。我想从match_all中排除一些字段,这可能吗? 最佳答案 在Elasticsearch中,您可
我正在为我的 DAO 编写一些测试,因为很多测试使用保存到我的数据库中的测试对象,所以我使用注释 @Before 和 @Before 创建了 setup() 和teardown() 方法@After
我编写了一个程序来解决以下问题: Implement a diffusion limited aggregation simulation on a toroid plane where seeds
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
很多时候我必须运行这个查询: select * from users where name is not null and name != '' 有没有更好的方法来做到这一点。我需要更多的性能,任何建
如果检测到某个操作系统,是否有一种简单的方法可以排除某些代码? 我设计了一个运行良好的网站(它是一个 sidescroller),当使用滚轮(向上/向下)时,它会左右滚动。但是,如果您使用的是 Mac
我应该如何排除“IN”子句中的值? $Graduates = "45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,6
很明显,如果一个 Mysql 表的全文索引包含一个出现在 50% 的数据行中的关键字,该关键字将被匹配查询忽略 因此,如果我有一个包含 50 个条目的全文索引“content”的表其中 27 个条目在
我有下面的循环。 我需要提取所有不包含字母 p 的名称 (lskey),但我的尝试不起作用。 for(var i = 0; i "); } } 如果有人能回答,我将不胜感激。 最佳答案 如此接
我正在尝试查找 FTP 服务器上根目录的总大小。但是,我无权访问根目录中的其中一个目录。 我想用这个函数对根目录的大小求和: size = 0 for filename in ftp.nlst("."
我有以下正则表达式来匹配 html 链接: 有点效果。除了不是真的。因为它在 编辑: 这将使它只抓取引号而不是 之后的所有内容 最佳答案 我认为您的正则表达式没有按照您的意愿行事。 这会非贪婪地捕
我在提出异常方面遇到困难,例如: import csv o = open('/home/foo/dummy.csv', 'r') # Empty file! reader = csv.reader(o
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
我是一名优秀的程序员,十分优秀!