pandas数据筛选和csv操作的实现方法-6ren

pandas数据筛选和csv操作的实现方法

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章pandas数据筛选和csv操作的实现方法由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

1. 数据筛选。

（1）单条件筛选。

 
    ? 
   
         df[df[ 
         'a' 
         ]> 
         30 
         ] 
        
         # 如果想筛选a列的取值大于30的记录,但是之显示满足条件的b，c列的值可以这么写 
        
         df[[ 
         'b' 
         , 
         'c' 
         ]][df[ 
         'a' 
         ]> 
         30 
         ] 
        
         # 使用isin函数根据特定值筛选记录。筛选a值等于30或者54的记录 
        
         df[df.a.isin([ 
         30 
         ,  
         54 
         ])]

（2）多条件筛选。

可以使用&（并）与| （或）操作符或者特定的函数实现多条件筛选。

 
    ? 
   
         # 使用&筛选a列的取值大于30，b列的取值大于40的记录 
        
         df[(df[ 
         'a' 
         ] >  
         30 
         ) & (df[ 
         'b' 
         ] >  
         40 
         )]

（3）索引筛选。

a. 切片操作。

df[行索引，列索引]或df[[列名1，列名2]] 。

 
    ? 
   
         #使用切片操作选择特定的行 
        
         df[ 
         1 
         : 
         4 
         ] 
        
         #传入列名选择特定的列 
        
         df[[ 
         'a' 
         , 
         'c' 
         ]]

b. loc函数。

当每列已有column name时，用 df [ ‘a' ] 就能选取出一整列数据。如果你知道column names 和index，且两者都很好输入，可以选择 .loc同时进行行列选择.

 
    ? 
   
         In [ 
         28 
         ]: df.loc[ 
         0 
         , 
         'c' 
         ] 
        
         Out[ 
         28 
         ]:  
         4 
        
         In [ 
         29 
         ]: df.loc[ 
         1 
         : 
         4 
         ,[ 
         'a' 
         , 
         'c' 
         ]] 
        
         Out[ 
         29 
         ]: 
        
         a c 
        
         1 
         6 
         10 
        
         2 
         12 
         16 
        
         3 
         18 
         22 
        
         4 
         24 
         28 
        
         In [ 
         30 
         ]: df.loc[[ 
         1 
         , 
         3 
         , 
         5 
         ],[ 
         'a' 
         , 
         'c' 
         ]] 
        
         Out[ 
         30 
         ]: 
        
         a c 
        
         1 
         6 
         10 
        
         3 
         18 
         22 
        
         5 
         30 
         34

c. iloc函数。

如果column name太长，输入不方便，或者index是一列时间序列，更不好输入，那就可以选择 .iloc了，该方法接受列名的index,iloc 使得我们可以对column使用slice（切片）的方法对数据进行选取。这边的 i 我觉得代表index，比较好记点.

 
    ? 
   
 
     
       
       
         In [ 
         35 
         ]: df.iloc[ 
         0 
         , 
         2 
         ] 
        
 
         Out[ 
         35 
         ]:  
         4 
        

            
        
 
         In [ 
         34 
         ]: df.iloc[ 
         1 
         : 
         4 
         ,[ 
         0 
         , 
         2 
         ]] 
        
 
         Out[ 
         34 
         ]: 
        
 
           
         a c 
        
 
         1 
         6 
         10 
        
 
         2 
         12 
         16 
        
 
         3 
         18 
         22 
        

            
        
 
         In [ 
         36 
         ]: df.iloc[[ 
         1 
         , 
         3 
         , 
         5 
         ],[ 
         0 
         , 
         2 
         ]] 
        
 
         Out[ 
         36 
         ]: 
        
 
           
         a c 
        
 
         1 
         6 
         10 
        
 
         3 
         18 
         22 
        
 
         5 
         30 
         34 
        

            
        
 
         In [ 
         38 
         ]: df.iloc[[ 
         1 
         , 
         3 
         , 
         5 
         ], 
         0 
         : 
         2 
         ] 
        
 
         Out[ 
         38 
         ]: 
        
 
           
         a b 
        
 
         1 
         6 
         8 
        
 
         3 
         18 
         20 
        
 
         5 
         30 
         32 
        
 
     
 
   

d. ix函数。

ix的功能更加强大，参数既可以是索引，也可以是名称，相当于，loc和iloc的合体。需要注意的是在使用的时候需要统一，在行选择时同时出现索引和名称，同样在同行选择时同时出现索引和名称.

e. at函数。

根据指定行index及列label，快速定位DataFrame的元素，选择列时仅支持列名.

f. iat函数。

与at的功能相同，只使用索引参数。

2. csv操作。

csv文件内容。

 
    ? 
   
 
     
       
       
         Supplier Name,Invoice Number,Part Number,Cost,Purchase Date 
        
 
         Supplier X, 
         001 
         - 
         1001 
         , 
         2341 
         ,$ 
         500.00 
         , 
         1 
         / 
         20 
         / 
         14 
        
 
         Supplier X, 
         001 
         - 
         1001 
         , 
         2341 
         ,$ 
         500.00 
         , 
         1 
         / 
         20 
         / 
         14 
        
 
         Supplier X, 
         001 
         - 
         1001 
         , 
         5467 
         ,$ 
         750.00 
         , 
         1 
         / 
         20 
         / 
         14 
        
 
         Supplier X, 
         001 
         - 
         1001 
         , 
         5467 
         ,$ 
         750.00 
         , 
         1 
         / 
         20 
         / 
         14 
        
 
         Supplier Y, 
         50 
         - 
         9501 
         , 
         7009 
         ,$ 
         250.00 
         , 
         1 
         / 
         30 
         / 
         14 
        
 
         Supplier Y, 
         50 
         - 
         9501 
         , 
         7009 
         ,$ 
         250.00 
         , 
         1 
         / 
         30 
         / 
         14 
        
 
         Supplier Y, 
         50 
         - 
         9505 
         , 
         6650 
         ,$ 
         125.00 
         , 
         2002 
         / 
         3 
         / 
         14 
        
 
         Supplier Y, 
         50 
         - 
         9505 
         , 
         6650 
         ,$ 
         125.00 
         , 
         2002 
         / 
         3 
         / 
         14 
        
 
         Supplier Z, 
         920 
         - 
         4803 
         , 
         3321 
         ,$ 
         615.00 
         , 
         2002 
         / 
         3 
         / 
         14 
        
 
         Supplier Z, 
         920 
         - 
         4804 
         , 
         3321 
         ,$ 
         615.00 
         , 
         2002 
         / 
         10 
         / 
         14 
        
 
         Supplier Z, 
         920 
         - 
         4805 
         , 
         3321 
         ,$ 
         615.00 
         , 
         2 
         / 
         17 
         / 
         14 
        
 
         Supplier Z, 
         920 
         - 
         4806 
         , 
         3321 
         ,$ 
         615.00 
         , 
         2 
         / 
         24 
         / 
         14 
        
 
     
 
   

（1）csv文件读写。

关于read_csv函数中的参数说明参考博客：http://www.zzvips.com/article/179603.html 。

 
    ? 
   
         import 
         pandas as pd 
        
         # 读写csv文件 
        
         df  
         = 
         pd.read_csv( 
         "supplier_data.csv" 
         ) 
        
         df.to_csv( 
         "supplier_data_write.csv" 
         ,index 
         = 
         None 
         )

（2）筛选特定的行。

 
    ? 
   
 
     
       
       
         #Supplier Nmae列中姓名包含'Z'，或者Cost列中的值大于600 
        
 
         print 
         (df[df[ 
         "Supplier Name" 
         ]. 
         str 
         .contains( 
         'Z' 
         )]) 
        
 
         print 
         (df[df[ 
         'Cost' 
         ]. 
         str 
         .strip( 
         '$' 
         ).astype( 
         float 
         ) >  
         600 
         ]) 
        
 
         print 
         (df.loc[(df[ 
         "Supplier Name" 
         ]. 
         str 
         .contains( 
         'Z' 
         ))|(df[ 
         'Cost' 
         ]. 
         str 
         .strip( 
         '$' 
         ).astype( 
         float 
         ) >  
         600.0 
         ),:]) 
        

            
        
 
         #行中的值属于某个集合 
        
 
         li  
         = 
         [ 
         2341 
         , 
         6650 
         ] 
        
 
         print 
         (df[df[ 
         'Part Number' 
         ].isin(li)]) 
        
 
         print 
         (df.loc[df[ 
         'Part Number' 
         ].astype( 
         int 
         ).isin(li),:]) 
        

            
        
 
         #行中的值匹配某个模式 
        
 
         print 
         (df[df[ 
         'Invoice Number' 
         ]. 
         str 
         .startswith( 
         "001-" 
         )]) 
        
 
     
 
   

（3）选取特定的列。

 
    ? 
   
         #选取特定的列 
        
         #列索引值,打印1，3列 
        
         print 
         (df.iloc[:, 
         1 
         : 
         4 
         : 
         2 
         ]) 
        
         #列标题打印 
        
         print 
         (df.loc[:,[ 
         "Invoice Number" 
         ,  
         "Part Number" 
         ]]) 
        
         #选取连续的行 
        
         print 
         (df.loc[ 
         1 
         : 
         4 
         ,:])

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：https://www.cnblogs.com/xiaobingqianrui/p/9996177.html 。

最后此篇关于pandas数据筛选和csv操作的实现方法的文章就讲到这里了,如果你想了解更多关于pandas数据筛选和csv操作的实现方法的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐：如何使用Python实现斐波那契数列

文章推荐： python中map()函数使用方法详解

文章推荐： JS删除数组里的某个元素方法

文章推荐：运用python去除图片水印

csv - 如何将 csv 文件读入数组并与另一个 csv 文件中的条目进行比较和替换？
我有两个 csv 文件 file1.csv 和 file2.csv。 file1.csv 包含 4 列。文件1: Header1,Header2,Header3,Header4 aaaaaaa,bb
csv - 如何测试 CSV 文件以及如何找出两个 CSV 文件之间的差异
我想知道是否有任何方法可以在导入数据库之前测试 CSV 文件？我有一个包含多列的巨大 CSV 文件，每列都有不同的数据类型和大小。如何测试生成的 CSV 文件中出现的数据是否与每列的大小一致？还有
csv - CSV 中的查找值和第二列的返回值
我正在从 SCOM 中提取服务器列表，并希望根据包含以下数据的 CSV 检查此列表: Computername,Collection Name Server01,NA - All DA Servers
csv - 如何使用 Super CSV 部分读取 CSV 文件
我有一个包含 24 列的 csv 文件。其中我只想阅读 3 列。我看到 super CSV 是一个非常强大的库，但我不知道如何部分读取 CSV。 partial reading上的链接坏了。请帮我举
csv - 如何将加特林日志文件导出到 csv
我正在尝试将加特林日志文件导出到 CSV，因为我需要更新 google 电子表格中的所有全局值，因为我的经理需要电子表格中的值。最佳答案此 CSV 文件被删除并替换为 JSON 文件，名为 glo
csv - csv 是结构化数据还是半结构化数据？
我对 csv 是结构化数据还是半结构化数据感到困惑。就像 RDBMS 是一个有关系的结构化数据，但 csv 没有关系。我无法找到确切的答案。最佳答案我可以说，具有恒定列和行(二维)的 CSV
csv - 使用 pipes-csv 从 csv 文件中读取第一行
我正在使用 pipes-csv 库读取一个 csv 文件。我想先读第一行，然后再读其余的。不幸的是，在 Pipes.Prelude.head 函数返回之后。管道正在以某种方式关闭。有没有办法先读取 c
csv - CSV 文件中空行的含义
起初这似乎很明显，但现在我不太确定。如果 CSV 文件具有以下行: a, 我会将其解释为具有值“a”和“”的两个字段。但是然后查看一个空行，我可以很容易地争辩说它表示一个值为“”的字段。我接受文件
csv - 将列表字典写入 csv
我正在尝试将列表字典写入 CSV 文件。我希望这些键是 CSV 文件的标题，以及与该键关联的列中的每个键关联的值。如果我的字典是: {'600': [321.4, 123.5, 564.1, 764
csv - 将数组导出为 CSV
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 10 年前。 Improve thi
csv - CSV 文件可以有注释吗？
是否有任何官方方法允许 CSV 格式的文件允许评论，无论是在其自己的行上还是在行尾？我尝试检查wikipedia关于此以及RFC 4180但两者都没有提到任何让我相信它不是文件格式的一部分的内容，所
csv - 如何从字符串中读取 CSV？
我有一些 csv 格式的数据。然而它们已经是一个字符串，因为我是从 HTTP 请求中获取它们的。我想使用数据框来查看数据。但是我不知道如何解析它，因为 CSV 包只接受文件，而不接受字符串。一种解决
csv - CSV 文件中的值列表应该使用哪个分隔符？
我有一个 CSV 文件，其中包含一些字段的值列表。它们作为 HTML“ul”元素存储在数据库中，但我想将它们转换为对电子表格更友好的东西。我应该使用什么作为分隔符？我可以使用转义的逗号、竖线、分号或
csv - 如何使用管道分隔符导出到 .csv
我使用 Google 表格(电子表格)来合并我的 Gambio 商店的不同来源的文章数据。要导入数据，我需要在 .csv 文件中使用管道符号作为分隔符/分隔符，并使用 "作为文本分隔符。在用于导出为
csv - 报表生成器导出到带有列标题空间的 CSV
这是一个奇怪的请求，因为我们都知道数据库头不应该包含空格。但是，我正在使用的系统需要在其标题中使用空格才能导入。我创建了一个 Report Builder 报告，它将数据构建到一个表中，并在我运行
csv - 当其中一个值可能在字符串中包含逗号时处理 .CSV
我有一个 .csv 文件，我需要将其转换为 coldfusion 查询。我使用了 cflib.org CSVtoQuery 方法，它工作正常......但是...... 如果 csv 中的“单元格”在
csv - 文化独立 CSV
我想知道是否有任何方法可以生成文化中性 CSV 文件，或者至少指定文件中存在的特定列的数据格式。例如，我生成了包含带小数点分隔符 (.) 的数字的 CSV 文件，然后将其传递给小数点分隔符为 (,
Javascript:如果 CSV 中没有，则将值添加到 CSV - 如果已经在 CSV 中 - 从 CSV 中删除
我正在构建一个 CSV 字符串 - 因此用户单击 div 的所有内容 - 5 个字符的字符串都会传递到隐藏字段中 - 我想做的是附加每个新值并创建一个 CSV 字符串 - 完成后- 在文本框中显示 -
Linux CSV - 将 CSV 文件中的列添加到另一个 CSV 文件
我正在努力从另外两个文件创建一个 CSV 文件这是我需要的我想要的文件(很多其他行) “AB”；“A”；“B”；“C”；“D”；“E” 我拥有的文件: 文件 1:"A";"B";"C";"D";"
csv - 将包含带引号的值的表导出到配置单元中的本地 csv
我正在尝试将表导出到配置单元中的本地 csv 文件。 INSERT OVERWRITE LOCAL DIRECTORY '/home/sofia/temp.csv' ROW FORMAT DELIMI

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

pandas数据筛选和csv操作的实现方法