- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
有一个相对较大的包含数据的 CSV 文件(大约 80Mb)。当我在 MS Excel 中打开它时,我看到它包含 100 列和许多行数据。但是,第一行不是列名,而是一个 Web 链接。此外,最后两行是一些评论。所以,现在我想将这些数据加载到 pandas DataFrame 中:
import pandas as pd
df = pd.read_csv('myfile.csv')
然后我想读取一个名为 Duration
的列(我看到它存在于 CSV 文件中)并从它的值中删除一个单词 years
:
Duration = map(lambda x: float(x.rstrip('years')), df['Duration'])
它给我这个错误:
AttributeError: 'float' object has no attribute 'rstrip'
如果我在 MS Excel 中打开文件并删除第一行(网络链接)和最后两行(注释),那么代码就可以工作了!
那么,如何在 Python 中自动清理此 CSV 文件(以仅提取具有值的列)?
更新:当我编写 print df.head()
时,它输出:
have mixed types. Specify dtype option on import or set low_memory=False.
我是否需要为所有 100 列指定类型?如果我不知道先验类型怎么办。
更新:我无法附加文件,但作为示例,您可以检查 this one .下载文件 2015-2016。
最佳答案
您应该使用 pd.read_csv() 中的一些参数:
df = pdread_csv('myfile.csv', skiprows=1, skip_footer=2)
我查看了您在评论中提供的链接并尝试导入它。我看到了两种混合数据类型(id
和 desc
),所以我明确地为这两列设置了 dtype。此外,通过观察,页脚包含“总计”,因此我排除了以字母 T
开头的任何行。除标题外,有效行应以 id
列的整数开头。如果引入了其他不以 T
开头的页脚,这将在读取时抛出错误。
如果您先下载并解压zip
文件,您可以进行如下操作:
file_loc = ... # Specify location where you saved the unzipped file.
df = pd.read_csv(file_loc, skiprows=1, skip_blank_lines=True,
dtype={'id': int, 'desc': str}, comment='T')
这将从 emp_length
列中删除 year
或 years
,尽管您仍然保留文本类别。
df['emp_length'] = df.emp_length.str.replace(r'( years|year)', '')
关于python - 如何从 CSV 文件中删除一些带有注释的行以将数据加载到 DataFrame?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32677603/
所以`MKAnnotation's。有趣的东西。 我的问题: 注释的标题和副标题有什么区别?这对注释的视觉组件有何影响? MKPinAnnotationView 和 MKAnnotationView
我正在使用 JBoss 工具将 DB 模式反向工程到 POJO 中。具体来说,我在 hibernatetool ANT 任务中使用了 hbm2java 选项。在 hbm2java 选项下,您可以指定
假设我有这段文字: cat file /* comment */ not a comment /* another comment */ /* delete this * /* multiline
我明白,如果你///在类、字段、方法或属性上方 Visual Studio 将开始为您建立 XML 样式的注释。 但是,我在哪里可以为我的命名空间和/或库添加 XML 注释... 例如: .NET F
int API_VERSION = 21; @TargetApi(API_VERSION)在Android中用于指定该方法/类支持API_VERSION及以下。 我们是否可以镜像类似的东西,指定仅支持
Closed. This question needs to be more focused。它当前不接受答案。
假设我有一个界面如下。 public interface MyInterface{ /** * This method prints hello */ void sayHello();
我已将 Jboss 应用程序迁移到 WebSphere Liberty。我必须删除所有 Jboss 引用库。在这样做的同时,我在某些注释中面临问题。 Jboss 应用程序使用 @SecurityDom
在本教程中,您将了解 JavaScript 注释,为什么要使用它们以及在示例的帮助下如何使用它们。 JavaScript 注释是程序员可以添加的提示,以使代码更易于阅读和理解。JavaScri
我正在建立一个博客,为了发表评论,我有这个 CSS。 #comments { position:absolute; border: 1px solid #900; border-width: 1
我正在尝试在单元格中插入评论。我正在尝试按照代码进行评论,但它没有在创建的 excel 中显示评论。我正在创建 .xls 扩展名。 $objPHPExcel->getActiveSheet()->ge
我正在使用 TS 在 MarionetteJS 上编写项目,我想使用注释来注册路由。例如: @Controller class SomeController { @RouteMapping("so
我有一个应用程序可以在页面上生成大量注释。用户可以单击页面上的任意位置以创建快速注释(例如 Acrobat Pro)可以在一般 中使用一些 javascript 行添加和删除这些注释
是否有 JavaScript 注释? 当然 JavaScript 没有它们,但是是否有额外的库或建议的语言扩展,例如 @type {folder.otherjsmodule.foo} function
Java 中注解的目的是什么?我有一个模糊的想法,认为它们介于注释和实际代码之间。它们在运行时会影响程序吗? 它们的典型用法是什么? 它们是 Java 独有的吗?有 C++ 等价物吗? 最佳答案 注解
其实我们在 Ruby 基础语法 已经比较详细的介绍了 Ruby 语言中的注释 Ruby 解释器会忽略注释语句 注释会对 Ruby 解释器隐藏一行,或者一行的一部分,或者若干行。 Ruby 中的注
我正在 try catch VBA 注释。到目前为止,我有以下内容 '[^";]+\Z 它捕获以单引号开头但在字符串结尾之前不包含任何双引号的任何内容。即它不会匹配双引号字符串中的单引号。 dim s
有没有办法在'svn commit'上将提交注释添加到更改的文件中。有人告诉我有一种方法可以用 cvs 做到这一点,但我们使用 svn。目前,我们使用“$Revision”关键字将修订号添加到更改的文
我正在尝试通过 ManyToMany 注释自动对报告的结果进行排序 @OrderBy : /** * @ORM\ManyToMany(targetEntity="Artist", inversedB
我正在使用 JBoss 5 GA,我创建了一个测试 session bean 和本地接口(interface)。我创建了一个 servlet 客户端。我尝试使用 @EJB 将接口(interface)
我是一名优秀的程序员,十分优秀!