python - 每个转换器以浮点形式读取数据-6ren

python - 每个转换器以浮点形式读取数据

转载作者：太空宇宙更新时间：2023-11-03 17:59:24

24

4

我有一个名为“文件名”的 csv 文件，想要以 64float 的形式读取这些数据，但“小时”列除外。我使用 pd.read_csv - 函数和转换器来管理它。

df = pd.read_csv("../data/filename.csv",
                 delimiter = ';',
                 date_parser = ['hour'],
                 skiprows = 1,
                 converters={'column1': lambda x: float(x.replace   ('.','').replace(',','.'))})

现在，我有两点:

第一:

分隔符与 ; 一起使用。，但是如果我在记事本中查看我的数据，有“，”，而不是“;”。但如果我采用 ',' 我得到: 'pandas.parser.CParserError: 标记数据时出错。 C 错误:第 13 行应有 7 个字段，但看到了 9'

第二:

如果我想对所有列使用转换器，我怎样才能得到这个？!什么是正确的术语？我尝试在读取函数中使用 dtype = float，但出现“AttributeError: 'NoneType' object has no attribute 'dtype'” 发生了什么？这就是为什么我想用转换器来管理它的原因。

数据:

,hour,PV,Wind onshore,Wind offshore,PV.1,Wind onshore.1,Wind offshore.1,PV.2,Wind onshore.2,Wind offshore.2 0,1,0.0,"12,985.0","9,614.0",0.0,"32,825.5","9,495.7",0.0,"13,110.3","10,855.5" 1,2,0.0,"12,908.9","9,290.8",0.0,"36,052.3","9,589.1",0.0,"13,670.2","10,828.6" 2,3,0.0,"12,740.9","8,886.9",0.0,"38,540.9","10,087.3",0.0,"14,610.8","10,828.6" 3,4,0.0,"12,485.3","8,644.5",0.0,"40,734.0","10,087.3",0.0,"15,638.3","10,343.7" 4,5,0.0,"11,188.5","8,079.0",0.0,"42,688.0","10,087.3",0.0,"16,809.4","10,343.7" 5,6,0.0,"11,219.0","7,594.2",0.0,"43,333.5","10,025.0",0.0,"18,266.9","10,343.7"

最佳答案

这应该有效:

In [40]:
# text data
temp=''',hour,PV,Wind onshore,Wind offshore,PV.1,Wind onshore.1,Wind offshore.1,PV.2,Wind onshore.2,Wind offshore.2
0,1,0.0,"12,985.0","9,614.0",0.0,"32,825.5","9,495.7",0.0,"13,110.3","10,855.5"
1,2,0.0,"12,908.9","9,290.8",0.0,"36,052.3","9,589.1",0.0,"13,670.2","10,828.6"
2,3,0.0,"12,740.9","8,886.9",0.0,"38,540.9","10,087.3",0.0,"14,610.8","10,828.6"
3,4,0.0,"12,485.3","8,644.5",0.0,"40,734.0","10,087.3",0.0,"15,638.3","10,343.7"
4,5,0.0,"11,188.5","8,079.0",0.0,"42,688.0","10,087.3",0.0,"16,809.4","10,343.7"
5,6,0.0,"11,219.0","7,594.2",0.0,"43,333.5","10,025.0",0.0,"18,266.9","10,343.7"'''
# so read the csv, pass params quotechar and the thousands character
df = pd.read_csv(io.StringIO(temp), quotechar='"', thousands=',')
df
Out[40]:
   Unnamed: 0  hour  PV  Wind onshore  Wind offshore  PV.1  Wind onshore.1  \
0           0     1   0       12985.0         9614.0     0         32825.5   
1           1     2   0       12908.9         9290.8     0         36052.3   
2           2     3   0       12740.9         8886.9     0         38540.9   
3           3     4   0       12485.3         8644.5     0         40734.0   
4           4     5   0       11188.5         8079.0     0         42688.0   
5           5     6   0       11219.0         7594.2     0         43333.5   

   Wind offshore.1  PV.2  Wind onshore.2  Wind offshore.2  
0           9495.7     0         13110.3          10855.5  
1           9589.1     0         13670.2          10828.6  
2          10087.3     0         14610.8          10828.6  
3          10087.3     0         15638.3          10343.7  
4          10087.3     0         16809.4          10343.7  
5          10025.0     0         18266.9          10343.7  
In [41]:
# check the dtypes
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 6 entries, 0 to 5
Data columns (total 11 columns):
Unnamed: 0         6 non-null int64
hour               6 non-null int64
PV                 6 non-null float64
Wind onshore       6 non-null float64
Wind offshore      6 non-null float64
PV.1               6 non-null float64
Wind onshore.1     6 non-null float64
Wind offshore.1    6 non-null float64
PV.2               6 non-null float64
Wind onshore.2     6 non-null float64
Wind offshore.2    6 non-null float64
dtypes: float64(9), int64(2)
memory usage: 576.0 bytes

所以基本上你需要将 quotechar='"' 和 thousands=',' 参数传递给 read_csv 来实现你想要的，请参阅文档:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html#pandas.read_csv

编辑

如果您想在导入后进行转换(当您可以预先完成时，这是一种浪费)，那么您可以对每个感兴趣的列执行此操作:

In [43]:
# replace the comma separator
df['Wind onshore'] = df['Wind onshore'].str.replace(',','')
# convert the type
df['Wind onshore'] = df['Wind onshore'].astype(np.float64)
df['Wind onshore'].dtype
Out[43]:
dtype('float64')

首先替换所有感兴趣列上的逗号分隔符，然后像这样调用 convert_objects 会更快:df.convert_objects(convert_numeric=True)

关于python - 每个转换器以浮点形式读取数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27982526/

24

4

0

文章推荐： c# - System.IO.File 和 System.IO.FileInfo 有什么区别

文章推荐： javascript - 只检测伪元素的点击事件

文章推荐： c# - 将 SQL Server Express 2008 降级到 SQL Server Express 2005？

python 形式
这是一个新手理论问题 - 我刚刚开始使用 Python 并研究 Django 和 orm。问题:如果我开发我的对象并通过额外的开发修改基础对象结构、继承等 - Django 的 ORM 解决方案会自动
Javascript 形式 - 根据选择不同的电子邮件
我正在使用带有服务器端处理器的 JavaScript 表单，并且我希望能够让表单根据下拉列表转到不同的电子邮件。我已经根据其他表格尽了最大努力，但似乎无法通过电子邮件。我已在电子邮件地址的选项标签下添
Haskell Monadic 形式
一个简单的问题:给定定义，(来自 Haskell SOE) do x — el; el\ ...; en => el »= \x — do e2\ ...; en 和: do let d
Angular react 形式
我是 Angular 5 的新手。我目前正在研究 Angular Reactive 表单。我有一个下面的 JSON 结构，我需要在从 FORM 获取值后发回 REST API。 JSON 结构: {
Angular react 形式
我是 Angular 5 的新手。我目前正在研究 Angular Reactive 表单。我有一个下面的 JSON 结构，我需要在从 FORM 获取值后发回 REST API。 JSON 结构: {
Haskell - 形式 A -> A -> ... -> A 的所有函数
我有一个类型(称之为 A)，我想创建一个 A -> A、A -> A -> A、A -> A -> A -> ... 等类型的函数的类型类.这不起作用: {-# LANGUAGE FlexibleIn
Java线程正在重复 Swing 形式
我正在使用 java 线程同时管理多个 (3) 程序。1 用于 Java swing 表单(绘制 UI 以进行输入)，1 用于在系统托盘上设置图标(从 UI 获取输入后立即启动)，1 用于处理输入并将
css - 形式:垂直居中
在当前的元素中，我在表单中遇到了一个问题。表单中标签的字体大小可能大于默认值。如果我把它举起来，那么右边的输入必须垂直居中。我查看了 Bootstrap 和 Foundation，但都没有解决这个问
html - 组元素？形式
为了好玩，我使用了一段从 friend 那里得到的代码，并尝试创建一个包含用户名和密码的登录字段，但我很难获得单词旁边的字段。 username 这个词和你输入的框之间有很大的差距。密码也是如此。这
Angular 形式 - 访问模板中的嵌套控件
我的表单中有一个嵌套的控制组，我想访问它们的表单状态值(如原始和有效)以动态显示验证错误。是这样动态构建的 controlMap['password'] = this.password; contr
Angular 重置 react 形式
发送后我试图重置我的表单，但只有值设置为空。 component.html {{note.value?.length || 0}}/10
php - 将输入添加到 Stripe 形式
我正在尝试自定义 Stripe 结帐表单，但我不知道如何添加输入。我想添加“电话号码”和“姓名”以创建费用和客户。你知道我该怎么做吗？这是我应该自定义的代码。最佳答案您将无法使用
html - 带表格的 Angular 形式
所以我有这个需求，我想以表格的形式提交一个由五个记录组成的表单。这就是它的样子表: 这是对应的代码: Section Q.No Question
Angular react 形式 - 在模糊时验证但在键入时更新模型
我有一个使用 react 形式和输入文本的情况。我需要: 当用户输入时，根据输入的内容建议一个列表(我使用的是 ngx bootstrap typeahead)；仅当用户失去输入焦点时才验证输入字
Angular 强类型 react 形式
我希望重构我的 Angular 项目中的大量组件，以具有强类型的 FormGroups、FormArrays 和 FormControls。我只是在寻找一种实现强类型 react 形式的好方法。任何
php - 如何更改错误类(yii2 形式)
我有事件表格: 'horizontal', 'fieldConfig' => [ 'template' => "{input}\n{hint}\n{error}",
angular - 在新选项选择错误时使用多项选择的 react 形式
是否有关于如何实现多选和响应式表单的示例？我正在尝试在 multiselect-dropdown 上设置所选项目(从数据库中检索)，它会更新显示的项目( View )，但会引发以下错误: core.
javascript - 按钮打破 react 形式
我想在表单中添加按钮以动态添加输入。但是我发现，如果我在表单中添加了一个仅记录到控制台的按钮(并且当我尝试添加输入时)，它将记录日志，然后表单中断。我的Electron应用程序的前端窗口崩溃(不退出但
javascript - 具有隔离范围的指令内的 Angular 形式
我有一个这样的表格此表单位于指令内: angular.module('crowdcoreApp').directive('investorForm',function(){
javascript - 对话框中的 Angular 形式
我在 angularjs Controller 中调用的 $mdDialog 中有一个表单，如下所示: actions-controller.js function callForm() {

首页

博学

6Ren·AI

商城

python - 每个转换器以浮点形式读取数据