- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 Glue Job 上遇到了一些令人沮丧的问题。
我有一个从爬虫创建的表格。它通过了一些 CSV 数据并创建了一个模式。模式的某些元素需要修改,例如数字到字符串并应用标题。
我似乎在这里遇到了一些问题 - 某些字段的架构似乎已被拾取为 double 。当我尝试将其转换为我需要的字符串时,它包含一些空精度,例如1234 --> 1234.0.
我的映射代码是这样的:
applymapping1 = ApplyMapping.apply(
frame = datasource0,
mappings = [
("col1","double","first_column_name","string"),
("col2","double","second_column_name","string")
],
transformation_ctx = "applymapping1"
)
我爬取数据后得到的结果表是这样的:
first_column_name second_column_name
1234.0 4321.0
5678.0 8765.0
相对于
first_column_name second_column_name
1234 4321
5678 8765
有解决这个问题的好方法吗?我尝试将最初由爬虫创建的表中的架构更改为 bigint 而不是 double ,但是当我将映射代码更新为 ("col1","bigint","first_column_name","string") 表最终为空。
最佳答案
只需对 botchniaque 答案进行一点更正,您实际上必须同时执行 ResolveChoice 和 ApplyMapping 以确保正确的类型转换。
ResolveChoice 将确保您的列中只有一种类型。如果您不执行此步骤并且歧义未解决,该列将变成一个结构,Redshift 最终会将其显示为 null。
因此应用 ResolveChoice 以确保您所有的数据都是一种类型(int,for ie)
df2 = ResolveChoice.apply(datasource0, specs = [("col1", "cast:int"), ("col2", "cast:int")])
最后,使用 ApplyMapping 改变你想要的类型
df3 = ApplyMapping.apply(
frame = df2,
mappings = [
("col1","int","first_column_name","string"),
("col2","int","second_column_name","string")
],
transformation_ctx = "applymapping1")
希望这有帮助(:
关于amazon-web-services - AWS Glue ApplyMapping 从 double 到字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50945573/
1.apply() 当想让方程作用在一维的向量上时,可以使用apply来完成,如下所示 ?
我正在尝试对我的数据集使用 applymap 以将浮点数创建为整数。但是我收到“'Series' 对象没有属性'applymap'”错误。 import pandas as pd import mat
我有一个数据帧,我希望在其中使用第一个即将到来的行来回填所有 NaN 值。我现在的代码是这样的: df[df.applymap(np.isfinite).all(1)] 当我将数据帧减少到 7 列或更
我有 2 个数据框 >>> x 0 1 2 3 0 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 >>> y 0 1
我正在使用 df.to_excel()将数据从 pandas 数据框输出到 Excel。为了提高可读性,我使用 df.style.applymap()根据内容更改单元格的颜色。 想象一下,我有一个如下
我刚刚使用 pandas read_excel 将两个 excel 表加载到 2 个数据帧中。 是否可以使用基于行和列索引的数据框 B 的单元格数据在数据框 A 的单元格上应用映射? 下面是一个例子:
如果我想使用 pandas 更改数据框中的变量名称,我可以不使用 pandas.df.rename() 函数而是使用 applymap() 来更改名称吗例如 Registrar Enrolment
这个问题在这里已经有了答案: How to use Pandas stylers for coloring an entire row based on a given column? (3 个答案
我想在下面的数据集中使用带有一点复杂函数的 applymap 方法。 value1 value2 value3 value4 value5 people 147 119 69
我想做一个简单的操作,将数据框转换为标题。 有一些 NaN 会导致错误,所以我想通过仅在 not null 时应用 str.title() 来避免它们。 但是我收到了无效语法。 df= df.appl
我想尝试 Pandas DataFrame 对象的 applymap 方法的功能。这是用例: 假设我的 DataFrame df1 如下: Age ID Name 0 27 10
我正在尝试比较一个字符串列表的相似性,并在 pandas 数据框中获取结果以供检查;所以我使用一个列表作为索引,另一个作为列列表。然后我想计算它们的“Levenshtein 相似度”(一个比较两个词之
基础 以下操作基于python 3.6 windows 10 环境下 通过 将通过实例来演示三者的区别 toward_dict = {1: '东', 2: '南', 3: '西', 4:
我在数据框上应用了两个函数 res = df.apply(lambda x:pd.Series(list(x))) res = res.applymap(lambda x: x.strip('"')
我有一个 pandas 数据框,我正在使用自定义函数在所有元素上使用 applymap 清理数据,并将清理后的值存储在单独的列中。 tag0 tag1
我有一个分层数据集: df = pd.DataFrame(np.random.rand(6,6), columns=[['A','A','A','B','B','B'],
解决以下 Pandas 问题的最有效方法是什么? 这是一个简化的示例,其中包含数据框中的一些数据: import pandas as pd import numpy as np df = pd.Dat
我是 Pandas 新手。我编写了一个函数,我想将其应用于 pandas DataFrame“Monthly_mean_consump”中的所有条目,下面提供了数据示例。 Time 2010-0
假设我有一个 DataFrame: df = pd.DataFrame({'DATE_1':['2010-11-06', '2010-10-07', '2010-09-07', '2010-05-07
我有一个“年龄”列,但有时会显示 NaN 值。我知道我可以为此目的使用“fillna”,但我尝试定义自己的函数(并学习这样做)并将 applymap 用于数据框 到目前为止没有成功。 Age 69 4
我是一名优秀的程序员,十分优秀!