- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想从一个非常奇怪的字符串中解析出一个 ISIN,我的代码如下所示:
> df <- fread("C:/Users/WZHPCH/Desktop/Error Messages/df.csv", sep=";", stringsAsFactors=FALSE)
> dput(df)
structure(list(ID = c(1L, 2L, 4L, 2L, 3L, 24L), VAL = c("TES+XS0255015603+ae2s",
"TEST*XS0255015603+d2aasd", "safd*adf*XS0255015603++", "gasdfs*dsa*US0917971006",
"asdfsUS0917971006adf", "sd-asd-afds-US0917971006")), .Names = c("ID",
"VAL"), row.names = c(NA, -6L), class = c("data.table", "data.frame"
), .internal.selfref = <pointer: 0x0000000000110788>)
> df$parsedISIN <- gsub("^[a-zA-Z]{2}[0-9]{10}$", '\\1', df$VAL)
最佳答案
这里有几个问题:
1) 即使问题使用了 dput
该对象中有一个指针,因此它不能在其他系统上使用。我已经编辑了要给出的指针:
df <-
structure(list(ID = c(1L, 2L, 4L, 2L, 3L, 24L), VAL = c("TES+XS0255015603+ae2s",
"TEST*XS0255015603+d2aasd", "safd*adf*XS0255015603++", "gasdfs*dsa*US0917971006",
"asdfsUS0917971006adf", "sd-asd-afds-US0917971006")), .Names = c("ID",
"VAL"), row.names = c(NA, -6L), class = c("data.table", "data.frame"))
df.gem$Attributes
.应该是
df$VAL
.
gsub
应该是
sub
因为每个组件中只出现一次。
pat <- ".*([a-zA-Z]{2}[0-9]{10}).*"
sub(pat, "\\1", df$VAL)
[1] "XS0255015603" "XS0255015603" "XS0255015603" "US0917971006" "US0917971006"
[6] "US0917971006"
pat
:
.*([a-zA-Z]{2}[0-9]{10}).*
strapplyc
在
gsubfn直接提取模式。在这种情况下,正则表达式稍微简化:
library(gsubfn)
strapplyc(df$VAL, "[a-zA-Z]{2}[0-9]{10}", simplify = TRUE)
[a-zA-Z]{2}[0-9]{10}
关于regex - 从字符串中解析出 ISIN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28170820/
我正在使用 Pandas 和 Python 导入一个 CSV,并对导入的数据框中的数据进行操作,以便创建一个新列。 新列中的每一行都是基于 A 列和 B 列的每个对应行中的值生成的。数据框中有更多包含
我的数据框是这样的: userid codeassigned timestamp 15 553938
我想从一个非常奇怪的字符串中解析出一个 ISIN,我的代码如下所示: > df dput(df) structure(list(ID = c(1L, 2L, 4L, 2L, 3L, 24L), VA
我对 isin() 函数准确性有一些问题。 我的 DataFrame 中有 abc 许多 ID: df = DataFrame[DataFrame['id'].isin(IDs)] 但是结果: pri
我有一本字典,我想使用该字典对 df 中的新列进行分类。 df 中的 Value 列应该与字典中的值进行比较。 df 中的新列应该是与值关联的键。 d = {'Car':['1','2','3'],
我正在尝试检查另一个数据框中是否存在行。我没有加入/合并,因为它会产生重复,然后需要过滤掉重复可能也会过滤掉我想要保留的实际重复。 示例: table1 = pd.DataFrame({'a':[1,
我正在尝试使用 Java 中的列表来过滤 Spark DataFrame。 java.util.List selected = ....; DataFrame result = df.filter(d
我有两个数据框。 Dataframe A 有一列由 list ids(命名项)值组成。数据框 B 有一列 int id 值(命名为 id)。 数据框 A: date | items
我正在尝试将 .isin 与 ~ 一起使用,这样我就可以根据 2 个数据集中的多列获取唯一行的列表。 所以,我有 2 个 9 行的数据集:df1 是底部,df2 是顶部(抱歉,但我无法让它在下面同时显
d = {'Dates':[pd.Timestamp('2013-01-02'), pd.Timestamp('2013-01-03'), pd
isin() 给我奇怪的结果。我创建了以下 DataFrame: import pandas as pd import numpy as np test=pd.DataFrame({'1': np.l
我有一个非常简单的场景,我想测试二维数组的两个元素是否(单独)是更大数组的成员 - 例如: full_array = np.array(['A','B','C','D','E','F']) sub_a
我可以帮助您使用 ISIN pandas 函数。基本上,我需要根据不同的标准按年汇总数据框中的数据。问题是我需要对数据进行许多聚合(例如国家名称、资助计划等)。为了方便起见,我试图在 for 循环中执
这是我的模型: type: { type: Sequelize.STRING, defaultValue: 'text', allowNull: fal
我有两个数组: a = np.array([[1, 2], [3, 4], [5, 6]]) b = np.array([[1, 1, 1, 3, 3], [1, 2, 4
这是一个例子 创建一个包含 100M 相同行的表: >>> df = pd.DataFrame([('20170101', 'TULIP', 'FLOWER')] * 100000000, colum
这个问题已经有答案了: check for identical rows in different numpy arrays (7 个回答) 已关闭 2 年前。 我有两个数组: A = np.arra
假设我有以下两个数据框: df = pd.DataFrame({'col1':['a','b', 'c'], 'col2': ['q', 'w', 'e']}) df1 = pd.DataFrame(
这个问题已经有答案了: check for identical rows in different numpy arrays (7 个回答) 已关闭 2 年前。 我有两个数组: A = np.arra
假设我有以下两个数据框: df = pd.DataFrame({'col1':['a','b', 'c'], 'col2': ['q', 'w', 'e']}) df1 = pd.DataFrame(
我是一名优秀的程序员,十分优秀!