- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
R 初学者似乎是一个非常简单的问题:我有许多电子邮件日志,我已将其读入 R 格式:
>log1
Date Time From To
1 2000-01-01 00:00:00 bob@mail.com test1@mail.com
2 2000-01-02 01:00:00 carolyn @mail.com test2@mail.com
3 2000-01-03 02:00:00 chris@mail.com test3@mail.com
4 2000-01-04 03:00:00 chris @mail.com test4@mail.com
5 2000-01-05 04:00:00 alan@mail.com test5@mail.com
6 2000-01-06 05:00:00 alan.@mail.com test6@mail.com
我需要将 log1$From 和 log1$To 更改为全局唯一数字标识符,这样当我稍后读取其他日志时,任何给定的电子邮件地址都会收到与以前日志相同的标识符。
我试过:
id <- as.numeric(as.character(log1[,3])))
id<-as.numeric(levels(log1[,3])))
id <- charToRaw(log1[,4]), base=16)
请哪位好心人帮帮我——谢谢!
道歉应该包括这个:
Date=c( "01/01/2000" ,"02/01/2000" ,"03/01/2000", "04/01/2000" ,"05/01/2000" ,"06/01/2000","07/01/2000","08/01/2000",
"09/01/2000","10/01/2000","11/01/2000", "12/01/2000" ,"13/01/2000", "14/01/2000", "15/01/2000","16/01/2000"
,"17/01/2000","18/01/2000","19/01/2000","20/01/2000","01/01/2000","02/01/2000")
Time=c("00:00:00","01:00:00","02:00:00", "03:00:00" ,"04:00:00" ,"05:00:00", "06:00:00" ,"07:00:00", "08:00:00", "09:00:00" ,"10:00:00",
"11:00:00", "12:00:00","13:00:00", "14:00:00","15:00:00","16:00:00","17:00:00","18:00:00","19:00:00","00:00:00" ,"00:00:00")
From=c("bob.shults@mail.com","carolyn.green@mail.com","chris.long@mail.com","christi.nicolay@mail.com","alan.aronowitz@mail.com","alan.comnes@mail.com",
"dab@sprintmail.com","ana.correa@mail.com","andrew.fastow@mail.com","elena.kapralova@mail.com","bob.shults@mail.com","carolyn.green@mail.com",
"chris.long@mail.com","christi.nicolay@mail.com","alan.aronowitz@mail.com","alan.comnes@mail.com","dab@sprintmail.com","ana.correa@mail.com",
"andrew.fastow@mail.com","elena.kapralova@mail.com","bob.shults@mail.com","bob.shults@mail.com")
To=c("ana.correa@mail.com","test2@mail.com","test3@mail.com","test4@mail.com","test5@mail.com","test6@mail.com","test7@mail.com",
"test8@mail.com","test9@mail.com","test10@mail.com","test11@mail.com","test12@mail.com","test13@mail.com","test14@mail.com",
"test15@mail.com","test16@mail.com","test17@mail.com","test18@mail.com","test19@mail.com","test20@mail.com","ana.correa@mail.com","ana.correa@mail.com")
log<-data.frame(Date=Date,Time=Time,From=From,To=To)
尝试使用 MD5 生成全局唯一标识符:注意 ana.correa@mail.com 的标识符如何在 ID_to 中正确匹配但不在 ID_from 中
ID_to<-data.frame()
ID_from<-data.frame()
for (i in 1:nrow(log)){
to<-as.numeric(paste('0x', substr(rep(hmac('secret',log[i,4], algo='md5'), 2), c(1, 9, 17, 25), c(8, 16, 24, 32)),sep=""))
(ID_to<-rbind(ID_to,to))
from<-as.numeric(paste('0x', substr(rep(hmac('secret',log[i,3], algo='md5'), 2), c(1, 9, 17, 25),c(8, 16, 24, 32)),sep=""))
(ID_from<-rbind(ID_from,from))
}
ID_to[,3]<-paste(ID_to[,1],ID_to[,2], sep="")
ID_from[,3]<-paste(ID_from[,1],ID_from[,2], sep="")
edgelist<-data.frame(ID_from[,3],log[,3],ID_to[,3],log[,4],log[,1],log[,2])
print(edgelist)
ID_from...3. log...3. ID_to...3. log...4. log...1. log...2.
27488842661591306920 bob.shults@mail.com 18727221862165338513 ana.correa@mail.com 01/01/2000 00:00:00
38124472891255273775 carolyn.green@mail.com 1251903296725454474 test2@mail.com 02/01/2000 01:00:00
29070047663451376630 chris.long@mail.com 17074276751156451031 test3@mail.com 03/01/2000 02:00:00
8261398433828474582 christi.nicolay@mail.com 1563683670909194033 test4@mail.com 04/01/2000 03:00:00
18727221862165338513 alan.aronowitz@mail.com 26735368323826533112 test5@mail.com 05/01/2000 04:00:00
5680838251168988404 alan.comnes@mail.com 2923605896229594830 test6@mail.com 06/01/2000 05:00:00
2351312285811012730 dab@sprintmail.com 17171333544033270402 test7@mail.com 07/01/2000 06:00:00
328278708432069254 ana.correa@mail.com 33840664403556851587 test8@mail.com 08/01/2000 07:00:00
1127901879852039037 andrew.fastow@mail.com 1973548136161209824 test9@mail.com 09/01/2000 08:00:00
7349515121496417787 elena.kapralova@mail.com 5680838251168988404 test10@mail.com 10/01/2000 09:00:00
27488842661591306920 bob.shults@mail.com 328278708432069254 test11@mail.com 11/01/2000 10:00:00
38124472891255273775 carolyn.green@mail.com 1127901879852039037 test12@mail.com 12/01/2000 11:00:00
29070047663451376630 chris.long@mail.com 27488842661591306920 test13@mail.com 13/01/2000 12:00:00
8261398433828474582 christi.nicolay@mail.com 38124472891255273775 test14@mail.com 14/01/2000 13:00:00
18727221862165338513 alan.aronowitz@mail.com 29070047663451376630 test15@mail.com 15/01/2000 14:00:00
5680838251168988404 alan.comnes@mail.com 8261398433828474582 test16@mail.com 16/01/2000 15:00:00
2351312285811012730 dab@sprintmail.com 2351312285811012730 test17@mail.com 17/01/2000 16:00:00
328278708432069254 ana.correa@mail.com 7349515121496417787 test18@mail.com 18/01/2000 17:00:00
1127901879852039037 andrew.fastow@mail.com 41762759923562968495 test19@mail.com 19/01/2000 18:00:00
7349515121496417787 elena.kapralova@mail.com 24894056753582090007 test20@mail.com 20/01/2000 19:00:00
27488842661591306920 bob.shults@mail.com 18727221862165338513 ana.correa@mail.com 01/01/2000 00:00:00
27488842661591306920 bob.shults@mail.com 18727221862165338513 ana.correa@mail.com 02/01/2000 00:00:00
尝试水平/因素方法:
出现错误:
log <- union(levels(log[,3]), levels(log[,4]))
>Error in emails[, 3] : incorrect number of dimensions
最佳答案
您可以使用 MD5 生成全局唯一标识符,因为它的冲突概率非常低,但是由于它的输出是 128 位的,您需要一些数字来表示它(32 位 R 中的四个整数,32 位 R 中的两个整数) 64 位 R)。不过,使用短数值向量应该很容易处理。
以下是如何为电子邮件地址(或与此相关的任何其他字符串)生成这样一个包含四个整数的向量:
library(digest)
email <- 'test1@gmail'
as.numeric(paste('0x', substr(rep(hmac('secret56f8a7', email, algo='md5'), 4), c(1, 9, 17, 25), c(8, 16, 24, 32)), sep=''))
您可以使用 algo='crc32'
并只获得一个整数,但不推荐这样做,因为 CRC 更容易发生冲突。
关于R:将电子邮件地址转换为唯一整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9759360/
我正在尝试学习 Fortran,并且看到了很多不同的定义,我想知道他们是否正在尝试完成同样的事情。以下有什么区别? 整数*4 整数(4) 整数(kind=4) 最佳答案 在 Fortran >=90
我以前从未编程过,最近(1 周前)才开始学习!第一门类(class)是函数式编程,使用 Haskell。 我有一项学校作业,我想通过删除一两个步骤来改进它,但我遇到了一个讨厌的错误。 基本上,我创建了
给定以下GraphQL请求和变量: 请求: query accounts($filter:AccountFilter, $first_:String, $skip_:Int) { accounts
我已经搜索了 StackOverflow,但找不到关于如何检查计算器应用程序的数字输入正则表达式的答案,该计算器应用程序将检查每个 keyup 的以下格式(jquery key up): 任何整数,例
类似于我上一篇致歉的文章,但没有那么长篇大论。基本上我想知道当每次重绘调用只重绘屏幕的一小部分时,优化重绘到 JFrame/JPanel 的最佳选择是什么。 此外,除了重绘重载之外,我并不是 100%
所以在我的教科书中有一个使用 f# 的递归函数的例子 let rec gcd = function | (0,n) -> n | (m,n) -> gcd(n % m,m);; 使用此功能,我的教科书
我有一个数据结构,例如表达式树或图形。我想添加一些“测量”功能,例如depth和 size . 如何最好地键入这些函数? 我认为以下三个变体的用处大致相同: depth :: Expr -> Int
这样写比较好 int primitive1 = 3, primitive2 = 4; Integer a = new Integer(primitive1); Integer b = new Inte
我是 Java 8 新手,想根据键对 Map 进行排序,然后在值内对每个列表进行排序。 我试图寻找一种 Java 8 方法来对键和值进行排序。HashMap>映射 map.entrySet().str
这就是我的目标... vector ,int> > var_name (x, pair (y),int>); 其中 x 是 vector var_name 的大小,y 是对内 vector 的大小。
这里是 an answer to "How do I instantiate a Queue object in java?" , Queue is an interface. You can't i
这个问题在这里已经有了答案: Weird Integer boxing in Java (12 个答案) Why are autoboxed Integers and .getClass() val
我们可以使用 C++ STL 做这样的事情吗?如果是,我将如何初始化元素?我试图这样做,但没有成功。 pair,vector>p; p.first[0]=2; 最佳答案 Can we do som
您好,我正在尝试为百分比和整数数组中的数字找到索引。假设 arraynum = ['10%','250','20%','500'] 并且用户发送一个值 15%,这个数字在哪个范围内居住?我可以使用这段
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如,当apple(ProductName)是fruit(Cate
我已经坚持了一段时间,我正在尝试将一些数据配对在一起。这是我的代码。 #include #include using namespace std; int main() { pair data(
我收到错误:'(Int, Int)' 与 'CGPoint' 不相同 如何将 (Int, Int) 转换为 CGPoint let zigzag = [(100,100), (100,150)
我在 .cpp 文件中发现了以下代码。我不理解涉及头文件的构造或语法。我确实认识到这些特定的头文件与 Android NDK 相关。但是,我认为这个问题是关于 C++ 语法的一般问题。这些在某种程度上
我将这些输入到 Scala 解释器中: val a : Integer = 1; val b : Integer = a + 1; 我收到消息: :5: error: type mismatch;
C++:vector>v(size);当我试图打印出值时显示 0 作为值,但是当未声明 vector 大小时它显示正确的输出?为什么这样?例如: int x; cin>>x; vector>v(x);
我是一名优秀的程序员,十分优秀!