gpt4 book ai didi

Java:处理文本行

转载 作者:行者123 更新时间:2023-12-01 19:05:18 26 4
gpt4 key购买 nike

好吧,我正在使用 java 类处理搜索日志,但在某些时候我偶然发现了日志中的一个棘手部分:

通常,日志行如下所示:

217 yahoo.com   2006-05-16 16:35:31     

第一个数字是用户 ID,后面的字符串是查询,后面是时间戳。到目前为止一切顺利,我成功提取了用户 ID 并使用 .split(':') 和 split('-') 来获取时间戳的部分。但在日志的更下方,行的组成有点令人不快 - 例如,有如下行:

217 -   2006-05-18 18:20:10 1   http://www.theonering.net
1268 osteen-schatzberg.com 2006-03-21 17:55:42 1 http://www.osteen-schatzberg.com

在第一行中,“-”似乎标记了一个空查询或 w/e,末尾的 url 被标记为“clickurl”。对于这样的行,我使用 split() 接收时间戳(以及查询)的想法彻底失败了......

有人知道如何解决这个问题吗?

提前致谢

最佳答案

您确实应该考虑在此处使用模式匹配与正则表达式。

Here是一个潜在有用的示例。

关于Java:处理文本行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10320897/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com