- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我目前正在开发一个小工具来分析 Whatsapp 中群聊的使用情况。
我正在尝试使用 whatsapp 日志文件来实现它。我设法将原始 .txt
格式化为以下格式以处理格式化文本:
29. Jan. 12:01 - Random Name: message text
29. Jan. 12:22 - Random Name: message text
29. Jan. 12:24 - Random Name: message text
29. Jan. 12:38 - Random Name: message text
29. Jan. 12:52 - Random Name: message text
到目前为止,还不错。问题是有一些软盘线,例如:
29. Jan. 08:42 - Random Name2: message text 1
additional text of the message 1
29. Jan. 08:43 - Random Name2: message text 2
甚至更糟:
15. Jan. 14:00 - Random Name: First part of the message
second part
third part
forth part
fifth part
29. Jan. 08:43 - Random Name2: message text 2
我想我需要一种算法来解决这个问题,但我是编程新手,无法创建如此复杂的算法。
Python 中同样的问题:parse a whatsApp conversation log
[编辑]
这是我的代码,它不起作用。 (我知道这很糟糕)
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
public class FormatList {
public static void main(String[] args) throws IOException {
// TODO Auto-generated method stub
FileReader fr = new FileReader("Whatsapp_formated.txt");
BufferedReader br = new BufferedReader(fr);
FileWriter fw = new FileWriter("Whatsapp_formated2.txt");
BufferedWriter ausgabe = new BufferedWriter(fw);
String line="";
String buffer="";
while((line = br.readLine())!=null)
{
System.out.println("\n"+line);
if(line.isEmpty())
{
}
else{
if(line.charAt(0)=='0'||line.charAt(0)=='1'||line.charAt(0)=='2'||line.charAt(0)=='3'||line.charAt(0)=='4'||line.charAt(0)=='5'||line.charAt(0)=='6'||line.charAt(0)=='7'||line.charAt(0)=='8'||line.charAt(0)=='9')
{
buffer = line;
}
else
{
buffer += line;
}
ausgabe.write(buffer);
ausgabe.newLine();
System.out.println(buffer);
}
ausgabe.close();
}
}
}
[编辑 2]
最后我想读出文件并分析每一行:
29. Jan. 12:01 - Random Name: message text
我可以知道它是什么时候发送的,是谁发送的,他写了什么/写了多少
如果我现在得到以下行:
additional text of the message 1
不知道是什么时候写的,也不知道是谁发的
最佳答案
好吧,我相信,根据我的理解,我想出了一个解决你的问题的方法。
给定一个具有这种格式的文件:
29. Jan. 12:01 - Random Name: message text
29. Jan. 12:22 - Random Name: message text
29. Jan. 12:24 - Random Name: message text
29. Jan. 12:38 - Random Name: message text
29. Jan. 12:52 - Random Name: message text
29. Jan. 08:42 - Random Name2: message text 1
additional text of the message 1
29. Jan. 08:43 - Random Name2: message text 2
15. Jan. 14:00 - Random Name: First part of the message
second part
third part
forth part
fifth part
29. Jan. 08:43 - Random Name2: message text 2
(这是我的“data”文件夹中的一个名为“wsp.log”的文件。所以访问它的路径是“data/wsp.log”)
我期待这样的事情:
29. Jan. 12:01 - Random Name: message text
29. Jan. 12:22 - Random Name: message text
29. Jan. 12:24 - Random Name: message text
29. Jan. 12:38 - Random Name: message text
29. Jan. 12:52 - Random Name: message text
29. Jan. 08:42 - Random Name2: message text 1 additional text of the message 1
29. Jan. 08:43 - Random Name2: message text 2
15. Jan. 14:00 - Random Name: First part of the message second part third part forth part fifth part
29. Jan. 08:43 - Random Name2: message text 2
据此,我实现了以下类:
public class LogReader {
public void processWspLogFile() throws IOException {
//a. I would reference to my file
File wspLogFile = new File("data/wsp.log");
//b. I would use the mechanism to read the file using BufferedReader
BufferedReader bufferedReader = new BufferedReader(new FileReader(wspLogFile));
String currLine = null;//This is the current line (like my cursor)
//This will hold the data of the file in String format
StringBuilder stringFormatter = new StringBuilder();
boolean firstIterationDone = false;//The first line will always contains the format, so I will always append it, from the second I will start making the checkings...
// Now I can use some regex (I'm not really good at this stuff, I just used a Web Page: http://txt2re.com/)
/* This regex will match the lines that contains the date in this format "29. Jan. 12:22", when I take a look at your file
I can see that the "additional text of the message" does not contains any date, so I can use that as my point of separation*/
String regex = "(\\d)(\\d)(\\.)(\\s+)([a-z])([a-z])([a-z])(\\.)(\\s+)(\\d)(\\d)(:)(\\d)(\\d)";
//As part of using regex, I would like to create a Pattern to make the lines on the list match this expression
Pattern wspLogDatePattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
//Use of the line separator of the O.S
String lineSeparator = System.getProperty("line.separator");
while ((currLine = bufferedReader.readLine()) != null) {
if (!firstIterationDone) {
stringFormatter.append(currLine);
firstIterationDone = true;
} else {
Matcher wspLogDateMatcher = wspLogDatePattern.matcher(currLine);
//The first time we will check if the second line has the pattern, if it does, we append a line separator
if (wspLogDateMatcher.find()) {
//It is a "normal" line
stringFormatter.append(lineSeparator).append(currLine);
} else {
//But if it doesn't, we append it on the same line
stringFormatter.append(" ").append(currLine.trim());
}
}
}
System.out.println(stringFormatter.toString());
}
}
我将以这种方式调用:
public static void main(String[] args) throws IOException {
new LogReader().processWspLogFile();
}
希望这可以给您一些想法或对您的目的有用。我知道需要一些改进,代码总是需要重构 :),但现在它可以达到预期的格式。编码愉快 :)。
关于java - 用 Java 解析 Whatsapp 日志文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31075131/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
我在此网站页脚中使用共享按钮。除了 url http://gnr.richkid.co.il/he/catalog/a/item/?ItemID=etc 的页面之外,whatsapp 按钮在所有页面中
这张图片在 WhatsApp 中流传,是带有 alpha 信息的 PNG 图像。如果您重新共享原始文件,则仅适用于 PNG。您尝试上传 PNG 文件(此文件或任何其他文件)的所有内容都会转换为 JPG
我在 Google 上做了很多研究。有很多教程和应用程序可以做到这一点。我测试了最知名的:App2SD、Link2SD、FolderMount。我什至购买了他们的商业版,以确保我启用了所有功能。好吧,
我使用 C# 创建了一个 Win 表单应用程序。这是向输入/选定的 Excel 文件手机号码发送批量 Whats App 消息。在制作这个软件的过程中,Whatsapp屏蔽了我的两个号码,原因是发送多
我在我的服务器上设置了 Yowsup。我关注了 this guide并设置一切没有任何错误。但是在最后一步,即发送消息时,它不会引发任何错误,但消息不会到达我手机上的 Whatsapp。 以下是输出供
我正在尝试实现一个 WhatsApp 机器人,它使用 chromedriver 并打开 whatsapp 网络,并向联系人发送消息。这些是程序的步骤: 从 excel 文件中读取联系人 设置发送消息的
我将WhatsApp语音消息(WhatsApp业务云API)中的音频文件发送到Google语音到文本识别。非常奇怪的是,它适用于从Windows WhatsApp客户端发送的语音消息。因此,让官方的W
是否可以将 IBM Watson Assistant(对话)与 WhatsApp 集成?我尝试在互联网上搜索,但没有找到太多。 最佳答案 我们正在努力与 Watson IBM 集成,这将带来 amio
我不确定这在这里是否离题,但我发现了其他 WhatsApp 问题。 如果我分享包含 IP 地址的链接,例如: http://123.456.789.456/mystuff WhatsApp 只为数字(
我正在尝试获取联系人的用户名、状态和上次查看数据的转储。 由于 WhatsApp 没有 API,因此我将其安装在 BlueStacks 上,并尝试拍摄可能存储这些详细信息的数据库的快照。 我有几个问题
是否可以使用 WhatsApp 服务器向 WhatsApp 组发送消息,在我自己的应用程序中而不打开 WhatsApp 应用程序? 另外,请帮助我了解 WhatsApp 联系人聊天的历史记录。 最佳答
我正在尝试从我的应用程序中选择联系人的 Whatsapp 地址,但鉴于我的应用程序是 Whatsapp 的实用程序,我希望用户继续使用选择联系人的 native 方式,这样他们不必习惯对我们大多数人来
假设我需要用户填写的表格很少,包括联系电话。填写完所有表格后,我希望该联系电话应该收到一条消息,其中包括一些问候语或单击以在表格中使用的一些文本或图像。该消息应作为简单的 SMS 和 WhatsApp
我正在尝试构建一个后台服务,我可以在其中将消息从我的 whatsapp 发送到其他用户的 whatsapp。我试过这段代码 PackageManager packageManager = getApp
如果您能在以下方面提供帮助,我们将不胜感激。通过我们的应用程序,用户可以启动 WhatsApp 消息(发生的情况是 WhatsApp 客户端以预加载的电话 + 文本开始,因此用户只需点击 WhatsA
我为类似的问题找到了很多线索,但在任何地方我都找不到我要找的东西。 给定联系人号码和短信,我想以编程方式向该联系人发送 WhatsApp 消息,而无需打开应用程序或选择联系人。 到目前为止,我已经编写
我的要求是在 Gallery/Albums 下显示目录, 以以下方式创建目录并不能完全满足我的要求... File rootPath = new File(Environment.getExtern
我知道如何使用 WhatsApp 官方 API 向任何号码发送消息 https://api.whatsapp.com/send?phone= 但是,如果用户加入该群组,有什么方法可以向 WhatsAp
我使用这段代码,但它显示了其他应用程序。 NSURL *URL = [[NSBundle mainBundle] URLForResource:@"ABC" withExtension:@"png"]
我是一名优秀的程序员,十分优秀!