javascript - 回答了 : Streamlining-6ren

javascript - 回答了 : Streamlining

转载作者：行者123 更新时间：2023-11-29 23:23:59

25

4

上下文:我正在从日志文件中读取如下所示的数据:

{"action": "tweet", id: 1234, user: "user1", timestamp: 3120}
{"action": "retweet", target_id: 1234, user: "user2", timestamp: 4020}
{"action": "tweet", id: 1235, user: "user3", timestamp: 5320}
{"action": "retweet", target_id: 1235, user: "user4", timestamp: 5820}
{"action": "retweet", target_id: 1235, user: "user2", timestamp: 6540}

日志文件中有更多数据，但这些是最重要的字段。

我创建了以下函数来读取日志文件的每一行，并检测用户是否是垃圾邮件制造者。垃圾邮件发送者的标准是:

不得有“推文”操作
必须至少有一个“转推”操作
他们的所有转推必须在目标推文的 1000 毫秒内发生(显示为 target_id 与 id 的关联)。

该函数应该返回一个垃圾邮件发送者数组，但不会重复任何已经被标记至少一次的人。

我相信我可以清理很多东西:

identifySpammers = (file_path) => {
  const spammers = [];
  const notSpammers = []; // I"m only using this to track when someone comes up as having a retweet that was after 1000 milliseconds
  let previousId;
  let previousTimeStamp;
  const data = fs.readFileSync(`/${file_path}`, 'utf8').trim().split("\n")
  for(index in data) {
    const parsedData = JSON.parse(data[index]);
    if(parsedData.timestamp - previousTimeStamp >= 1001 && spammers.includes(parsedData.user)) {
      notSpammers.push(parsedData.user)
    } else if (!spammers.includes(parsedData.user) && parsedData.target_id === previousID && parsedData.timestamp - previousTimeStamp < 1001) {
      spammers.push(parsedData.user)
    } else if (parsedData.action === "tweet") {
      previousId = parsedData.id
      previousTimeStamp = parsedData.timestamp
      notSpammers.push(parsedData.user)
    }
  }

  for(let i = 0; i < spammers.length; i++) {
    if(notSpammers.includes(spammers[i])) {
      spammers.splice(i, 1)
    }
  }

  return spammers;
}

我真正应该做的是利用类似的条件，但写入一个对象，其中每个键都是用户名，如果值是他们是否是垃圾邮件发送者，那么就像:

  const spammers = {
    user1: null, // Initialize as null
    user2: false, // Once a user is marked as false, it is impossible for them to ever be considered a spammer.
    user3: true // This could end up being false later on
  }

我尝试使用与我的双数组解决方案类似的逻辑来执行此操作，但没有成功。

根据上述代码，如果有人可以提供任何指导，让我可以提出更高效的对象驱动解决方案，我将不胜感激。不需要完整的答案，只需要一些关于如何处理的建议以及您可能拥有的任何想法。

谢谢!

编辑 1:清除了一些错误并阐明了用户成为垃圾邮件制造者时的情况。编辑 2:扩展日志文件以演示用户如何更早地被标记为垃圾邮件，但随后通过必要的条件才不会成为垃圾邮件。

最佳答案

我以更简洁的代码方式重构并使用建议的数据结构:

var data = [
 {"action": "tweet", id: 1234, user: "user1", timestamp: 1341414},
 {"action": "retweet", target_id: 1234, user: "user2", timestamp: 1341415},
 {"action": "tweet", id: 1235, user: "user3", timestamp: 2341414},
 {"action": "retweet", target_id: 1235, user: "user1", timestamp: 2341415},
]

const isSpammerByUser = {};
let previousId;
let previousTimeStamp;
for(index in data) {
  const parsedData = data[index];
  const user = parsedData.user;
  const isUserASpammer = (isSpammerByUser[user] === true);
  const hasUserProvenToNotBeASpammer = (isSpammerByUser[user] === false);
  const isFastAction = (parsedData.timestamp - previousTimeStamp < 1001);
  const isRetweetFromPrevious = (parsedData.target_id === previousId);
  
  if (parsedData.action === "tweet") {
    isSpammerByUser[user] = false;
    previousId = parsedData.id
    previousTimeStamp = parsedData.timestamp

  } else if(isUserASpammer && !isFastAction) {
    isSpammerByUser[user] = false;

  } else if (!hasUserProvenToNotBeASpammer && isRetweetFromPrevious && isFastAction) {
    isSpammerByUser[user] = true;
  }
}

const spammers = [];
for (user in isSpammerByUser)
  if (isSpammerByUser[user])
    spammers.push(user);

console.log("spammers: " + spammers.join(","));

关于javascript - 回答了 : Streamlining，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49833131/

25

4

0

文章推荐： javascript - React js中防止事件冒泡 'ineffective'

文章推荐： android - 将所有异常写入文件

文章推荐： javascript - 如何为 L.Tooltip 显示设置延迟？

文章推荐： javascript - jquery如何获取存储在另一个变量中的变量的值

java - 回答"is"时重复方法
package homework4; import java.util.Scanner; public class Prog4 { static Scanner scanner = new Scann
Android - 推送通知 - 回答
很多信使/应用程序发送Android通知，我可以在不打开应用程序的情况下直接在通知中回复。例如，此功能在 WhatsApp 或 Telegram 中。我现在的问题是，如何做到这一点？ //更新: 这
diagram - 这些图叫什么？ (回答 : railroad diagrams)
我在一些帮助文件和 src 文档中看到了很多这样的图表他们叫什么？是否有任何其他(出于相同目的)已知图表？图片来源:http://www.sqlite.org/images/syntax/inse
networking - RTNETLINK 回答 : Operation not supported
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 1年前关闭。 Improve this qu
haskell - 如何使用 Aeson 追溯解析错误？ [+回答]
我有要解析的大 (>1Mb)、简单的 JSON 文件。我使用了 Aeson，按照他们在 Haskell 学校的 fpcomplete 教程(谢谢你们，顺便说一句)。由于某些文件(而不是全部)失败，
.net - NLP/任务。回答-从数据库检索信息
我最近一直在阅读有关NLP的文章，到目前为止，我已经（非常）基本了解所有工作原理，包括从句子拆分到POS标记以及知识表示。我知道那里有各种各样的NLP库（主要是Java或Python），并且找到了.
ajax - 如何让 ajax 回答 slim ？
在 destroy.js.erb 中有效 $("").appendTo("#commentlist"); 瘦身怎么做？我试过了 $("= escape_javascript(render @comme
java - 这种模式的名称是什么？ (回答 : Remote Proxy)
考虑一个类 OriginalClass，它可能在运行时可用，也可能不可用。 OriginalClass 有一个方法 doSomething 如果它的类可用，应该执行该方法。解决这个问题的一种方法是创
python - 'RTNETLINK 回答 : File exists'
当我添加延迟命令时，paramiko 返回“2”作为退出状态(同时返回“0”用于带宽命令设置)。 2还好吗？ (谷歌搜索对此没有帮助，我猜 2 一定是某种错误)。我使用的命令是:- delay_cm
linux - RTNETLINK 回答 : No such file or directory
当我运行这个命令时: tc qdisc add dev eth0 root red limit 51200000 min 128000 max 512000 avpkt 1024 burst 200
bash - RTNETLINK 回答 : Device or resource busy
我试图创建一个网络接口(interface)的新实例以在其上设置 DNS 服务器配置。当我运行此命令时: ip link set enp1s0 name ens33 && ip link set e
jquery - 回答 JQuery 对话框时 JavaScript 不执行
我的页面上有一个对话框，它是使用 JQuery 对话框小部件制作的。我已经将两个按钮设置为具有单击页面上不同按钮的功能，这将触发页面的回发并执行各种操作。当对话框为modal: false时，对话框将
emacs - 从 emacs 回答/询问 SO 问题。？
现在我正在使用 gnus通过从 gwene 订阅感兴趣的标签来阅读 SO 问题。我只能看到/阅读问题而不是答案。是否有插件可以回答/询问 SO 问题。当然，我可以使用 edit-server 来编
jenkins - 如何从 slack 回答 Jenkins 输入提示？
我正在使用 Jenkins slack 插件在我的自动构建过程中向我发送消息。我已经设置了手动门控，因此生产部署需要手动批准。这是使用 Jenkins input 完成的。步。我该如何回应这个inp
python - 回答"is"或“否”后如何回到 intent
我的技能是让你可以开始新游戏。不过，如果用户正在 session 中玩游戏或想要开始新游戏，我会在 game_in_progress 中放置一个 session 变量。它显示，“游戏正在进行中，您想继
algorithm - 回答 'yes' 或 'maybe' 的决策算法的名称是什么？
我想知道决策算法的名称是什么，它不返回"is"或“否”，但只能为输入的真实子集决定"is"，不能提供对其余部分做出最终决定。一个合适的例子是确定矩阵可逆性的算法——我的算法对矩阵的一个子类正确回答"
linux - RTNETLINK 回答 :No such file or directory error
1. ETH=$1 2. LATENCY=$2 3. LOSS=$3 4. JITTER=$4 5. BW=$5 6. sudo /sbin/tc qdisc del dev eth0 root 7.
linux - 回答 golang 中的密码 shell 提示
我正在寻找一种方法来回答 golang 中的 shell 密码提示。喜欢: bussiere@kus:~/Workspace/rteest$ ./passwordtest.sh Password :
spring - 如何在未修改 http 304 的情况下让 WRO 回答？
我们在我们的 web 应用程序中通过 wro 提供 javascript 资源(和其他资源)。在 PROD 环境中，浏览器获取(例如)app.js angular webapp 的内容，其中包含 f
VBA:回答 "save as - overwrite"提示(和其他)不使用默认选项
我有一个 .xlsm 文件，我需要其中一些以非宏文件格式 (.xlsx) 保存的工作表。为此，我创建了以下代码。第一部分将事件工作表(称为“CombinedRaw”)保存为单独的文件“DATATRY.

首页

博学

6Ren·AI

商城

javascript - 回答了 : Streamlining