python - 如何计算变量值在几天内随时间的共现情况以生成邻接列表？-6ren

python - 如何计算变量值在几天内随时间的共现情况以生成邻接列表？

转载作者：行者123 更新时间：2023-12-01 00:53:06

24

4

我正在分析 Google Cloud 上新闻文档 GDELT 数据库中的数据。该文件包含一个日期列、300 个主题代码之一以及一个频率值。

这是我的数据。示例数据文件大约有 46,000 行:https://docs.google.com/spreadsheets/d/11oUiznvFTKGAOz1QXavbiWH1sxgCJHbFfysu0F0MdKs/edit?usp=sharing

这里列出了 284 个独特的主题:
https://docs.google.com/spreadsheets/d/1gN3Vc5W6rGekF8P_Rp73BL2YaO6WTDVp-DpP0Il22vk/edit?usp=sharing

我需要在每天内创建一对主题，并根据其频率的乘积进行加权。然后，我需要输出一个邻接列表:theme_A、theme_B 和权重，以便随后随着时间的推移对主题进行网络分析。我陷入了计算主题共现的困境。

#Import packages
import pandas as pd
import numpy as np

#Read in data file
df = pd.read_csv(r'C:\Users\james\Desktop\Documents\Downloads\Cybersecurity\cybertime.csv')
df.head

#Create bigrams of themes by days, based on cooccurrences weighted by frequencies.
#Iterate rows until new date is found, then compute weighted cooccurrences.
#Weights are products of theme A frequency (freq) and theme B frequency.


#Output the adjacency list.

最佳答案

您可以尝试将自定义函数与 groupBy 一起使用并应用于 pandas 数据框。请参阅here

或者做:

df.groupby(['date', 'theme'])['frequency'].apply(lambda x : x.astype(int).sum()

关于python - 如何计算变量值在几天内随时间的共现情况以生成邻接列表？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56431956/

24

4

0

文章推荐： python - 如何使用 reg.compile 匹配文本的精确单词

文章推荐： python - 如何在Python字符串中添加两个 "flags"

文章推荐： python - 在 pandas 数据框中应用 groupby 两次

python - 将鼠标悬停在多轴上的一个点上时如何使标 checkout 现？
我正在尝试在具有多个轴的 matplotlib 上显示悬停标签。我正在使用 python 3.6.8 和 matplotlib 3.0.3 我的情节有多个轴，我查看了这篇文章中的示例: Possib
javascript - 斜体标 checkout 现
我有这个: 1.test fred 5 <i>(9.5h)</i> 我看到的是这样的: 我无法更改跨度标签，它是 fullcalendar 的一部分。我该怎么做才能看到斜体而不
html - 单击复选框时如何使标 checkout 现
如何制作这个标签单击复选框时出现？现在它是隐藏的。 Bark Bark Hear a dog CSS: .bark{ visibility: hidden } input[type="checkb
ios - 一旦计时器归零，如何使丢失标 checkout 现？
我是编码初学者，我需要以下代码的帮助。我正在努力制作“你输了!”标签在计时器为零后出现，但是当我尝试这样做时；它没有显示任何内容。请帮助我! class Game: SKScene { let
swift - 如何等待字符数大于零的标 checkout 现 UI 测试
实际上，在 api 调用之前，只有 Label 可见且为空文本。获得响应后标签字符计数大于零。但是这里如何等待字符数大于零的标 checkout 现并执行某些操作。这是我使用的代码，但我收到谓词错误
html - HR 标 checkout 现，但无法设置样式
我正在使用以下 HTML 代码: hr { border: none; border-top: 3px double #333; color: #333; overflow: visi
c# - 从 XML 中去除标 checkout 现
我想去掉特定标记的出现，保持内部 XML 完好无损。我想一次完成(而不是搜索、替换并再次从头开始)。例如，来自源: Content Here More Her
javascript - JQuery Range Slider 如何让多个标 checkout 现？
我正在尝试弄清楚如何让 slider 说出两个不同的内容。我希望 slider 上方的输入以 1.25 美元的二十步表示美元金额(20 到 45 之间)——但我希望实际句柄只说单个整数答案，如 1..
python - 单击 matplotlib(或可能是 plotly)中的阶梯图子图点时如何使标 checkout 现？
我正在使用 matplotlib 基于数据框制作步骤图，但我希望显示数据框的键/值之一( signals_df['Gage'] )，而不是坐标作为注释，但我总是收到错误:AttributeError:
javascript - 我想在 Chart.js 中查看图表 X 轴上的所有标签，但只有少数标 checkout 现。
有什么方法可以让我看到所有标签吗？正在绘制所有点，工具提示正确显示标签和值，但 X 轴上的所有标签都不可见。最佳答案是的，有办法。您需要将 x 轴刻度的 autoSkip 属性设置为 false，

首页

博学

6Ren·AI

商城

python - 如何计算变量值在几天内随时间的共现情况以生成邻接列表？