Python Pandas : Store multiple time series of variable length for multiple attributes for multiple users-6ren

Python Pandas : Store multiple time series of variable length for multiple attributes for multiple users

转载作者：太空宇宙更新时间：2023-11-03 16:46:55

28

4

我一直在进行一项实验，其中多个调查参与者使用可穿戴技术聆听多首音乐来跟踪多条信息，两个例子是 BPM(心率)和 T(体温)。

目标是衡量每首音乐(以用户反馈为特征)对人类情感的影响。

目前，所有数据都已存储到具有以下结构的多个目录中的 .txt 文件(文本文件中的每一行都有一个条目)中:

由于歌曲长度等变量以及可穿戴设备传输的时间段不一致，每个 .txt 文件的长度可能不同。例如，即使对于同一首歌曲，BPM 和 T 的时间序列也可以是不同的长度。

我已经编写了 Python 代码来遍历并读取所有文件中的值。

目前，我正在考虑创建一个如下所示的 DataFrame:

User_ID Song_ID BPM       T
1       1       [65,...]  [36,...]
1       2       [65,...]  [36,...]
2       1       [65,...]  [36,...]
2       2       [65,...]  [36,...]

但我担心在每个单元格中存储数组可能会使标准化数据等任务变得困难 - 我现在想知道是否有更好的方法利用 MultiIndex 将其存储在 Pandas 中？

最佳答案

我认为使用数据帧的字典会更容易。在单元格中包含列表需要大量额外的工作，这在您的情况下可以避免。

我认为对您的情况最有用的数据结构是为每个 song_id 提供一个DataFrame。即使每个用户的数据略有不同，您仍然可以通过使用一些 NaN 来解决问题。您的数据是时间序列，因此您应该将时间作为轴。您很可能不想知道确切的时间，而是想要知道歌曲开始后的秒数。

结构示例:

TimeStamp BPM_user1 BPM_user2
1       65      34
2       64      35
3       66      39
4       69      40

或者，您可以使用多列索引(指标位于级别 0，用户 ID 位于级别 1)

示例:

          BPM         T
TimeStamp user1 user2 user1 user2
1       65      80     34     38
2       64      78     35     37
3       66      77     39     37
4       69      76     40     37

如果您有许多特定于指标的转换，则第二种方法更好

然后您将使用 dict 来保存所有数据帧:

df_dict = {
     'song1': read_df(song_id=1),
     'song2': read_df(song_id=2),
}

然后您可以轻松地迭代以执行分析:

for songid, df in df_dict.items():
       *do analysis*

此工作流程通常比使用 pd.Panel 更容易且不易出错

关于Python Pandas : Store multiple time series of variable length for multiple attributes for multiple users，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36226972/

28

4

0

文章推荐： c# - 使用请求 url 存储缓存键是否可以？

文章推荐： ubuntu - ubuntu 狡猾的资源去哪儿了？

文章推荐： c# - WPF ICommand如何用简单的字符串表示以与UI松散耦合？

jquery - 从文件输入中获取文件名或文本 multiple=multiple
我正在尝试设计我的输入:文件。以下 SO 问题让我完成了 95% 的任务。区别在于我使用的是 HTML5 multiple=multiple 属性。 How to style "input file"
Python Pandas : Store multiple time series of variable length for multiple attributes for multiple users
我一直在进行一项实验，其中多个调查参与者使用可穿戴技术聆听多首音乐来跟踪多条信息，两个例子是 BPM(心率)和 T(体温)。目标是衡量每首音乐(以用户反馈为特征)对人类情感的影响。目前，所有数据都
PHP : multiple inputs into other multiple inputs
我使用 jquery 添加/删除输入我使用append为日期/收入添加多个Tr 我还使用另一个附加来添加多个 td 以获取同一日期 Tr 中的收入我添加多个日期输入，并在此表中添加多个收入输入我
安卓工作室 : Multiple APKs for Multiple Modules
在 Android 中，有一种方法可以为项目中的所有模块生成签名的 APK。例如。我有以下项目 Project -- Library Module -- Module 1 -- Modul
mysql - 数据库设计: How to query multiple to multiple table
我有一个用于网站展示的系统。展览数据可能来自差异表中的多个数据。喜欢这个设计: Table [ExhibitionType] used for differentiate category. Ta
ios - 什么是最佳实践 : Multiple UIViews or Multiple UIViewControllers
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 8 年前。 Improve
iOS : Handle multiple uilocalnotification with multiple same viewcontroller
我正在使用 UILocalnotification...收到通知时，当应用程序处于事件模式时我打开 viewcontroller...但是如果同时收到多个通知...我如何打开多个 viewcontro
PHP/MySQL : UPDATE multiples values with multiples WHERE
我遇到的问题是一个策略浏览器游戏，它有 7 种类型的值。问题如下: 我在 $_POST 中获得了 7 个不同的值，包括从索引 unit_1 到索引 unit_7。这 7 个值是 0 到 20 之间的整
python : How to search for multiple paterns in multiple files
这个问题已经有答案了: Search Large Text File for Thousands of strings (3 个回答) 已关闭10 年前。我想在多个文件上“grep”多个正则表达式。
javascript - 大型数据集的单个 + SQL 查询搜索
我正在尝试根据进行搜索我通过运行代码从 select 中获取值: for($i=0;$i= '$age_from' AND users.user_age = '$age_from' AND u

首页

博学

6Ren·AI

商城

Python Pandas : Store multiple time series of variable length for multiple attributes for multiple users