python - 将唯一标签添加到选项卡式行-6ren

python - 将唯一标签添加到选项卡式行

转载作者：太空宇宙更新时间：2023-11-04 04:08:18

28

4

我有一个文本文件，其中一些行在一个选项卡上移动，表示它们是主行的子类别。我需要用一个唯一的标签来标记每一行，表示它们属于哪个“组”或类别，以便对每个类别进行统计分析。

我不太确定如何在 Python 中自动执行此操作，因为文件中有数千行。如果不首先移动所有缩进行，我无法将文件转换为 csv，这显然会失去判断每一行属于哪个类别的能力。

编辑:
Here is a screenshot of a sample text file that shows what I am talking about visually.

前 3 行的组标签为“1”，接下来的 2 行的标签为“2”，最后 2 行的标签分别为“3”和“4”。

最佳答案

IIUC，这是一个使用 Pandas 和 itertools.chain 的相对简单的方法:

import pandas as pd
import numpy as np
import io, re, itertools

data = '''
ratio,  weight, flags,  initialTime,    finalTime
15,     0.44,   3,      300500,         400000
        42,     .31,    2,      900432,         100304
        41,     .2,     7,      192834,         200048
17,     0.234,  2,      2019481,        2182350
        8,      .1,     9,      1092834,        1190924
8,      0.241,  2,      2115120,        2159009
10,     0.092,  9,      2011234,        5001234
'''

data = re.sub(r'\t+', '*', data)
df = pd.read_csv(io.StringIO(data))

df.columns = [i.strip('*') for i in df.columns]
df.loc[df['ratio'].str.contains(r'\*'), 'ratio'] = np.nan
df['ratio'] = df['ratio'].ffill()
group_numbers = itertools.chain.from_iterable([[i+1]*v.shape[0] for i, (name,v) in enumerate(df.groupby('ratio', sort=False))])
df['ratio'] = list(group_numbers)
df = df.replace(r'\*', '', regex=True).set_index('ratio')

产量:

      weight  flags initialTime finalTime
ratio                                    
1       0.44      3      300500    400000
1        .31      2      900432    100304
1         .2      7      192834    200048
2      0.234      2     2019481   2182350
2         .1      9     1092834   1190924
3      0.241      2     2115120   2159009
4      0.092      9     2011234   5001234

关于python - 将唯一标签添加到选项卡式行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56842498/

28

4

0

文章推荐： linux - 使用bind函数在puppy linux中进行键盘映射

文章推荐： linux - 如何更改 MATLAB 中特定字符串前面的数字

文章推荐： html - 流体头背景图像

scala - 选项[ future [选项[Int]]] => future [选项[Int]]
给定一个 Option[Future[Option[Int]]] : scala> val x: Option[Future[Option[Int]]] = Some ( Future ( Some
scala - EitherT[选项，A，B] ===选项[Either[A，B]]
如果我理解正确，EitherT[Option,A,B] 应该与 Option[Either[A,B]] 相同，但编译器不同意.以下代码编译失败: def f[A,B] = implicitly[Eit
npm - 这个错误是什么意思？有 `useBuiltIns` 选项，需要直接设置 `corejs` 选项
我刚开始在使用 parcel.js 构建静态 Assets 时遇到此错误。它在本地工作，但我在 Heroku 上的构建出错，我不确定它是否相关。最佳答案得到同样的问题。通过将 core-js 安装
c# - Telerik 报告只有 PDF 选项，没有 Excel 和 Word 选项
当我生成 Telerik Report 时，只有 Export PDF 可用。即使我将 docx 和 xlsx 的配置设置为 true。这是我在网络配置中的配置。
ios - 在 itunesConnect 中，我的应用程序显示 Apple Pay 选项，我正在使用 Braintree。如何摆脱在我的 itunesConnect 中显示 Apple Pay 选项？
我的 iTunesConnect 应用程序显示 Apple Pay 选项。我正在使用布伦特里。即使我们没有在应用程序中使用 Apple Pay 功能。有人可以帮我解决如何在我的 itunesCon
从命令行执行时MySQL输出帮助/选项
我正在 Raspbian 中从命令行运行以下查询: mysql -u $NAME -p $PASS Tweets -e "SELECT count(*) FROM raw_tweets;" 它输出以下
ffmpeg -r 选项
我正在尝试使用 ffmpeg(在 linux 下)为视频添加一个小标题。所以，我使用: ffmpeg -i hk.avi -r 30000/1001 -metadata title="SOF" hk_
用于视频流的 FFMPEG 选项
我正在尝试使用 ffmpeg 使用 ffserver 流式传输视频。您将在 ffserver1.conf 文件下方找到 ffmpeg 命令的日志输出。其中一个错误引用了预设，每次我尝试使用预设时，我
具有折叠操作的 Scala 选项
我正在尝试对 Option 使用 fold 或 map 操作而不是 match。我有一个选项 val ao: Option[String] = xxxx 和一个函数 f: (String => Fu
Dockerfile FROM --platform 选项
Dockerfile documentation表示有可能通过 --platform FROM 中的选项像这样的指令: FROM [--platform=] [AS ] 在我的 dockerfile
jquery - 将数据动态添加到属性/选项
我不确定“属性(property)”或“选项”是否是正确的术语，但这是我需要弄清楚的。鉴于以下情况: ' $.fileup({ url: '/file/upload',
选择 jQuery IF 选项
我正在尝试使用 jQuery 检查是否选择了值 = 1 的选择选项，然后将类添加到某些元素。但有些东西不起作用。可以请人看一下代码吗？我的代码: Reservation
VIM:选项、变量和两者之间的转换
我对 VIM 中的这些感到困惑。有些事情需要设置，而另一些则让。而且，我如何检查某个选项。我知道这是一个选项，因为我使用 set 来更改它。例如，如何检查当前文件类型选项是否为 java？最佳答
javascript - 当用户将鼠标悬停在链接上时想要显示图标/选项
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
F# 选项...它们真的能防止空引用异常吗
我在看《Professional F# 2.0》一书作者展示如下代码 let a string : option = None if a.IsNone then System.Console.
用于检查输入参数的 Java 选项
我习惯使用方法顶部的 java 样板检查输入参数: public static Boolean filesExist(String file1, String file2, String file3
PHP 正则表达式将字符串解释为命令行属性/选项
假设我有一串 "Insert Post -title Some PostTitle -category 2 -date-posted 2013-02:02 10:10:10" 我一直在尝试做的是将这个
KotlinJvmOptions useIR 选项
从 1.3.70 EAP 开始，在 org.jetbrains.kotlin.gradle.dsl.KotlinJvmOptions 这是 var useIR: kotlin.Boolean 哪个激活
Magento - 获取已订购捆绑项目的子项/选项
我无法获取订购捆绑商品的所有子产品及其选项。这可能吗？最佳答案以下是您如何找出哪些产品应与所有其他项目一起附加到列表中的捆绑产品中的方法: foreach ($order->getAllItems
java - 找到类型转换的流程/选项
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the

首页

博学

6Ren·AI

商城

python - 将唯一标签添加到选项卡式行