python - 如何多次分割输入文本-6ren

python - 如何多次分割输入文本

转载作者：太空宇宙更新时间：2023-11-03 20:07:53

我有一个输入文件，其结构如下:年份用“-”分隔，研究用“=”分隔，学生及其表现用“\t”分隔。我的目标是解析输入文件以获取数字。当我最终得到这些数字时，我需要最后两个数字来代表学生的表现，以百分比表示。问题是，当我用连字符等分割输入时，我得到一个列表，但我不知道此时要做什么，因为我不能再次将其删除，因为它现在是一个列表。基本上，它是一长串名称，其中包含以毫秒为单位的性能时间，然后是以百分比表示的性能，如下所示:Frank Pierre 1398 81。这是我想从列表中所有不同名称中检索的第二个数字，因为该数字代表百分比。

我已经能够通过使用 for 循环遍历输入文件中的所有项目来检索数字，然后将它们附加到新列表(如果它们是整数)，但问题是我的解决方案使用了以下事实:最后的所有数字都小于或等于一百(因为它们是百分比)，最终将它们从新列表中删除并将它们添加到新的百分比列表中。但是，我希望程序能够以更通用的方式处理具有相同结构的输入文件。

想象一个具有相同结构的文件，但在一些情况下学生姓名后面的第一个数字低于 100。我的程序会将其识别为百分比，因为它低于 100，但这是不是这样的!只有第一个数字之后的第二个数字代表百分比。这就是为什么我认为最好解析输入文件，以便将数字与其他所有内容分开，然后使用索引检索第二个数字。我只是不知道如何做到这一点。

如果有人知道如何完成这项工作，那就太好了。代码必须在 python 2.7 中，我不能使用任何外部模块，我必须自己定义函数。我只需要能够获得第二个数字的列表，这样我就可以使用它们来对它们进行分析。

我目前有以下代码:

'with open("statistics_input.txt", "r") as input:
    information = input.read()
    splitted = information.split('-')
first = splitted[0]'

问题是我现在最终得到了一个包含 6 个不同索引的列表，每年一个，我不知道如何进一步解析它。我首先将第一年作为变量，但是现在我如何检索该年的数字并为每年重复该过程？

最佳答案

到目前为止，您已经弄清楚如何打开和读取文件，所以我跳过这一部分。假设您的文件内容在变量 text 中读取，以下代码:

data = {}
years = text.split('\n-')  # text -- is your source text

for y in years :
    year = y.split('\n') [0]
    subj = y.split('\n') [1:]

    data[year] = {}

    subject = 'none'
    for s in subj :
        if len(s) < 5 or s[0] == '=' :
            subject = s
            data[year][subject] = []
            continue
        name, result = s.split('\t')
        data[year][subject].append( (name, result) )

    print json.dumps( data, indent=4)

给出以下结果:

{
    "1999": {
        "I": [
            [
                "Willem Jan van Steen", 
                "9859 77"
            ], 
            [
                "Guillaume Kielmann", 
                "5264 77"
            ], 
            [
                "Guillaume Bos", 
                "8200 6"
            ], 
            [
                "Matty Klop", 
                "9066 42"
            ], 
            [
                "Atze Klop", 
                "3318 45"
            ], 
            [
                "Sven Kielmann", 
                "1160 63"
            ], 
            [
                "Wartie Hijma", 
                "1904 65"
            ], 
            [
                "Matty Evers", 
                "2516 100"
            ], 
            [
                "Matty Bos", 
                "2941 99"
            ], 
            [
                "Pieter van der Ploeg", 
                "8873 80"
            ], 
            [
                "Jan Willem van Zeist", 
                "3934 95"
            ], 
            [
                "Thilo van Steen", 
                "9665 61"
            ], 
            [
                "Wan van Raamsdonk", 
                "1771 86"
            ], 
            [
                "Henri Fokkink", 
                "7484 59"
            ], 
            [
                "Jan Willem Evers", 
                "9709 82"
            ]
        ], 
        "=AI": [
            [
                "Sven Swarttouw", 
                "2604 73"
            ], 
            [
                "Eline van Raamsdonk", 
                "9771 60"
            ], 
            [
                "Herbert van der Ploeg", 
                "9325 41"
            ], 
            [
                "Eline Hijma", 
                "430 23"
            ], 
            [
                "Pieter Hijma", 
                "8203 65"
            ], 
            [
                "Eline Silvis Cividjian", 
                "2700 79"
            ]
        ], 
        "=W": [
            [
                "Guillaume Zeggers", 
                "290 47"
            ], 
            [
                "Natalia van Raamsdonk", 
                "2751 55"
            ], 
            [
                "Wartie Zeggers", 
                "3079 92"
            ], 
            [
                "Atze Swarttouw", 
                "9474 30"
            ], 
            [
                "Rene Pierre", 
                "2125 62"
            ], 
            [
                "Pieter van Mantgem", 
                "3023 67"
            ], 
            [
                "Jan Willem Hijma", 
                "7441 86"
            ]
        ], 
        "=BWI": [
            [
                "Rene Zeggers", 
                "7679 8"
            ], 
            [
                "Matty van Mantgem", 
                "7431 44"
            ], 
            [
                "Sven van Raamsdonk", 
                "7248 46"
            ], 
            [
                "Eline Pierre", 
                "5731 86"
            ], 
            [
                "Maarten Kielmann", 
                "7162 59"
            ], 
            [
                "Atze Zeggers", 
                "7065 72"
            ], 
            [
                "Eline van Mantgem", 
                "830 78"
            ], 
            [
                "Natalia van Steen", 
                "6321 49"
            ], 
            [
                "Frank van Raamsdonk", 
                "1380 31"
            ], 
            [
                "Pieter Bos", 
                "9639 94"
            ], 
            [
                "Andy Zeggers", 
                "5232 78"
            ], 
            [
                "Andy van Raamsdonk", 
                "1256 69"
            ], 
            [
                "Eline Gude", 
                "4101 40"
            ], 
            [
                "Matty Fokkink", 
                "9839 89"
            ], 
            [
                "Natalia Hijma", 
                "203 11"
            ], 
            [
                "Henri Bos", 
                "6728 66"
            ], 
            [
                "Guillaume van der Ploeg", 
                "9998 48"
            ], 
            [
                "Jan Willem van Steen", 
                "760 79"
            ], 
            [
                "Matty Pierre", 
                "337 96"
            ], 
            [
                "Wan Gude", 
                "3811 39"
            ]
        ], 
        "=ECTR": [
            [
                "Frank Swarttouw", 
                "6484 49"
            ], 
            [
                "Wan Hijma", 
                "9845 36"
            ], 
            [
                "Herbert Silvis Cividjian", 
                "1544 84"
            ], 
            [
                "Natalia Kielmann", 
                "646 21"
            ]
        ]
    }, 
    "2002": {
        "I": [
            [
                "Eline van Steen", 
                "7817 11"
            ], 
            [
                "Andy van Steen", 
                "9212 51"
            ], 
            [
                "Frank van Zeist", 
                "233 27"
            ], 
            [
                "Rene Swarttouw", 
                "5695 68"
            ], 
            [
                "Wan Bos", 
                "7039 29"
            ], 
            [
                "Eline van der Ploeg", 
                "4410 99"
            ], 
            [
                "Wartie van der Ploeg", 
                "2526 20"
            ], 
            [
                "Sven Bos", 
                "4694 98"
            ], 
            [
                "Wartie Swarttouw", 
                "5371 70"
            ], 
            [
                "Thilo van Zeist", 
                "10009 77"
            ], 
            [
                "Guillaume Fokkink", 
                "4125 86"
            ], 
            [
                "Atze Bos", 
                "4227 97"
            ], 
            [
                "Pieter Silvis Cividjian", 
                "9491 15"
            ], 
            [
                "Sven Evers", 
                "6994 41"
            ]
        ], 
        "=AI": [
            [
                "Matty van Steen", 
                "9702 40"
            ], 
            [
                "Thilo Silvis Cividjian", 
                "5553 42"
            ], 
            [
                "Herbert van Raamsdonk", 
                "6867 90"
            ], 
            [
                "Wartie Evers", 
                "2086 81"
            ], 
            [
                "Jan Willem Bos", 
                "1566 92"
            ], 
            [
                "Maarten van Mantgem", 
                "8960 92"
            ], 
            [
                "Sven van Zeist", 
                "8629 74"
            ], 
            [
                "Matty van Raamsdonk", 
                "496 41"
            ], 
            [
                "Willem Jan Evers", 
                "1853 11"
            ], 
            [
                "Guillaume van Zeist", 
                "9729 62"
            ], 
            [
                "Maarten Klop", 
                "8653 74"
            ], 
            [
                "Henri van der Ploeg", 
                "6755 39"
            ]
        ], 
        "=W": [
            [
                "Herbert Kielmann", 
                "2135 99"
            ], 
            [
                "Andy van Mantgem", 
                "8033 49"
            ], 
            [
                "Guillaume Gude", 
                "5356 52"
            ], 
            [
                "Herbert Bos", 
                "1435 47"
            ], 
            [
                "Pieter Gude", 
                "9460 36"
            ], 
            [
                "Jan Willem van der Ploeg", 
                "8403 25"
            ], 
            [
                "Wan van Mantgem", 
                "9672 68"
            ]
        ],

以下是打印姓名和分数的方法:

for year in data.values() :
    for subject in year.values() :
        for student in subject :
            print student[0], student[1].split()[1]  # only the last number

关于python - 如何多次分割输入文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58870629/

文章推荐： css - 如何在文本下应用另一个背景层

文章推荐： c# - DataBinding 到单例属性的属性

文章推荐： html - 选择器之前的 CSS 不起作用

文章推荐： python - 更快地刷新 sqlalchemy 表模型中的数据

c++ - 输入、输出、输入/输出参数
我有一个测试即将进行，我想澄清两个有关参数的问题。在我的笔记中指出，将参数传递给函数的推荐方法是使用“按引用传递” const type& x; // for "in" parameters
parameters - 输入、输出、输入、返回 UML 中的参数方向
当我通过 OMG 2.5(Beta)推广的 UML 规范阅读以下概念时: in: Indicates that Parameter values are passed in by the caller
javascript - Angular 8 : (keyup. 输入)不触发只读 html 输入
我试图在用户按下 Enter 时触发一个函数。我将此输入设置为只读的原因是限制用户在填充值后修改输入中的值。该值来自将在点击属性中触发的弹出窗口。问题是 keyup.enter 没有触发该输入。代
jquery-plugins - jQuery token 输入( token 输入)在模式弹出窗口上不起作用，列表隐藏在弹出窗口下
我在jQuery中使用模式弹出窗口控件，该弹出窗口具有由jQuery Tokenize输入插件提供动力的输入文本。问题是，当我在模式弹出文本框中键入内容时， token 化插件的搜索结果显示为隐藏在弹
javascript - 在 getElementsByTagName 中只选择 Checkbox 输入，排除 Textbox 输入
我有一个问题。当我选中复选框时，系统工作正常，总值发生变化，但一旦我修改文本输入，它就会变为 0。我需要将此文本框输入排除在更改值之外。这是 html: $15000 $
css - 输入[类型 ="button"]、输入[类型 ="submit"]、按钮 CSS 行为不正常
我正在努力让它发挥作用，但还是有些不对劲。我想用 CSS 设置提交按钮的样式以匹配我已有的按钮。风格: input[type="button"], input[type="submit"], b
Java数组通过nextInt()输入
import java.util.*;; public class selection { Scanner in=new Scanner(System.in); private
networking - 输入/输出带宽是否共享相同的网卡限制？
这可能是一个非常菜鸟的问题。假设我有一个带宽限制为 100MB/s 的网卡，那么输入/输出带宽是否有可能达到该限制同时 ?或者我会在任何时候遇到这个不等式:in bandwidth + out ba
scala - `this` 输入 Scala
看着这个问题，Fill immutable map with for loop upon creation ，我很好奇是什么this表示在 Map(1 -> this) . scala> Map(1
excel - 如何根据excel中的另一个单元格值限制单元格中的值输入/输入？
我有这样的东西一个乙问？是或否数字数字或零我想做的是: 如果 B1 = “Y”，则让用户在 B2 中输入一个数字。如果 B1 = “N”，则将 B2 中的值更改为零，并且不允许用户在
表格单元格内的 HTML 输入
我有一个包含许多列的表，我想添加 input标题单元格内的字段，但我希望输入适合根据正文内容的宽度。这是没有 input 的样子领域: 这就是 input 的样子领域: 可以看出，像“index”和
FTP 输入/输出文件夹名称最佳实践
关于为 FTP 客户端设置传出和传入文件夹，您遵循哪些最佳实践(如果有)？我们通常使用“outgoing”和“incoming”，但无论你如何表述方向，它都可以有两种解释方式，具体取决于名称相对于哪一
haskell - 输入 ‘where’ 解析错误
我正在尝试“求解”给定 d 的 Pell 方程:x^2 - d * y^2 = 1，或者至少我想得到最小的 x > 0 来求解方程。到目前为止，一切都很好。这是我的 Haskell 代码 minX :
python - VS代码在运行ctrl时移至下一行+输入
我是VS Code的新手，可以使用Ctrl + Enter将代码运行到python交互式窗口中。我希望光标自动移动到下一行，因此我可以逐行浏览代码。能做到吗？最佳答案如this blog pos
多维数组的 typescript 输入
我正在创建一个 bool 值矩阵/二维数组，并且我想为 dategrid 推断一种不仅仅是“ANY”的类型。 let yearRange = [2000,2001,2002,2003,2004]; l
python - “输入”两个具有最低复杂度的排序列表
我有两个排序的列表，例如 a = [1, 4, 7, 8] b = [1, 2, 3, 4, 5, 6] 我想知道a中的每个项目是否在b中。对于上面的示例，我想找到 a_in_b = [True, T
javascript - 输入/返回时指令语法错误
菜鸟警报这很奇怪 - 当我编写以下代码时，尝试在 AngularJS 中创建自定义指令: myModule.directive('myTab', function(){ console.lo
javascript - 单击显示文本字段(输入)
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
godot - 输入 "Any"的正确方法
假设我正在使用 gdscript 静态类型，并且对于一个函数参数，我事先不知道我会得到什么。这就是 python 中 typing.Any 的作用。如何使用 gdscript 做到这一点？似乎 Va
javascript - 向图像添加字段(输入)
我使用 dropzone 上传多个图像，并且工作正常，直到我想为每个图像插入品牌和网址。我遇到的唯一问题是，当我要从输入字段获取值时，我会从服务器获取来自字段(品牌、网址)的未定义值，但如果我使用静

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何多次分割输入文本