python - 使用每篇文章的第 5 行创建文本文件-6ren

python - 使用每篇文章的第 5 行创建文本文件

转载作者：行者123 更新时间：2023-12-01 04:10:47

25

4

我想创建一个文本文件，其中包含我的文本文件中 32 篇文章中每篇文章的第 5 行，名为 “Aberdeen2005.txt”。我已经使用以下方法分隔了文件的文章:

import re 
sections = [] 
current = []
with open("Aberdeen2005.txt") as f:
    for line in f:
        if re.search(r"(?i)\d+ of \d+ DOCUMENTS", line):        
           sections.append("".join(current))
           current = [line]
        else:
           current.append(line)

print(len(sections))

为此，我正在尝试以下代码:

for i in range(1,500):
    print(sections[i].readline(5))

但是它不起作用。有什么想法吗？

亲切的问候!

最佳答案

首先，当您执行 range(1,500) 时，这可能超出引发 IndexError 的部分范围，使用 range(len (部分))，使其始终保持正确的尺寸。

将当前保留为列表可能更有利，因为无论如何它已经按行分割:

sections.append(current)

然后只需将 .readline(5) 更改为 [4] 即可从列表中获取第 4 个元素(因为索引从 0 开始，所以 idx 4 是第 5 行)所以它看起来像这样:

import re 
sections = [] 
current = []
with open("Aberdeen2005.txt") as f:
    for line in f:
        if re.search(r"(?i)\d+ of \d+ DOCUMENTS", line):        
           sections.append(current) #remove the "".join() to keep it split up by line
           current = [line]
        else:
           current.append(line)

print(len(sections))

for i in range(len(sections)): #range(len(...))
    print(sections[i][4])  #changed .readline(5) to [4] since .readline() only works on files

您遇到问题的原因是因为 .readline() 是文件对象上的一种方法，当它被处理到列表中时，它是一个引发 AttributeError 的字符串 因为 str 没有 .readline 方法，您可以使用以下方法将其按行分割:

sections[i].split("\n")[4]

“\n”是换行符，它可能不会出现在每行的末尾，具体取决于操作系统或其他操作(例如，如果您 .strip() 每行)，但随后这些部分将仅包含可能更符合您喜好的字符串:

import re 
sections = [] 
current = []
with open("Aberdeen2005.txt") as f:
    for line in f:
        if re.search(r"(?i)\d+ of \d+ DOCUMENTS", line):        
           sections.append("".join(current))
           current = [line]
        else:
           current.append(line)

print(len(sections))

for i in range(len(sections)): #range(len(...))
    print(sections[i].split("\n")[4])  #changed .readline(5) to .split("\n")[4]

关于python - 使用每篇文章的第 5 行创建文本文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34979332/

25

4

0

文章推荐： jquery - 在 ajax 请求中发布长嵌套列表时堆栈级别太深

文章推荐： jquery - 如何给onClick window.open添加5秒延迟？

文章推荐： sql - 从 GString 转义点

python - 文章/api/文章 : Cannot import name ArticleResource 处出现导入错误
我正在尝试创建一个 Django 网站，每次在本地主机上运行/articles/api/article 页面时:我都会收到此回溯: Environment: Request Method: GET R
Facebook 开放图谱对象类型 - 文章？
我正在尽最大努力理解开放图谱协议(protocol)中的一切含义阅读 FB page在上面和 OGP Page .这在 FB 和 OGP 的世界中究竟意味着什么: Note that the Open
html - 页脚重叠内容/文章
我的 HTML/CSS 中存在页脚与文章内容重叠的问题。是的，我一直在网上搜索但似乎没有任何效果，我希望你知道它有什么问题。我在这里做了一个codepen: CodePen LINK
algorithm - 关于空间索引的好书/文章
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
javascript - 为什么函数中的变量没有传递给 HTML 文章？
我可以将变量作为警报显示在函数中，但无法将变量传递给文章。我做错了什么？我知道“a”保存了正确的信息，因为我已经通过警报显示了它。我尝试使用以下方式传递变量:placeholderContent.
ruby - Ruby 中的 A/An 文章
这个问题已经有答案了: Rails article helper - "a" or "an" (6 个回答) 已关闭 3 年前。是否有类似 [#pluralize in ActiveSupport]
ruby - Ruby 中的 A/An 文章
这个问题已经有答案了: Rails article helper - "a" or "an" (6 个回答) 已关闭 3 年前。是否有类似 [#pluralize in ActiveSupport]
mysql - 书籍-文章-图像的数据库架构建议
我有以下型号。 Book has Articles (Article has foreign key to Book) Article has Images (Article has upto #ma
php - 如何过滤多个类别并显示它的帖子/文章 PHP
我创建了一个页面，该页面显示了单个类别下的所有帖子，即如果我单击类别音乐，我将获得与音乐类别相关的所有文章。但我的目标是创建一个过滤选项，它可以过滤掉某些类别，并且只显示与您过滤的类别相关的所有帖
php - 关于从数据库中获取 Joomla 文章
我使用这样的代码: $query = "SELECT introtext FROM #__content WHERE alias = '$alias'"; $db->setQuery($query);
css - Joomla 文章/列插入填充
我在主页上设置了一些特色文章。显示的所有文章似乎都剩下太多填充。我知道足以进入 css 并在 layout.css 上编辑 .itembody 的填充或边距，但似乎没有任何改变。我希望我的文章通过模块
java - ORM:文章、修订和主要修订
ORM 中存储文章及其修订的最佳实践是什么？当我自己用SQL存储时，我曾经有以下结构: articles [id, parent_id, name, text] 通过parent_id，我可以轻松识
html - 输入单选激活时按类值激活显示 block 文章？
我的 HTML : Interest About Interest
javascript - mongodb 文章.长度未定义
我正在用jade构建一个nodejs、express、mongodb博客。我的文件夹结构是:项目/ 模块/ 观点/ 索引.jade 应用程序.js 文章提供者内存.js 文章provider-mon
string - 文章 "Matching"算法
我的问题比较具体，至少对我来说是这样。具体是因为在做了很多搜索之后我找不到任何有用的东西。因此，正如标题所说，我正在寻找一种算法，它会发现输入中给出的两篇文章是否“匹配”，但不是通常的字符串匹配意义上
algorithm - 理解动态规划的好例子、文章、书籍
关闭。这个问题是off-topic .它目前不接受答案。 9年前关闭。锁定。这个问题及其答案是locked因为这个问题是题外话，但具有历史意义。它目前不接受新的答案或互动。我无法弄清楚动态编程的原
css - 如何在两栏中 float 文章？
我有这个问题。我正在建立一个社交网站，我必须在两栏中创建帖子。父容器是一个部分，元素“post”是样式为 float: left 的文章。我如何让滑到那些较短的下方创建的空白空间的帖子？最佳答案 c
PHP - 从文件或数据库获取 HTML 文章？
这里有几个关于文件与数据库的问题，但我仍然不确定使用什么以及为什么在我的案例中应该使用它。我的网站上有很多 HTML 文章(长度在几百到几千字之间)。在数据库 (MySQL) 中，我有一个没有搜索索
文章《SemanticKernel--LangChain的替代品？》的错误和疑问探讨
微信公众号文章 Semantic Kernel —— LangChain 的替代品? [1] ，它使用的示例代码是Python ，他却发了这么一个疑问：支持的语言对比（因为 Sem
javascript - Polymer 中的循环 WordPress 文章
我想编写一个 polymer 元素来显示一些 WordPress 文章。 http://www.jsv-lippstadt.de/?json=get_category_posts&slug=app

首页

博学

6Ren·AI

商城

python - 使用每篇文章的第 5 行创建文本文件