python - 我应该如何在 Python 中逐行读取文件？-6ren

python - 我应该如何在 Python 中逐行读取文件？

转载作者：IT老高更新时间：2023-10-28 12:32:41

32

4

在史前时代(Python 1.4)我们做到了:

fp = open('filename.txt')
while 1:
    line = fp.readline()
    if not line:
        break
    print(line)

在 Python 2.1 之后，我们做到了:

for line in open('filename.txt').xreadlines():
    print(line)

在我们在 Python 2.3 中获得方便的迭代器协议(protocol)之前，可以这样做:

for line in open('filename.txt'):
    print(line)

我见过一些使用更详细的例子:

with open('filename.txt') as fp:
    for line in fp:
        print(line)

这是 future 的首选方法吗？

[edit] 我知道 with 语句可以确保关闭文件...但是为什么文件对象的迭代器协议(protocol)中没有包含它？

最佳答案

以下是首选的原因之一:

with open('filename.txt') as fp:
    for line in fp:
        print(line)

我们都被 CPython 用于垃圾收集的相对确定性的引用计数方案宠坏了。其他假设的 Python 实现如果使用其他方案来回收内存，则在没有 with block 的情况下不一定会“足够快地”关闭文件。

在这样的实现中，如果您的代码打开文件的速度快于垃圾收集器在孤立文件句柄上调用终结器的速度，您可能会从操作系统收到“打开的文件过多”错误。通常的解决方法是立即触发 GC，但这是一个讨厌的 hack，必须由可能遇到错误的每个函数完成，包括库中的函数。真是一场噩梦。

或者你可以只使用 with block 。

奖金问题

(如果只对问题的客观方面感兴趣，请立即停止阅读。)

Why isn't that included in the iterator protocol for file objects?

这是一个关于 API 设计的主观问题，所以我有两个部分的主观答案。

从直觉上看，这感觉是错误的，因为它让迭代器协议(protocol)做两件独立的事情——遍历行和关闭文件句柄——而且制作一个看起来简单的东西通常是个坏主意函数做两个 Action 。在这种情况下，感觉特别糟糕，因为迭代器以准功能、基于值的方式与文件内容相关，但管理文件句柄是一项完全独立的任务。将两者无形地压缩到一个 Action 中，对于阅读代码的人来说是令人惊讶的，并且使推理程序行为变得更加困难。

其他语言基本上也得出了相同的结论。 Haskell 曾短暂使用过所谓的“惰性 IO”，它允许您遍历文件并在到达流的末尾时自动关闭它，但现在几乎普遍不鼓励在 Haskell 和 Haskell 中使用惰性 IO用户大多转向更明确的资源管理，如 Conduit，其行为更像 Python 中的 with block 。

在技术层面上，您可能希望对 Python 中的文件句柄执行一些操作，如果迭代关闭文件句柄，这些操作将无法正常工作。例如，假设我需要对文件进行两次迭代:

with open('filename.txt') as fp:
    for line in fp:
        ...
    fp.seek(0)
    for line in fp:
        ...

虽然这是一个不太常见的用例，但请考虑这样一个事实，即我可能刚刚将底部的三行代码添加到最初具有顶部三行的现有代码库中。如果迭代关闭了文件，我将无法做到这一点。因此，将迭代和资源管理分开可以更容易地将代码块组合成一个更大的、可运行的 Python 程序。

可组合性是语言或 API 最重要的可用性特性之一。

关于python - 我应该如何在 Python 中逐行读取文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11555468/

32

4

0

文章推荐： linux - 使用 logrotate 每小时轮换文件？

文章推荐： C++ 创建文本和变量的字符串

文章推荐： c++ - C++ 中的多重分派(dispatch)

elasticsearch - 应该+ ElasticSearch中的distance_function
我正在尝试在Elasticsearch中返回的值中考虑地理位置的接近性。我希望近距离比某些字段(例如legal_name)重要，但比其他字段重要。从文档看来，当前的方法是使用distance_fea
php - 在Elasticsearch中处理必须/应该
我是Elasticsearch的初学者，今天在进行“多与或”查询时遇到问题。我有一个SQL查询，需要在Elastic中进行转换: WHERE host_id = 999 AND psh_pid =
c++ - 应该/可以在函数中通过引用传递智能指针
智能指针应该/可以在函数中通过引用传递吗？即: void foo(const std::weak_ptr& x) 最佳答案当然你可以通过const&传递一个智能指针。这样做也是有原因的: 如果接
elasticsearch - '应该' bool 查询获取不需要的结果
我想执行与以下MYSQL查询等效的查询 SELECT http_user, http_req_method, dst dst_port count(*) as total FROM my_table
Elasticsearch:应该 + minimum_should_match 与必须
我用这两个查询进行测试用must查询 { "size": 200, "from": 0, "query": { "bool": { "must": [ { "mat
android - 我如何(应该)将处理程序添加到服务中的线程
我仍在研究 Pro Android 2 的简短服务示例(第 304 页)同样，服务示例由两个类组成:如下所示的 BackgroundService.java 和如下所示的 MainActivity.j
html - 当引入水平滚动时，*应该*如何呈现此内容？
给定标记 like this : header really_wide_table..........................................
javascript - ChaiJS 应该 - 测试空字符串
根据 shouldJS 上的文档网站我应该能够做到这一点: ''.should.be.empty(); ChaiJS网站没有使用 should 语法的示例，但它列出了 expect 并且上面的示例似乎
c - 必须(应该)避免使用标准库中的哪些函数？
我在 Stack Overflow 上读到一些 C 函数是“过时的”或“应该避免”。你能给我一些这种功能的例子以及原因吗？这些功能有哪些替代方案？我们可以安全地使用它们 - 有什么好的做法吗？最
c++11 - 省略号可以/应该/将适用于元组吗？
在 C++11 中，可变参数模板允许使用任意数量的参数和省略号运算符 ... 调用函数。允许该可变参数函数对每个参数做一些事情，即使每个参数的事情不是一样的: template void dummy(
ruby-on-rails - 应该:测试validates_presence_of:on =>:update
我在我从事的项目之一上将Shoulda与Test::Unit结合使用。我遇到的问题是我最近更改了此设置: class MyModel :update end 以前，我的(通过)测试看起来像这样: c
chai - 如何在 chai 中做一个 "or"应该
我该如何做 or使用 chai.should 进行测试? 例如就像是 total.should.equal(4).or.equal(5) 或者 total.should.equal.any(4,5)
Mercurial - .hgtags 应该 merge 吗？
如果您要将存储库 B 中的更改 merge 到存储库 A 中，是否应该 merge .hgtags 中的更改？存储库 B 可能具有 A 中没有的标签 1.01、1.02、1.03。为什么要将这些 m
elasticsearch - 带有Must(and)应该(或)不产生期望结果的Elasticsearch查询
我正在尝试执行X AND(y OR z)的查询我需要获得该代理为上市代理或卖方的所有已售属性(property)。我只用 bool(boolean) 值就可以得到9324个结果。当我添加 bool
javascript - Mocha/应该 'undefined is not a function'
我要离开 this教程，尝试使用 Mocha、Supertest 和 Should.js 进行测试。我有以下基本测试来通过 PUT 创建用户接受 header 中数据的端点。 describe('U
java - JUnit:可以(应该)这样做吗？
我正在尝试为 Web 应用程序编写一些 UI 测试，但有一些复杂的问题希望您能帮助我解决。首先，该应用程序有两种模式。其中一种模式是“训练”，另一种是“现场”。在实时模式下，数据直接从我们的数据库中
ruby-on-rails - 应该 helper 不工作
我有一个规范: require 'spec_helper' # hmm... I need to include it here because if I include it inside desc
ruby-on-rails - 行动有效，但测试无效(应该)
我正在尝试用这个测试我在 Rails 中的更新操作: context "on PUT to :update" do setup do @countdown = Factory(:count
html - 应该 &'s be escaped in onclick="...”？
我还没有找到合适的答案: onclick="..." 中是否应该转义 &(& 符号)？ (或者就此而言，在每个 HTML 属性中？) 我已经尝试在 jsFiddle 和 W3C 的验证器上运行转义和非
java - 应该 move 球的程序，但不执行方法运行
import java.applet.*; import java.awt.*; import java.awt.event.*; public class Main extends Applet i

首页

博学

6Ren·AI

商城

python - 我应该如何在 Python 中逐行读取文件？

奖金问题