javascript - 从任意行 X 开始读取超长文件的最快方法-6ren

javascript - 从任意行 X 开始读取超长文件的最快方法

转载作者：行者123 更新时间：2023-12-02 14:47:12

29

4

我有一个文本文件，由 python 程序写入，然后由另一个程序读入以显示在网络浏览器上。目前它是通过 JavaScript 读取的，但我可能会将此功能移至 python，并使用 ajax 请求将结果传递到 javascript。

该文件不定期更新，有时追加一行，有时多达十行。然后，我需要将文件的更新副本获取为 javascript，以便在 Web 浏览器中显示。该文件可能会增长到 100,000 行。新数据始终添加到文件末尾。

因为它是当前写入的，javascript每秒检查一次文件的长度，如果文件比上次读入的长度长，它会再次读入，开始从一开始，对于 10,000 多行的文件来说，这很快就会变得难以处理。加倍如此，因为程序有时可能需要每秒更新一次文件。

在javascript中将数据显示到前端最快/最有效的方法是什么？

我想我可以:

跟踪文件之前的行数，下次只从文件中的该点读取。
让一个程序将数据直接传递给另一个程序，而无需读取中间文件(尽管该文件仍必须作为永久日志写入以供以后访问)

每种方法都有具体的好处/问题吗？我如何最好地实现它们？

对于方法 #1，我宁愿不在 for 循环中执行 file.next() 15,000 次来到达我想要开始读取文件的位置，有更好的方法吗？

对于方法#2，由于无论如何我都需要写入文件，因此不读取它是否可以节省大量处理时间？

也许还有其他我没有考虑过的方法？

摘要:该程序需要在网络浏览器中显示来自 python 的数据，这些数据不断更新，并且可能会增长长达 100k 行。由于我每 1 秒检查一次更新，因此它需要高效，以防万一它必须连续进行大量更新。

最佳答案

您要查找的函数是seek。 From the docs:

f.seek(offset, from_what)

The position is computed from adding offset to a reference point; the reference point is selected by the from_what argument. A from_what value of 0 measures from the beginning of the file, 1 uses the current file position, and 2 uses the end of the file as the reference point. from_what can be omitted and defaults to 0, using the beginning of the file as the reference point.

Python 3 的限制:

In text files (those opened without a b in the mode string), only seeks relative to the beginning of the file are allowed (the exception being seeking to the very file end with seek(0, 2)) and the only valid offset values are those returned from the f.tell(), or zero. Any other offset value produces undefined behaviour.

请注意，查找特定行很棘手，因为行的长度可以是可变的。相反，记下文件中的当前位置 (f.tell())，然后返回该位置。

关于javascript - 从任意行 X 开始读取超长文件的最快方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36511097/

29

4

0

文章推荐： javascript - 使用 jQuery.html 设置带有提交按钮的表单

文章推荐： javascript - 带有 ng-repeat 的 AngularJS 依赖下拉菜单

文章推荐： javascript - 继续之前等待 AJAX 响应

文章推荐： javascript - 想要使用 document.getelementbyid 显示两个变量

Python:Pandas 读取 csv:读取 csv 时向下转换
我遇到以下问题。我想读取一个包含数百万行和数百列的大型 csv。我想向下转换列的数据类型。我的方法是读取 csv，然后使用 pd.to_numeric() 对其进行向下转换。我不知道列数及其类型。在读
c# - 从 SQL Server 读取 - 需要从 CSV 读取
目前，我从 SQL server (2008) 数据库获取数据。 cyurrent的方法是使用DataTable，然后将其传递并使用。 if (parameters != null)
python - Dask 读取 csv 与 pandas 读取 csv
我有以下问题。我有一个巨大的 csv 文件，想用多处理加载它。对于一个包含 500000 行和 130 列不同数据类型的示例文件，Pandas 需要 19 秒。我试过 dask 因为我想多处理阅读。但
java - 读取 VC++ CArchive 二进制格式(或 Java 读取 (CObArray))
是否有关于用于序列化各种 MFC 数据结构的二进制格式的明确文档？我已经能够在十六进制编辑器中查看我自己的一些类，并使用 Java 的 ByteBuffer 类读取它们(使用自动字节顺序转换等)。但
javascript - 是否可以使用 javascript 读取 something.properties ？ (在 .hta 文件中)>> 读取 Selenium
我正在使用 Selenium 进行测试，我们用 HTML 文件编写测试用例，并用它们制作测试套件，我们的要求是编写足够健壮的测试用例，以根据测试环境改变自身。为此，我不希望在 HTML 脚本本身中包
读取.txt文件的Javascript代码
我需要一个 JavaScript 代码来读取存储为 .txt 文件的字典(或者也可以保存为任何其他类型的文件。它也可以在线获得)并将其内容存储在一个变量中。我不能找到一种让 JavaScript 像
java - 读取/过滤文本文件的最快方法是什么
我正在尝试遍历包含 SSH 登录和其他日志的日志文本文件。程序正在返回 SSH 登录的总数。我的解决方案确实有效，但似乎有点慢(在 200mo 文件上大约需要 3.5 秒)。我想知道是否有任何方法
vba - 读取/写入大量数据
我正在将大量数据从一个电子表格复制到工作簿中的其他 160 个电子表格。目前，Excel (2013) 遇到错误，因为它没有足够的资源来完成操作。我的目标是将工作表 4 中 V13:XI1150 范
VBA 读取/搜索文本文件
我正在尝试读取一个有 1147 行的文本文件。下面的代码仅读取第 1050-1147 行。我的目标是读取整个文件并提取位于不同行的特定值以在脚本中使用。一个示例是包含“BlockList: 2”的行中
Prolog 用户输入的时间限制(读取)
我正在为游戏编写解释器。用户将其移动输入解释器，程序执行该移动。现在我想为每个决定实现一个时间限制。玩家不应该能够思考超过 30 秒来写一个移动并按下回车。 call_with_time_limit
读取 HITRAN 文件格式
以this file例如，我正在尝试读取 data.frame 中的数据。来自 the doc (pdf 文件，表 1)，它遵循一些 fortran 约定。我尝试了以下但收效甚微: dir 0' 将
读取 R 的电子邮件附件
我正在使用 R 阅读 Outlook 附件。我的引用在这里:Download attachment from an outlook email using R 这是我的电子邮件的截图: 这每天都会发送
php xmlrpc 读取
我不会从表格中读取行来将主题放在列表中 php脚本 $url_obj='http://'.$host.':8069/xmlrpc/object'; $sock=new xmlrpc_client($u
读取 csv 但跳过字符串中的转义逗号
我有一个这样的 csv 文件: id,name,value 1,peter,5 2,peter\,paul,3 我如何读取此文件并告诉 R "\," 不表示新列，仅表示 ","。我必须添加该文件
macos - 读取 plist
我正在尝试读取 ~/Library/Preferences/com.apple.mail.plist (在 Snow Leopard 上)以获取电子邮件地址和其他信息以进入“关于”对话框。我使用以下代
bash - 读取 float
This question already has answers here: How do I use floating-point division in bash? (19个回答) 5个月前关闭
COBOL 读取/存储在表中
本练习的目标是读取输入文件并将其存储到表中，然后验证输入中的某些字段并输出任何错误记录。我需要读取并存储每个策略组，以便表中一次仅存储 5 条记录，而不是整个文件。所以我需要读取一个包含 5 条记录
Cassandra LWT 读取
据我了解，LWT 插入始终以 SERIAL 一致性级别完成。如果为 true，这是否意味着读取作为 LWT 插入的行可以安全地以 ANY 的一致性级别读取？换句话说，我假设 LWT 插入是完全一致的
JavaScript:读取 cookie
我看到很多很多通过java脚本读取cookie的函数，但我只想在变量中使用它一次，我是JS新手。这是我的代码 var TheNumber = (Math.random() + '') * 10000
c# - 读取.net中的程序集
我正在使用 asp.net 和 C#。我在服务器上部署了一个应用程序[已发布]，现在我想查看该网站的代码，据我所知，我可以阅读程序集来查看代码。请告诉我如何实现它。提前致谢。最佳答案您可以使用

首页

博学

6Ren·AI

商城

javascript - 从任意行 X 开始读取超长文件的最快方法