Python 在另一个函数返回结果后结束函数-6ren

Python 在另一个函数返回结果后结束函数

转载作者：太空宇宙更新时间：2023-11-04 02:38:16

24

4

我可能处理这一切都是错误的，但这仍然是我所处的位置。我尝试搜索的日志文件非常大，在某些情况下高达 30gb。我正在编写一个脚本来提取信息，并且一直在使用多进程来加快速度。现在我正在测试同时运行两个函数以从顶部和底部搜索以获得结果，这似乎有效。我想知道是否有可能停止一个功能的结果是另一个。例如，如果 top 函数找到结果，它们都会停止。这样我就可以根据需要构建它。

from file_read_backwards import FileReadBackwards
from multiprocessing import Process
import sys

z = "log.log"

#!/usr/bin/env python
rocket = 0

def top():
    target = "test"
    with open(z) as src:
        found= None
        for line in src:
            if len(line) == 0: break #happens at end of file, then stop loop
            if target in line:
                found= line
                break
    print(found)

def bottom():
    target = "text"
    with FileReadBackwards(z) as src:
        found= None
        for line in src:
            if len(line) == 0: break #happens at end of file, then stop loop
            if target in line:
                found= line
                break
    print(found)


if __name__=='__main__':
     p1 = Process(target = top)
     p1.start()
     p2 = Process(target = bottom)
     p2.start()

最佳答案

这是我在评论中提到的方法的概念验证:

import os
import random
import sys
from multiprocessing import Process, Value


def search(proc_no, file_name, seek_to, max_size, find, flag):
    stop_at = seek_to + max_size

    with open(file_name) as f:
        if seek_to:
            f.seek(seek_to - 1)
            prev_char = f.read(1)
            if prev_char != '\n':
                # Landed in the middle of a line. Skip back one (or
                # maybe more) lines so this line isn't excluded. Start
                # by seeking back 256 bytes, then 512 if necessary, etc.
                exponent = 8
                pos = seek_to
                while pos >= seek_to:
                    pos = f.seek(max(0, pos - (2 ** exponent)))
                    f.readline()
                    pos = f.tell()
                    exponent += 1

        while True:
            if flag.value:
                break
            line = f.readline()
            if not line:
                break  # EOF
            data = line.strip()
            if data == find:
                flag.value = proc_no
                print(data)
                break
            if f.tell() > stop_at:
                break


if __name__ == '__main__':
    # list.txt contains lines with the numbers 1 to 1000001
    file_name = 'list.txt'
    info = os.stat(file_name)
    file_size = info.st_size

    if len(sys.argv) == 1:
        # Pick a random value from list.txt
        num_lines = 1000001
        choices = list(range(1, num_lines + 1))
        choices.append('XXX')
        find = str(random.choice(choices))
    else:
        find = sys.argv[1]

    num_procs = 4
    chunk_size, remainder = divmod(file_size, num_procs)
    max_size = chunk_size + remainder
    flag = Value('i', 0)
    procs = []

    print(f'Using {num_procs} processes to look for {find} in {file_name}')

    for i in range(num_procs):
        seek_to = i * chunk_size
        proc = Process(target=search, args=(i + 1, file_name, seek_to, max_size, find, flag))
        procs.append(proc)

    for proc in procs:
        proc.start()

    for proc in procs:
        proc.join()

    if flag.value:
        print(find, 'found by proc', flag.value)
    else:
        print(find, 'not found')

阅读有关使用多处理和多线程读取文件的各种帖子[1] 后，由于潜在的磁盘抖动和序列化读取，这两种方法似乎都不是一个好方法。所以这里有一个不同的、更简单的方法，它方式更快(至少对于我正在尝试的具有一百万行的文件而言):

import mmap
import sys

def search_file(file_name, text, encoding='utf-8'):
    text = text.encode(encoding)
    with open(file_name) as f:
        with mmap.mmap(f.fileno(), 0, flags=mmap.ACCESS_READ, prot=mmap.PROT_READ) as m:
            index = m.find(text)
            if index > -1:
                # Found a match; now find beginning of line that
                # contains match so we can grab the whole line.
                while index > 0:
                    index -= 1
                    if m[index] == 10:
                        index += 1
                        break
                else:
                    index = 0
                m.seek(index)
                line = m.readline()
                return line.decode(encoding)

if __name__ == '__main__':
    file_name, search_string = sys.argv[1:]
    line = search_file(file_name, search_string)
    sys.stdout.write(line if line is not None else f'Not found in {file_name}: {search_string}\n')

我很好奇这对于 30GB 的日志文件会如何执行。

[1] 包括this one

关于Python 在另一个函数返回结果后结束函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47319674/

24

4

0

文章推荐： python - 在 python re 中分隔字符串中的第一个单词

文章推荐： html - 响应式网站 : Faulty Logo and Banner Wrap, 导航栏

文章推荐： c - RAM_HIGH_ADRS 在 VxWorks BSP 中的真正含义是什么？

文章推荐： node.js - 在 Mongoose 中将字段设置为 null 时出错

naming-conventions - 开始 -> 结束 |停止 |结束？
我正在编写一个类，我想知道哪一对方法更适合描述流程周期: start() -> stop() start() -> end() start() -> finish() 基本上这些方法将在执行任务之前和
android - 小部件类名称什么时候以 "View"结束，什么时候以 "Layout"结束？
对于 Android 小部件类名称是否应以“View”、“Layout”或两者都不结尾，是否存在模式或命名约定？最佳答案如果该类扩展了 View(或在其层次结构中扩展了 View)，那么它应该以“
VIM 高亮匹配开始/结束
我正在尝试找到一个插件，该插件将使用 Verilog 突出显示匹配的开始/结束语句。 VIM 让它与花括号/括号一起工作，但它不能与它的开始/结束一起工作。我希望 VIM 突出显示正确的开始到正确的结
matlab - 时间序列元胞数组中的数据总和(结束)
给出以下代码: % Generate some random data n = 10; A = cell(n, 1); for i=1:n A{i} = timeseries; A{i
javascript - 检测输入何时聚焦于开始/结束
我需要知道是否可以检测输入何时开始聚焦以及何时结束焦点 HTML 代码: JQuery 代码(仅示例我如何需要它): $('.datas').on('focusStart', alert("fo
Java，结束 JFrame
所以我一直在思考一款游戏的想法，一款需要穿越时空的游戏。因此，我编写了一个 JFrame 来显示螺旋的 .gif，但它并没有在对话框显示时结束，而是保留在后台。我可以解决这个问题吗？ import j
java - 我的程序没有以执行器返回/结束
给出以下使用多线程的 Java 示例: import java.util.concurrent.*; public class SquareCalculator { private Ex
java - 结束 do-while 循环
好吧，我有一个 do-while 循环，应该在使用点击“q”时结束，但它给了我错误消息，请帮忙。 package Assignments; import java.util.*; public cla
regex - 正则表达式可选匹配行的开始/结束
我如何有选择地匹配开始 ^或结束 $正则表达式中的一行？例如: /(?\\1', $str); 我的字符串开头和结尾处的粗体边缘情况没有被匹配。我在使用其他变体时遇到的一些极端情况包括字符串内匹配、
java - 结束 while 循环的问题
我试图让程序在总数达到 10 时结束，但由于某种原因，我的 while 循环在达到 10 时继续计数。一旦回答了 10 个问题，我就有 int 百分比来查找百分比。 import java.util.
jquery - 结束()函数
jQuery 中的 end() 函数将元素集恢复到上次破坏性更改之前的状态，因此我可以看到它应该如何使用，但我已经看到了一些代码示例，例如:on alistapart (可能来自旧版本的 jQuery
javascript - 如何知道一个字符串以javascript中的特定字符开始/结束？
这个问题在这里已经有了答案: How to check if a string "StartsWith" another string? (18 个答案) 关闭 9 年前。 var file =
postgresql - 工作停顿(结束)
我正在尝试在 travis 上设置两个数据库，但它只是在 before_install 声明的中途停止: (END) No output has been received in the last 1
mysql - 结束 while 循环缺少分号
我创建了一个简单的存储过程，它循环遍历一个表的行并将它们插入到另一个表中。由于某种原因，END WHILE 循环抛出缺少分号错误。所有代码对我来说都是正确的，并且所有分隔符都设置正确。我只是不明白为什
ios - AVSpeechSynthesis 结束
您好，我正在使用 AVSpeechSynthesizer 和 AVSpeechUtterance 构建一个 iOS 7 应用程序，我想弄清楚合成何时完成。更具体地说，我想在合成结束时更改播放/暂停按钮
javascript - 响应后调用提醒。结束
这是我的代码，我试图在响应后显示警报。但没有显示操作系统警报 string filepath = ConfigurationManager.AppSettings["USPPath"].ToStri
python - 遍历日历月的开始/结束
我想创建一个循环，在提供的时间段、第一天和最后一天返回每个月(考虑到月份在第 28-31 天结束):(“function_to_increase_month”尚未定义) for beg in pd.d
python - 结束 while 循环
我目前正在用 Python 3.6 为一个骰子游戏编写代码，我知道我的编码在这方面有点不对劲，但是，我真的只是想知道如何开始我的 while 循环。游戏说明如下…… 人类玩家与计算机对战。玩家 1
android - 结束 fragment
所以我已经了解了如何打开 fragment。这是我的困境。我的 view 旁边有一个元素列表(元素周期表元素)。当您选择一个元素时，它会显示它的信息。我的问题是我需要能够从(我们称之为详细信息 fr
javascript - 检测滚动完成/结束
我想检测用户何时停止滚动页面/元素。这可能很棘手，因为最近对 OSX 滚动行为的增强创造了这种新的惯性效应。是否触发了事件？我能想到的唯一其他解决方案是在页面/元素的滚动位置不再改变时使用间隔来拾取

首页

博学

6Ren·AI

商城

Python 在另一个函数返回结果后结束函数