python - Python请求-临时端口耗尽-6ren

python - Python请求-临时端口耗尽

转载作者：行者123 更新时间：2023-12-03 12:04:25

我可以对以下代码进行任何处理(我认为 session 可以解决此问题？)，以防止每个GET请求都创建新的TCP连接吗？我每秒遇到大约1000个请求，并且在大约10,000个请求用完套接字后:

def ReqOsrm(url_input):
    ul, qid = url_input
    conn_pool = HTTPConnectionPool(host='127.0.0.1', port=5005, maxsize=1)
    try:
        response = conn_pool.request('GET', ul)
        json_geocode = json.loads(response.data.decode('utf-8'))
        status = int(json_geocode['status'])
        if status == 200:
            tot_time_s = json_geocode['route_summary']['total_time']
            tot_dist_m = json_geocode['route_summary']['total_distance']
            used_from, used_to = json_geocode['via_points']
            out = [qid, status, tot_time_s, tot_dist_m, used_from[0], used_from[1], used_to[0], used_to[1]]
            return out
        else:
            print("Done but no route: %d %s" % (qid, req_url))
            return [qid, 999, 0, 0, 0, 0, 0, 0]
    except Exception as err:
        print("%s: %d %s" % (err, qid, req_url))
        return [qid, 999, 0, 0, 0, 0, 0, 0]

# run:
pool = Pool(int(cpu_count()))
calc_routes = pool.map(ReqOsrm, url_routes)
pool.close()
pool.join()

HTTPConnectionPool(host='127.0.0.1', port=5005): Max retries exceeded with url: /viaroute?loc=44.779708,4.2609877&loc=44.648439,4.2811959&alt=false&geometry=false (Caused by NewConnectionError(': Failed to establish a new connection: [WinError 10048] Only one usage of each socket address (protocol/network address/port) is normally permitted',))

埃里克-非常感谢您的回复，我认为这正是我所需要的。但是，我不能完全正确地对其进行修改。该代码在前几个周期中正确返回了10,000个响应，但是随后似乎中断并返回了少于10,000个，这使我认为我错误地实现了Queue？

ghost = 'localhost'
gport = 8989

def CreateUrls(routes, ghost, gport):
    return [
        ["http://{0}:{1}/route?point={2}%2C{3}&point={4}%2C{5}&vehicle=car&calc_points=false&instructions=false".format(
            ghost, gport, alat, alon, blat, blon),
            qid] for qid, alat, alon, blat, blon in routes]


def LoadRouteCSV(csv_loc):
    if not os.path.isfile(csv_loc):
        raise Exception("Could not find CSV with addresses at: %s" % csv_loc)
    else:
        return pd.read_csv(csv_loc, sep=',', header=None, iterator=True, chunksize=1000 * 10)

class Worker(Process):
    def __init__(self, qin, qout, *args, **kwargs):
        super(Worker, self).__init__(*args, **kwargs)
        self._qin = qin
        self._qout = qout

    def run(self):
        # Create threadsafe connection pool
        conn_pool = HTTPConnectionPool(host=ghost, port=gport, maxsize=10)

        class Consumer(threading.Thread):
            def __init__(self, qin, qout):
                threading.Thread.__init__(self)
                self.__qin = qin
                self.__qout = qout

            def run(self):
                while True:
                    msg = self.__qin.get()
                    ul, qid = msg
                    try:
                        response = conn_pool.request('GET', ul)
                        s = float(response.status)
                        if s == 200:
                            json_geocode = json.loads(response.data.decode('utf-8'))
                            tot_time_s = json_geocode['paths'][0]['time']
                            tot_dist_m = json_geocode['paths'][0]['distance']
                            out = [qid, s, tot_time_s, tot_dist_m]
                        elif s == 400:
                            print("Done but no route for row: ", qid)
                            out = [qid, 999, 0, 0]
                        else:
                            print("Done but unknown error for: ", s)
                            out = [qid, 999, 0, 0]
                    except Exception as err:
                        print(err)
                        out = [qid, 999, 0, 0]
                    self.__qout.put(out)
                    self.__qin.task_done()

        num_threads = 10
        [Consumer(self._qin, self._qout).start() for _ in range(num_threads)]

if __name__ == '__main__':
    try:
        with open(os.path.join(directory_loc, 'gh_output.csv'), 'w') as outfile:
            wr = csv.writer(outfile, delimiter=',', lineterminator='\n')
            for x in LoadRouteCSV(csv_loc=os.path.join(directory_loc, 'gh_input.csv')):
                routes = x.values.tolist()
                url_routes = CreateUrls(routes, ghost, gport)
                del routes

                stime = time.time()

                qout = Queue()
                qin = JoinableQueue()
                [qin.put(url_q) for url_q in url_routes]
                [Worker(qin, qout).start() for _ in range(cpu_count())]
                # Block until all urls in qin are processed
                qin.join()
                calc_routes = []
                while not qout.empty():
                    calc_routes.append(qout.get())

                # Time diagnostics
                dur = time.time() - stime
                print("Calculated %d distances in %.2f seconds: %.0f per second" % (len(calc_routes),
                                                                                    dur,
                                                                                    len(calc_routes) / dur))
                del url_routes
                wr.writerows(calc_routes)
                done_count += len(calc_routes)
                # Continually update progress in terms of millions
                print("Saved %d calculations" % done_count)

最佳答案

我在想更多这样的事情。这个想法是为每个内核生成一个进程，为每个进程生成一个线程池。每个进程都有一个单独的连接池，该连接池在该进程的线程之间共享。我认为没有某种线程就无法获得性能更高的解决方案。

from multiprocessing import Pool, cpu_count
import Queue

from urllib3 import HTTPConnectionPool
import threading


def ReqOsrm(url_input):
    # Create threadsafe connection pool
    conn_pool = HTTPConnectionPool(host='127.0.0.1', port=5005, maxsize=1000)

    # Create consumer thread class
    class Consumer(threading.Thread):
        def __init__(self, queue):
            threading.Thread.__init__(self)
            self._queue = queue

        def run(self):
          while True:
              msg = self._queue.get()
              try:
                response = conn_pool.request('GET', url)
                print response
              except Exception as err:
                print err
              self._queue.task_done()

    # Create work queue and a pool of workers
    queue = Queue.Queue()
    num_threads = 20
    workers = []
    for _ in xrange(num_threads):
        worker = Consumer(queue)
        worker.start()
        workers.append(worker)

    for url in url_input:
        queue.put(url)

    queue.join()

url_routes = [
    ["/proc1-0", "/proc1-1"],
    ["/proc2-0", "/proc2-1"],
    ["/proc3-0", "/proc3-1"],
    ["/proc4-0", "/proc4-1"],
    ["/proc5-0", "/proc5-1"],
    ["/proc6-0", "/proc6-1"],
    ["/proc7-0", "/proc7-1"],
    ["/proc8-0", "/proc8-1"],
    ["/proc9-0", "/proc9-1"],
]

pool = Pool(int(cpu_count()))
calc_routes = pool.map(ReqOsrm, url_routes)
pool.close()
pool.join()

关于python - Python请求-临时端口耗尽，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35800131/

文章推荐： jsf - 如何使meta标签成为部分中的第一个标签？

Azure SNAT 耗尽 - 我如何知道它何时发生？
我们认为 Cloud Foundry 中的一组虚拟机存在 Azure SNAT 耗尽问题。这些机器不经过负载平衡器。我已经浏览过这份文件: https://learn.microsoft.com/e
java - GLES2 TouchEventPool 耗尽
我正在使用 onSceneTouchEvent 在 TMX map 上移动玩家: @Override public Scene onCreateScene() { ...
Python 子进程引用导致 fd 耗尽
关于这篇文章:Python del Statement , 我最近遇到了以下片段: # custom_process.py import threading import subprocess myL
python - 保留文件描述符以防止 FD 耗尽
我有一个具有多个线程的 python 应用程序，其中线程 2 到 n 可能会打开任意数量的文件。我想确保当线程 1 尝试打开文件时，它绝对不会因为文件描述符耗尽而失败。简而言之，我想保留文件描述符而不
c# 多线程应用程序中的 TCP 耗尽
我开发了一个 c# .net 4 应用程序，它每天对组织中的每台计算机(超过 70,000 台)执行 WMI 查询。由于与此线程无关的原因，我无法从服务器运行该应用程序，而是从我的 Windows X
python - pytorch 耗尽 GPU 内存
我正在尝试在 pytorch 中实现 Yolo-v2。但是，我似乎只是通过网络传递数据而耗尽了内存。该模型很大，如下所示。但是，我觉得我在用我的网络做一些愚蠢的事情(比如不在某处释放内存)。网络在 c
android - 如何在 Android 中进行应用程序明智的电池使用/耗尽
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
Python Postgres psycopg2 ThreadedConnectionPool 耗尽
我在这里查看了几个与“太多客户”相关的主题，但仍然无法解决我的问题，所以我必须针对我的具体情况再次询问。基本上，我设置了本地 Postgres 服务器并需要进行数万次查询，所以我使用了 Python
c++ - 耗尽 std::random_device 的熵
我正在使用 std::random_device 并想检查它的剩余熵。根据 cppreference.com: std::random_device::entropy double entropy()
macos - docker 卷上的 inode 耗尽
我有以下 docker-compos.yml 文件: web: build: . ports: - "4200:4200" - "35729:35729" vo
linux - Linux 中的进程 ID 耗尽
如果 Linux 操作系统用完进程 ID 会怎样？是否会删除较旧的进程以释放空间以适应 future 的请求？最佳答案我假设您问的是达到进程限制时会发生什么。在这种情况下，系统不允许创建新进程，直
azure-sql-database - 创建新索引时防止 DTU 耗尽
我们将 Azure SQL 用作单个数据库并在 DTU 定价模型下使用。我们有一个包含约 50M 条记录的表，我们想在单个字符串属性上添加一个新的非聚集索引。问题是这是一个生产数据库。如果我使用简单
c# - Azure 服务总线监听器打开太多 TCP 连接(耗尽)
我们有多个服务总线监听器在应用服务内作为连续的 Azure Webjobs 运行。总共有 12 个监听器 Web 作业在同一个 S1 应用服务计划上运行。环境很小，每天总共大约有~1000-10000
Azure WebApp SNAT 耗尽 - 私有(private)终结点能否改进
Der Azure 网络专家，我们的 Web 应用程序经常耗尽出站 TCP 连接。大多数出站连接实际上是 Azure 内部连接(SQL、BlobStore、后端服务)。但我们还没有虚拟网络和专用端点
c++ - 为什么需要 sleep(1) 来让 socket 耗尽？
我下载了一个简单的静态网络服务器的源代码 http://www.ibm.com/developerworks/systems/library/es-nweb/sidefile1.html 但是，我对第
ruby-on-rails - Rails Puma 耗尽 Redis 连接
我已经查看了有关 SO 的其他类似问题，但无法很好地将所有内容拼凑在一起。我有一个 Rails 应用程序(在 Heroku 上)，它使用具有多进程和多线程的 Puma。我的应用程序还使用 Redis
go - 为什么 request.ParseForm() 耗尽 request.Body？
在此代码中，如果我对 ParseForm() 调用进行注释，请求将按预期工作 package main import ( "fmt" "net/http" "net/url"
PHPExcel 耗尽 256、512 和 1024MB RAM
我不明白。 XSLX 表大约有 3MB 大，但即使是 1024MB 的 RAM 也不足以让 PHPExcel 将其加载到内存中吗？我这里可能做错了什么: function ReadXlsxTable
spring-integration - 使用 WebSphere MQ 耗尽 JMS 连接
我已配置 CachingConnectionFactory包装了一个 MQTopicConnectionFactory和 MQQueueConnectionFactory每个缓存大小设置为 10。这
php - 为什么 PHP Allowed memory size of 134217728 bytes 耗尽？
我正在检查 CodeEval 中的一些问题并在 PHP 中遇到这个奇怪的错误。我没有用其他语言遇到过这样的事情，所以我不知道为什么会发生这种情况。不包括整个答案(请不要帮我找到解决方案，除了 PHP

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - Python请求-临时端口耗尽