go - Golang中的并发积分计算-6ren

go - Golang中的并发积分计算

转载作者：IT王子更新时间：2023-10-29 01:24:03

26

4

我尝试同时计算积分，但我的程序最终比使用普通 for 循环计算积分慢。我做错了什么？

package main

import (
    "fmt"
    "math"
    "sync"
    "time"
)

type Result struct {
    result float64
    lock sync.RWMutex
}

var wg sync.WaitGroup
var result Result

func main() {
    now := time.Now()
    a := 0.0
    b := 1.0
    n := 100000.0
    deltax := (b - a) / n
    wg.Add(int(n))
    for i := 0.0; i < n; i++ {
        go f(a, deltax, i)
    }
    wg.Wait()
    fmt.Println(deltax * result.result)
    fmt.Println(time.Now().Sub(now))
}

func f(a float64, deltax float64, i float64) {
    fx := math.Sqrt(a + deltax * (i + 0.5))
    result.lock.Lock()
    result.result += fx
    result.lock.Unlock()
    wg.Done()
}

最佳答案

3- 为了提高性能，您可以在不使用 lock sync.RWMutex 的情况下按 CPU 内核划分任务:

+30x 使用 channel 和 runtime.NumCPU() 进行优化，这在 2 个内核上需要 2ms 和 993µs 在 8 核上，而您的示例代码在 2 核上花费了 61ms，在 8 核上花费了 40ms:

查看此工作示例代码和输出:

package main

import (
    "fmt"
    "math"
    "runtime"
    "time"
)

func main() {
    nCPU := runtime.NumCPU()
    fmt.Println("nCPU =", nCPU)
    ch := make(chan float64, nCPU)
    startTime := time.Now()
    a := 0.0
    b := 1.0
    n := 100000.0 
    deltax := (b - a) / n

    stepPerCPU := n / float64(nCPU)
    for start := 0.0; start < n; {
        stop := start + stepPerCPU
        go f(start, stop, a, deltax, ch)
        start = stop
    }

    integral := 0.0
    for i := 0; i < nCPU; i++ {
        integral += <-ch
    }

    fmt.Println(time.Now().Sub(startTime))
    fmt.Println(deltax * integral)
}

func f(start, stop, a, deltax float64, ch chan float64) {
    result := 0.0
    for i := start; i < stop; i++ {
        result += math.Sqrt(a + deltax*(i+0.5))
    }
    ch <- result
}

2 核输出:

nCPU = 2
2.0001ms
0.6666666685900485

8 核输出:

nCPU = 8
993µs
0.6666666685900456

您的示例代码，2 核输出:

0.6666666685900424
61.0035ms

您的示例代码，8 核输出:

0.6666666685900415
40.9964ms

2- 要获得良好的基准统计数据，请使用大量样本(大 n):

正如您在此处看到的那样，使用 2 个内核，这在 2 个内核上需要 110ms，但在同一个 CPU 上使用 1 个内核，这需要 215ms，n := 10000000.0:

使用 n := 10000000.0 和单个 goroutine，请参阅此工作示例代码:

package main

import (
    "fmt"
    "math"
    "time"
)

func main() {
    now := time.Now()
    a := 0.0
    b := 1.0
    n := 10000000.0
    deltax := (b - a) / n
    result := 0.0
    for i := 0.0; i < n; i++ {
        result += math.Sqrt(a + deltax*(i+0.5))
    }
    fmt.Println(time.Now().Sub(now))
    fmt.Println(deltax * result)
}

输出:

215.0123ms
0.6666666666685884

使用 n := 10000000.0 和 2 个 goroutine，请参阅此工作示例代码:

package main

import (
    "fmt"
    "math"
    "runtime"
    "time"
)

func main() {
    nCPU := runtime.NumCPU()
    fmt.Println("nCPU =", nCPU)
    ch := make(chan float64, nCPU)
    startTime := time.Now()
    a := 0.0
    b := 1.0
    n := 10000000.0
    deltax := (b - a) / n

    stepPerCPU := n / float64(nCPU)
    for start := 0.0; start < n; {
        stop := start + stepPerCPU
        go f(start, stop, a, deltax, ch)
        start = stop
    }

    integral := 0.0
    for i := 0; i < nCPU; i++ {
        integral += <-ch
    }

    fmt.Println(time.Now().Sub(startTime))
    fmt.Println(deltax * integral)
}

func f(start, stop, a, deltax float64, ch chan float64) {
    result := 0.0
    for i := start; i < stop; i++ {
        result += math.Sqrt(a + deltax*(i+0.5))
    }
    ch <- result
}

输出:

nCPU = 2
110.0063ms
0.6666666666686073

1- Goroutines 的数量存在一个最佳点，从这个点开始增加 Goroutines 的数量并不会减少程序的执行时间:

在 2 核 CPU 上，使用以下代码，结果是:

nCPU: 1,          2,          4,         8,           16
Time: 2.1601236s, 1.1220642s, 1.1060633s, 1.1140637s, 1.1380651s

如您所见，从 nCPU=1 到 nCPU=2 时间减少足够大，但在这一点之后就不再多了，所以 nCPU=2 在 2 核 CPU 上是此示例代码的最佳点，因此在这里使用 nCPU := runtime.NumCPU() 就足够了。

package main

import (
    "fmt"
    "math"
    "time"
)

func main() {
    nCPU := 2 //2.1601236s@1 1.1220642s@2 1.1060633s@4 1.1140637s@8 1.1380651s@16
    fmt.Println("nCPU =", nCPU)
    ch := make(chan float64, nCPU)
    startTime := time.Now()
    a := 0.0
    b := 1.0
    n := 100000000.0
    deltax := (b - a) / n

    stepPerCPU := n / float64(nCPU)
    for start := 0.0; start < n; {
        stop := start + stepPerCPU
        go f(start, stop, a, deltax, ch)
        start = stop
    }

    integral := 0.0
    for i := 0; i < nCPU; i++ {
        integral += <-ch
    }

    fmt.Println(time.Now().Sub(startTime))
    fmt.Println(deltax * integral)
}

func f(start, stop, a, deltax float64, ch chan float64) {
    result := 0.0
    for i := start; i < stop; i++ {
        result += math.Sqrt(a + deltax*(i+0.5))
    }
    ch <- result
}

关于go - Golang中的并发积分计算，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39060899/

26

4

0

文章推荐： linux - cgo 交叉编译找不到库

文章推荐： php - 是否有类似于 setTimeout() (JavaScript) 的函数用于 PHP？

文章推荐： php - 正则表达式来检查字符串是否有中文字符

文章推荐： git - 如何结束文件 merge ？

并发
我正在尝试在多线程环境中实现某种累积逻辑；我想知道没有 lock 和 synchronized 关键字是否有更好/更快的方法来做到这一点？以下是我当前的代码: public class Concurr
并发 - 实现信号量的监视器
我需要帮助构建一个实现信号量的监视器，简单的 C 示例就可以。这是为了证明可以在任何可以使用信号量的地方使用监视器。最佳答案如果您说允许使用互斥锁/condvars，请检查: #include
JQuery .each() 并发
我已经构建了一些返回部分产品目录的 ajax，并且我正在尝试将 xml 输出到文档中，到目前为止，这是我所拥有的: $("#catalog").append("Item NamePriceDe
mysql 并发
很抱歉，如果我的问题之前已经被问过，或者它太明显了，但我真的需要澄清这一点。感谢您的帮助。在多用户界面中，如果来自不同用户的相同事务同时到达服务器，会发生什么？我有下一张表: create tab
Java程序输出——并发
这可能是一个愚蠢的问题，但是这个程序的输出(它的方式)可以为零吗？ public class Test2{ int a = 0; AtomicInteger b = new Atomi
Http请求/并发？
假设我本地主机上的一个网站处理每个请求大约需要 3 秒。这很好，正如预期的那样(因为它在幕后进行了一些奇特的网络)。但是，如果我在选项卡(在 firefox 中)中打开相同的 url，然后同时重新加
MongoDB 并发
我对 MongoDB 的读锁定有点困惑。单个集合可以支持多少个并发读取操作？最佳答案如 tk 给出的链接中所写:http://www.mongodb.org/pages/viewpage.acti
并发，4个CUDA应用竞争获取GPU资源
如果有四个并发的 CUDA 应用程序在一个 GPU 中竞争资源会发生什么这样他们就可以将工作卸载到图形卡上了？ Cuda Programming Guide 3.1 提到那里某些方法是异步的: 内核
spark学习之并行度、并发、core数和分区的关系
👊上次的百度面试遇到了关于spark的并发数的问题，今天我们就来将这些问题都一并解决一下，图画的的有点丑，还行大家见谅，百度实习的问题我放在了下面的链接👇：链接: 2022百度大数据开发工程师实
multithreading - Groovy 并发
我对 Groovy 线程有疑问。我的任务是以某种方式翻译给定目录中的每个文件并将生成的输出放在其他目录中的文件中。我编写了以下代码，该代码有效: static def translateDir(
java - 并发:同步与锁定
Java中的同步和锁定有什么区别？最佳答案 synchronized是语言关键字；锁是对象。当一个方法或代码块被标记为同步时，您是说该方法或代码块必须先获得某个锁对象(可以在同步的语法中指定)才能
并发 RPC 服务器
我需要创建一个能够同时处理来自客户端的多个请求的并发 RPC 服务器。使用 rpcgen linux编译器(基于sun RPC)，不支持-A为并发服务器创建 stub 的选项。 (-A 选项在 so
Java 并发 - 这有效吗？
System.out.println("Enter the number of what you would like to do"); System.out.println("1 = Manuall
ipad - 并发 UIAlertControllers
我正在将我的应用程序移植到 iOS 8.0 并注意到 UIAlertView 已被弃用。所以我改变了使用 UIAlertController 的方法。这在大多数情况下都有效。除了，当我的应用程序打
java - 并发 - 条件同步方法
我正在逐行同时读取两个文本文件。我特别想做的是当lineCount在每个线程上都是相同的我想看看扫描仪当前正在读取的字符串。我环顾四周寻找可以实现的某些模式，例如 Compare and Swap
Java 并发 - 中断策略
我正在阅读 Java Concurrency in Practice .在章节中断政策部分取消和关闭它提到 A task should not assume anything about the
c++ - 有没有比下面更好的方法来使用C++并发？
我正在尝试学习线程，互斥等的基础知识。遵循here的文档和示例。在下面的代码中，我得到预期的输出。问题: 想确认我是否有任何陷阱？我们如何改善下面的代码？我的线程在哪一行尝试获取互斥锁或正在等待互斥
multithreading - 并发、并行和异步方法有什么区别？
并发是指两个任务在不同的线程上并行运行。但是，异步方法并行运行，但在同一个线程上。这是如何实现的？另外，并行性怎么样？这三个概念有什么区别？最佳答案并发和并行实际上与您正确推测的原理相同，两者都
java - 并发:使用非同步方法更改变量
以此ConcurrentDouble类定义为例: public class ConcurrentDouble { public double num = 0; public void subt
java - 并发/多线程何时有助于提高性能？
在得知并发确实增加了许多人的吞吐量后，我一直计划在项目中使用并发。现在我在多线程或并发方面还没有做太多工作，因此决定在实际项目中使用它之前学习并进行简单的概念验证。以下是我尝试过的两个示例: 1.

首页

博学

6Ren·AI

商城

go - Golang中的并发积分计算