c - 双核 ARMv7 处理器中的并行处理-6ren

c - 双核 ARMv7 处理器中的并行处理

转载作者：行者123 更新时间：2023-12-03 12:45:48

28

4

我正在开发 Zedboard，它包含双核 ARM A9 处理器并运行 Linux。该板与外部 I/O 设备通信。

我有两个用“C”语言编写的函数，我必须并行运行它们。

一个函数调用 while 循环并不断将数据转储到外部设备，并将处理后的数据接收回内存指针。

另一个函数从指针位置读取数据，创建它的副本并执行计算密集型过程(例如 FFT、信号对齐等，速度很慢)。

外部设备需要每秒 1500 万个样本的数据。如果我只运行第一个函数并且它占用一个 ARM 内核的大约 70%，我就能实现。当我运行这两个函数时，两个 ARM 内核都达到了极限，我发现我无法以所需的采样速度向外部设备提供数据。

有没有一种方法可以限制独立内核中的两个功能(第二个功能很慢并不重要，但第一个功能的性能不能受到影响)并且仍然能够共享数据他们之间？

我尝试使用 OpenMP，但无法达到所需的性能。我阅读了有关 SCHED_SETAFFINITY 的内容，但在理解其实现时遇到了问题。

我已经使用 NEON 构造/库和 ARM 处理器的自动矢量化功能尽可能地优化了我的每个函数。

最佳答案

您可以将每个单独的线程设置为不同的核心:

 int sched_setaffinity(pid_t pid,size_t cpusetsize,cpu_set_t *mask);

来自手册页:

Description

A process's CPU affinity mask determines the set of CPUs on which it is eligible to run. On a multiprocessor system, setting the CPU affinity mask can be used to obtain performance benefits. For example, by dedicating one CPU to a particular process (i.e., setting the affinity mask of that process to specify a single CPU, and setting the affinity mask of all other processes to exclude that CPU), it is possible to ensure maximum execution speed for that process. Restricting a process to run on a single CPU also avoids the performance cost caused by the cache invalidation that occurs when a process ceases to execute on one CPU and then recommences execution on a different CPU.

但是如果您的代码在输入和输出线程之间存在硬数据关系，那么多线程可能会比使用单核更慢!这几乎与内存/缓存无关，尤其是在核心/内存/缓存和外部总线系统之间的所有桥接器上。您应该尝试使用优先级、亲和性以及其他参数。

顺便说一句:“每秒 1500 万个样本”和 FFT 与 IO 在 1 GHZ Arm 上与 Linux 并行。哇!热的东西 ;)

关于c - 双核 ARMv7 处理器中的并行处理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50774136/

28

4

0

文章推荐： java - react 器选择接收器/处理器

文章推荐： multithreading - 在一个 Perl 模块中使用 Win32 进程和线程

文章推荐： multithreading - 生成比线程更多的任务

文章推荐： multithreading - 多线程 Firebase 函数

c - 确定运行线程的套接字/处理器
我为 4 套接字服务器的大对象( double 矩阵)编写 NUMA-aaware 缓存。我观察到套接字间通信是我的应用程序的瓶颈。因此，我希望不同套接字上的线程具有单独的矩阵缓存。我已将线程限制到特
C: JSON 处理器
这个问题在这里已经有了答案: 关闭 12 年前。 Possible Duplicate: Parsing JSON using C? 处理 JSON 的最佳 C 库是什么？ http://www.j
PHP Spintax 处理器
我一直在使用递归 SpinTax 处理器，如 here 所示, 它适用于较小的字符串。然而，当字符串超过 20KB 时，它开始耗尽内存，这就成了一个问题。如果我有这样的字符串: {Hello|How
c# - 编译时的目标平台/处理器
C# 中是否有一个#define 允许我在编译时知道我是针对 x86 (Win32) 还是针对 x64 (Win64) 进行编译？最佳答案默认情况下没有办法做到这一点。原因是 C# 代码不是针对特
architecture - 叶说明(处理器/程序集)
我不确定 SO 是否是提出这个问题的最佳场所。如果没有，请告诉我应该去哪个姊妹网站。我一直在阅读一篇关于英特尔的可信执行技术 (TXT) 的论文，其中包含以下我似乎无法理解的文字: “英特尔创建了一
xslt - 节省内存的 XSLT 处理器
我需要一个工具来针对执行 XSLT非常大 XML 文件。需要明确的是，我不需要任何东西来设计、编辑或调试 XSLT，只需执行它们即可。我正在使用的转换已经很好地优化了，但是大文件导致我尝试过的工具(
apache-camel - 处理器，组件和端点之间的区别
我正在学习Apache Camel。能否请您解释一下关于Apache Camel的处理器，组件和端点之间的区别。最佳答案我建议所有刚接触Apache Camel的人阅读这篇文章，它很好地解释了C
concurrency - 锁定 Camel 处理器
我想知道在 Camel 处理器上获得同步的方法。我在 docs 找到的唯一相关内容: Note that there is no concurrency or locking issue when
multithreading - 有没有办法在服务器级别强制停止 nifi 处理器？
我看到这个 https://issues.apache.org/jira/browse/NIFI-78在 jira 上，但它引用了 java。有没有办法将 nifi 进程映射到服务器上的线程，以便我可
java - react 器选择接收器/处理器
我有以下用例: 在一个应用程序中，我使用 X 线程消费一些消息，其中我有一个这样定义的 Consumer 实现: public interface Consumer { onMessage(
assembly - 不能使用 CPU12 处理器
CPU12 处理器中是否有提供简单 NOT 功能的代码？最佳答案这应该是 the datasheet您正在寻找。没有可用的logical NOT，您必须自己编写代码。关于assembly - 不
java - Oracle XSLT 处理器
我对 Oracle XDK 中包含的 Java XSLT 处理器与 Oracle DB 中嵌入并由 SQL XMLtransform 函数使用的 XSLT 处理器之间的关系感到困惑。这些是相同的野兽
java - 端点的 Camel 处理器
我正在试用 Camel，发现它是一个方便的端点集成工具。我已经设置了以下实验性应用程序: 第一个端点是一个简单的 http-get 请求(在命令行上使用 curl)。这与使用 Jetty 的中央交换机
java - 将未编码的对象传递给 Camel 处理器
我正在为一个应用程序使用 Apache Camel 和 Spring Boot。我需要从目录中读取数据，然后解码读取的 xml，然后处理解码的对象以在其中设置更多数据，然后再次对其进行编码并将其发送到
java - 扩展原生 NiFi 处理器
我已经知道如何编写自定义处理器(扩展org.apache.nifi.processor.AbstractProcessor)。我已经使用了这种技术，并且也可以轻松创建自定义 org.apache.ni
Python EasyList 处理器/解析器
是否有任何用 python 编写的 EasyList 处理器/解析器？ http://easylist.adblockplus.org/en/ 最佳答案找到了!就像一个月后:( http://adb
css - 浏览器 SCSS 处理器？
我有一个无法安装任何东西的开发(说来话长)。我只需要使用纯 HTML/浏览器 JS 进行开发，并且我想使用 CSS 预处理器。我喜欢 SCSS (SASS)，但为了使用它，我必须在我的机器上安装 ru
programming-languages - 特定于语言的架构/处理器
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
c - 如何开始使用 ARM 处理器？
对于新手来说，是直接从 ARM 处理器的数据表和用户手册开始，还是先了解一下 ARM 世界然后再继续？最佳答案当我开始使用一项(对我而言)新技术时，我首先会找到尽可能多的数据表和应用说明，然后直接
Android 模拟器系统镜像和 AMD 处理器
我使用 AMD FX X6 6300 型处理器。 (它支持虚拟化，我的 BIOS 设置为 ON) 我安装了“英特尔 x86 仿真器加速器”。当我尝试运行 Intel 加速器设置时，我得到该设置无法安装

首页

博学

6Ren·AI

商城

c - 双核 ARMv7 处理器中的并行处理