- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在当前关于 mongodb 驱动程序的基准测试中,我们注意到 python 和 .Net(核心或框架)之间的性能存在巨大差异。
在我看来,部分差异可以用这个来解释。
我们得到了以下结果:
┏━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━┳━━━━━━━━━━━┓
┃ Metric ┃ Csharp ┃ Python ┃ ratio p/c ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━╋━━━━━━━━━━━┫
┃ Ratio Duration/Document ┃ 24.82 ┃ 0.03 ┃ 0.001 ┃
┃ Duration (ms) ┃ 49 638 ┃ 20 016 ┃ 0.40 ┃
┃ Count ┃ 2000 ┃ 671 972 ┃ 336 ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━┻━━━━━━━━━━┻━━━━━━━━━┻━━━━━━━━━━━┛
我们查看了 C# 中的内存分配,发现 BsonChunck 的下载阶段和反序列化之间存在乒乓效应。 (正常,因为它是按批处理的。)但是下载阶段很长。所以我们查看了不同查询的网络跟踪,因为 mongo 使用 TCP/IP:
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━┓
┃ Metric ┃ Csharp ┃ Python ┃ ratio p/c ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━━━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━┫
┃ Packets/sec to db ┃ 30 ┃ 160 ┃ 5.3 ┃
┃ Packets/sec from DB ┃ 120 - 150 ┃ 750 - 1050 ┃ ~6.5 ┃
┃ Packet count to db ┃ 1560 ┃ 2870 ┃ 1.84 ┃
┃ Packet count from db ┃ 7935 ┃ 13663 ┃ 1.7 ┃
┃ Packet average length to db ┃ 73.6 ┃ 57.6 ┃ 0.74 ┃
┃ Packet average length from db ┃ 1494 ┃ 1513 ┃ 1.01 ┃
┃ Max TCP Errors/sec ┃ 20 ┃ 170 ┃ 8.5 ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┻━━━━━━━━━━━┻━━━━━━━━━━━━┻━━━━━━━━━━━┛
对于配置文件,只有以下配置文件的结果是惊人的:
{
"connectionString": "mongodb://ip.of.the.mongo:27018",
"dbname" : "mydb",
"colname" : "mycollection",
"query" : {},
"projection" :{},
"limit" : 2000,
"batchsize": 10
}
一个对象的延迟令人印象深刻:python 为 0.03 毫秒,csharp 为 24.82 毫秒。
您对这种差异有一些见解吗?您知道在 C# 中达到与在 Python 中相同性能的方法吗?提前谢谢你:-)
为了做基准测试,我们使用这两个代码:
Python(pymongo 驱动程序):
#!/usr/bin/env python3
import pymongo
import time
import json
import os
queries_dir = "../queries"
results_dir = "../results"
for subdir, dirs, files in os.walk(queries_dir):
for f in files:
filepath = subdir + os.sep + f
print(filepath)
conf = json.load(open(filepath))
conf["language"] = "python"
client = pymongo.MongoClient(conf["connectionString"])
db = client[conf["dbname"]]
col = db[conf["colname"]]
initConnection = col.find({}, {}).limit(1)
for element in initConnection:
print(element)
input("Press enter to continue.")
res = col.find(conf["query"], conf["projection"])
returned = 0
start = time.time()
for i in res:
returned += 1
duration = (time.time() - start) * 1000
conf["duration"] = duration
conf["returned"] = returned
conf["duration_per_returned"] = float(duration) / float(returned)
d = time.strftime("%Y-%m-%d_%H-%M-%S")
fr = open(results_dir + os.sep + d + "_" + conf["language"] + "_" + f,"w")
json.dump(conf, fr, indent=4, sort_keys=True)
fr.close()
print(json.dumps(conf,indent=4, sort_keys=True))
对于 .Net (MongoDB.Driver):
class Program
{
static void Main(string[] args)
{
var dir = Directory.GetCurrentDirectory();
var queryDirectory = dir.Replace(@"csharp\benchmark\benchmark\bin\Debug\netcoreapp2.2", string.Empty) + "queries";
var resultDirectory = dir.Replace(@"csharp\benchmark\benchmark\bin\Debug\netcoreapp2.2", string.Empty)+ "results";
var configurationFiles = Directory.GetFiles(queryDirectory);
foreach (var file in configurationFiles)
{
var configuration = JsonConvert.DeserializeObject<BenchmarkConfiguration>(File.ReadAllText(file));
var collection = new MongoClient(configuration.ConnectionString)
.GetDatabase(configuration.Database)
.GetCollection<BsonDocument>(configuration.Collection);
var filters = BsonDocument.Parse((string)(configuration.Query.ToString()));
var projection = BsonDocument.Parse((string)(configuration.Projection.ToString()));
var query = collection.Find(filters, new FindOptions { BatchSize = configuration.BatchSize }).Project(projection).Limit(configuration.Limit);
var initconnection = collection.Find(new BsonDocument { }).Limit(1).FirstOrDefault();
Console.WriteLine(initconnection.ToString());
Console.WriteLine("Press Enter to continue.");
Console.ReadLine();
var watch = new Stopwatch();
watch.Start();
var results = query.ToList();
watch.Stop();
var time = watch.ElapsedMilliseconds;
var now = DateTime.Now.ToString("yyyy-MM-dd_hh-mm-ss");
var report = new BenchmarkResult(configuration, time, results.Count());
File.WriteAllText($"{resultDirectory}/{now}_csharp_{Path.GetFileName(file)}", JsonConvert.SerializeObject(report, Formatting.Indented));
}
}
}
旧指标:在从基准循环中删除连接拉动之前。
┏━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━┳━━━━━━━━━━━┓
┃ Metric ┃ Csharp ┃ Python ┃ ratio p/c ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━╋━━━━━━━━━━━┫
┃ Ratio Duration/Document ┃ 26.07 ┃ 0.06 ┃ 0.002 ┃
┃ Duration (ms) ┃ 52 145.0 ┃ 41 981 ┃ 0.80 ┃
┃ Count ┃ 2000 ┃ 671 972 ┃ 336 ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━┻━━━━━━━━━━┻━━━━━━━━━┻━━━━━━━━━━━┛
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━┓
┃ Metric ┃ Csharp ┃ Python ┃ ratio p/c ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━━━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━┫
┃ Packets/sec to db ┃ 30 ┃ 150 ┃ 5 ┃
┃ Packets/sec from DB ┃ 120 - 180 ┃ 750 - 1050 ┃ ~6 ┃
┃ Packet count to db ┃ 1540 ┃ 2815 ┃ 1.8 ┃
┃ Packet count from db ┃ 7946 ┃ 13700 ┃ 1.7 ┃
┃ Packet average length to db ┃ 74 ┃ 59 ┃ 0.80 ┃
┃ Packet average length from db ┃ 1493 ┃ 1512 ┃ 1 ┃
┃ Max TCP Errors/sec ┃ 10 ┃ 320 ┃ 32 ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┻━━━━━━━━━━━┻━━━━━━━━━━━━┻━━━━━━━━━━━┛
最佳答案
您正在试验的 C# 和 python 驱动程序之间的性能差异是由于 python pymongo
lib 如何理解空 { }
投影中的一个非常小的细节造成的。
在 mongodb-shell 和 C# 驱动程序中,{ }
投影会返回整个文档。实际上根本没有投影。它可能被视为默认行为,因为 mongodb-shell 就是这样。
但是,使用 pymongo
的 python 中的 { }
投影只返回 _id
字段!
文档越多,您的 C# 代码下载文档所需的时间就越多,而您的 Python 代码只需要非常小的 _id。
如果你从
res = col.find(conf["query"], conf["projection"]) #projection being { }.
for i in res:
print(i) # Only print Id fields.
returned += 1
到
res = col.find(conf["query"])
for i in res:
print(i) # Whole document 'downloaded' and printed.
returned += 1
您会注意到两者都表现良好。
关于c# - 如何使用 C# mongo 驱动程序达到与 python 中的 PyMongo 相同的性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57621853/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!