c# - 如何避免 OrderBy - 内存使用问题-6ren

c# - 如何避免 OrderBy - 内存使用问题

转载作者：IT王子更新时间：2023-10-28 23:30:04

27

4

假设我们有一个大的点列表List<Point> pointList (已存储在内存中)其中每个 Point包含 X、Y 和 Z 坐标。

现在，我想选择存储在 pointList 中的所有点中 Z 值最大的 N% 点。 .现在我正在这样做:

N = 0.05; // selecting only 5% of points
double cutoffValue = pointList
    .OrderBy(p=> p.Z) // First bottleneck - creates sorted copy of all data
    .ElementAt((int) pointList.Count * (1 - N)).Z;

List<Point> selectedPoints = pointList.Where(p => p.Z >= cutoffValue).ToList();

但是我这里有两个内存使用瓶颈:第一个是在 OrderBy 期间(更重要)，第二个是在选择点期间(这不太重要，因为我们通常只想选择少量点)。

有没有什么方法可以用使用更少内存的东西来替换 OrderBy(或者找到这个截止点的其他方法)？

这个问题非常重要，因为 LINQ 会复制整个数据集，而对于我正在处理的大文件，它有时会达到数百 MB。

最佳答案

编写一个迭代列表一次并维护一组 M 个最大元素的方法。每个步骤只需要 O(log M) 工作来维护集合，并且您可以拥有 O(M) 内存和 O(N log M) 运行时间。

public static IEnumerable<TSource> TakeLargest<TSource, TKey>
    (this IEnumerable<TSource> items, Func<TSource, TKey> selector, int count)
{
    var set = new SortedDictionary<TKey, List<TSource>>();
    var resultCount = 0;
    var first = default(KeyValuePair<TKey, List<TSource>>);
    foreach (var item in items)
    {
        // If the key is already smaller than the smallest
        // item in the set, we can ignore this item
        var key = selector(item);
        if (first.Value == null ||
            resultCount < count ||
            Comparer<TKey>.Default.Compare(key, first.Key) >= 0)
        {
            // Add next item to set
            if (!set.ContainsKey(key))
            {
                set[key] = new List<TSource>();
            }
            set[key].Add(item);
            if (first.Value == null)
            {
                first = set.First();
            }

            // Remove smallest item from set
            resultCount++;
            if (resultCount - first.Value.Count >= count)
            {
                set.Remove(first.Key);
                resultCount -= first.Value.Count;
                first = set.First();
            }
        }
    }
    return set.Values.SelectMany(values => values);
}

如果有联系，这将包括超过 count 个元素，就像您现在的实现一样。

关于c# - 如何避免 OrderBy - 内存使用问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3329985/

27

4

0

文章推荐： c# - 如何在 xamarin 中设置 onclick 监听器？

文章推荐： android - RelativeLayout "Couldn' t 解析资源..."Android

文章推荐： android以编程方式设置边距

javascript - Angularjs orderby 切换和删除 orderby
所以我尝试使用angularjs的orderby函数。目前我有一个原始数据集。 $scope.customers = [ {"name" : "Bottom-Dollar Market
c# - Linq Orderby 与 SQL Orderby
我有一个包含以下数据的表列 (Varchar): COLUMN_NAME 102100 1-2000 112100 当我在 SQL 语句中使用 OrderBy 时，我按以下顺序获取项目: COLUMN
C# LINQ Orderby - 真/假如何影响 orderby？
我正在研究一些 LINQ 排序，因为我有一个 ID 列表，我需要按顺序对它们进行排序。但是，某些 ID 需要优先于标准顺序。鉴于此 C# 代码(可以粘贴到 .NET Fiddle 中进行测试)，排序
c# - Queryable.OrderBy 和 Enumerable.OrderBy 有什么区别？
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
performance - LINQ to Entities -- OrderBy().ToList() 与 ToList().OrderBy()
我正在寻找这些 LINQ 表达式的确认/澄清: var context = new SomeCustomDbContext() // LINQ to Entities? var items = co
javascript - firebase orderby key vs orderby timestamp，用于分页
我的数据在我的 firebase 中看起来像这样。 users: { -KOwKNCB5IiDBxY9FNzR: { content: { blah blah }, timestamp:147
c# - TSQL OrderBy 与 LINQ OrderBy Madness for UniqueIdentifier
在尝试找出一段代码不同步的原因后，我开始意识到 TSQL OrderBy 与 Linq OrderBy 对于字符串的差异很大。所以很自然地，我必须找到一种方法来确保来自 tsql 的语句返回与 lin
c# - 为什么有 OrderBy 和 OrderByDescending 而没有 OrderBy(SortOrder)？
目前，如果我们将订购方向作为外部依赖项，我们必须使用 if 来应用此方向: public static IEnumerable getlist(string directory, string sea
javascript - 编辑 orderby-property 时 AngularJS orderby 不起作用
我在我的范围内有一个对象列表，我想遍历它们，以按某些属性排序的方式显示它们的一些属性并更改它们。 ng-repeat 用于显示绑定(bind)到列表中每个对象的文本框，并应用以“position”作为
sql-server - OrderBy().FirstOrDefault(<条件>) 与Where(<条件>).OrderBy().FirstOrDefault()
我在 C# 项目中使用 EntityFramework 6.1.3 和 SQL Server。我有两个查询，基本上应该执行相同的操作。 1. Exams.GroupBy(x=>x.SubjectID)
mysql - Laravel 中的条件 `orderBy` 或 `DB::Raw` inside `orderBy`
我正在尝试以 asc 顺序显示从今天开始的特定接下来几天的约会列表。(例如:接下来的 5 天或 10 天)。仅从今天开始，接下来的 5 天或 10 天(注意:天数将是动态的，我的意思是客户将设置)。当
linq - ".OrderBy(p => p.Id)"和 "orderby p.Id ascending"之间的区别
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicates: Which LINQ syntax do you prefer? Fluent or Query Expressi
asp.net-web-api2 - OData V4 $expand 嵌套 $filter 和 $orderby -- 在 expand 内组合 $filter 和 $orderby
我目前有一个 OData V4 服务，它具有以下模型。 “类别”——“代码” 对于每个类别，可以有许多代码。我需要 $expand the Codes, $filter where Active =
RethinkDB索引用于过滤器+ orderby
可以说注释表具有以下结构: id | author | timestamp | body 我想使用索引有效地执行以下查询: r.table('comments').getAll("me", {inde
LINQ - OrderBy 显式
是否可以像这样使用 LINQ OrderBy: .OrderBy(x=>(x.SourceID == 3), (x.SourceID == 2), (x=>x.SourceID == 4), (x.S
angularjs - orderBy 在简单数组上？
我有一个这样的数组: $scope.telcodes = ['44', '01', '221', '335']; 如何在像这样的简单数组上使用 orderBy 来生成从 01 开始的有序列表？我知道
Laravel - 嵌套关系中的 orderBy
我有一个像这样 Eloquent 查询: Forum::with(['comments.user'])->find($id); 这将返回嵌套结果 forum -> its comments -> us
symfony - 注释@OrderBy
我正在尝试通过 ManyToMany 注释自动对报告的结果进行排序 @OrderBy : /** * @ORM\ManyToMany(targetEntity="Artist", inversedB
r - orderBy 随排序递减和递增的变化
是否有按几列对 data.frame 进行排序的标准方法，但随着减少或增加的变化？例如，您可能希望按一个变量(递减)和下一个(递增)对 data.frame 进行排序。有没有类似的东西: mydf[
Linq - Orderby 未排序
我有一个 linq 查询，无论出于何种原因，它都没有像我期望的那样返回订购。任何人都可以指出我为什么以及我做错了什么的正确方向吗？代码如下: List designer = null; using

首页

博学

6Ren·AI

商城

c# - 如何避免 OrderBy - 内存使用问题