objective-c - 核心数据批量插入突然减慢到速度的 1/10-6ren

objective-c - 核心数据批量插入突然减慢到速度的 1/10

转载作者：可可西里更新时间：2023-11-01 04:44:47

24

4

我正在批量插入核心数据。我有一个人对象，这个人对象有一个名为“otherPeople”的关系，它是人的 NSSet。当从下载中批量插入数据时，一切都很好，直到大约 10,000 人被读入，此时批量插入速度减慢到爬行。我每插入 500 次就保存并重置我的 NSManagedObjectContext。

如果我注释掉插入“otherPerson”关系的部分，批量插入在整个下载过程中会很快。 parseJSON 在 500 个 JSONKit 词典中被批量调用。

知道是什么原因造成的吗？可能的解决方案？

代码:

- (NSArray*) getPeople:(NSArray*)ids
{
    NSFetchRequest* request = [[[NSFetchRequest alloc] init] autorelease];
    NSEntityDescription* entityDescription = [NSEntityDescription entityForName:@"Person" inManagedObjectContext:context];
    [request setEntity:entityDescription];
    [request setFetchBatchSize:ids.count];

    //Filter by array of ids
    NSPredicate* predicate = [NSPredicate predicateWithFormat:@"externalId IN %@", ids];
    [request setPredicate:predicate];

    NSError* _error;
    NSArray* people = [context executeFetchRequest:request error:&_error];

    return people;
}

- (void) parseJSON:(NSArray*)people
{
    NSAutoreleasePool* pool = [[NSAutoreleasePool alloc] init];
    NSMutableArray* idsToFetch = [NSMutableSet setWithCapacity:CHUNK_SIZE * 3];
    NSMutableDictionary* existingPeople = [NSMutableDictionary dictionaryWithCapacity:CHUNK_SIZE * 3];

    // populate the existing people dictionary first, that way we know who is already in the context without having to do a fetch for each person in the array (externalId IS indexed)
    for (NSDictionary* personDictionary in people)
    {
        // uses JSON kit to parse out all the external ids...
        [PersonJSON addExternalIdsToArray:idsToFetch fromDictionary:personDictionary];
    }

    // see above code for getPeople implementation...
    NSArray* existingPeopleArray = [self getPeople:idsToFetch];
    for (Person* p in existingPeopleArray)
    {
        [existingPeople setObject:p forKey:p.externalId];
    }

    for (NSDictionary* personDictionary in people)
    {
        NSString* externalId = [personDictionary objectForKey:@"PersonId"];
        Person* person = [existingPeople objectForKey:externalId];

        if (person == nil)
        {
            // the person was not in the context, make a new person in the context
            person = [[self newPerson] autorelease];
            person.ancestryId = externalId;
            [existingPeople setObject:person forKey:person.externalId];
        }

        // use JSON kit to populate the core data object...
        [PersonJSON populatePerson:person withDictionary:personDictionary inContext:[self context]];

        // these are just objects that contain an externalId, showing that the link hasn't been setup yet
        for (UnresolvedOtherPerson* other in person.unresolvedOtherPeople)
        {
            Person* relatedPerson = [existingPeople objectForKey:other.externalId];

            if (relatedPerson == nil)
            {
                relatedPerson = [[self newPerson] autorelease];
                relatedPerson.externalId = other.externalId;
                [existingPeople setObject:relatedPerson forKey:relatedPerson.externalId];
            }

            // add link - if I comment out this line, everything runs very fast
            // if I don't comment out, things slow down gradually and then exponentially
            [person addOtherPersonsObject:relatedPerson];
        }

        self.downloaded++;
    }

    [pool drain];
}

最佳答案

将对象添加到关系会导致双方的关系都被触发。因此，如果您有 A <<->> B 并说您正在尝试将新创建的 A 对象添加到已经与 100,000 个 A 对象相关联的 B 对象，则 CoreData 将从存储中获取这 100,000 个对象以实现之前的关系添加新关系。

事实上，您每隔一段时间就清除 mangedobjectcontext，这意味着为满足关系而加载的所有 100,000 个对象 CD 现在需要重新加载，从而使过程极其缓慢。

解决此问题的一种方法是执行两步导入过程。首先在不建立任何关系的情况下将所有对象加载到 db 中，但要跟踪需要添加的关系。一旦你像这样快速导入，然后回到数据库并添加关系和清晰的上下文，以避免核心数据必须过于频繁地重新加载关系。所以作为一个具体的例子，如果你需要导入 100 万个 A，需要关联 100 个 B，首先导入所有的 As，然后对于一百个 B 中的每一个，加载关系一次并将所有 A 添加到其中，清除上下文，继续下一个 B，依此类推。这里的关键是防止上下文重置它刚刚痛苦地加载的那些 100k 记录。

另一种解决方法是不定期重置整个上下文，而是只刷新您想要删除的对象。

哦，还有一件事，你也可以考虑在 CoreData 中建立单向关系，并使用显式获取来获取关系的另一端

编辑:

我想我找到了解决方法。您需要调用原始访问器。所以像

        [self.primitiveTags addObject:tag];

初步测试似乎表明，这不会迫使关系的另一方开火

关于objective-c - 核心数据批量插入突然减慢到速度的 1/10，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7154953/

24

4

0

文章推荐： javascript - 给定一个 JSON 对象，如何根据键查找项目？

文章推荐： iphone - 如何找出 UIViewController View 的确切框架？

文章推荐： javascript - 在 JavaScript 中搜索最后一个词

javascript - TypeError : Object [object Object], [object Object] 没有找到方法
我遵循了一本名为“Sitepoint Full Stack Javascript with MEAN”的书中的教程，我刚刚完成了第 6 章，应该已经创建了一个带有“数据库”的“服务器”。数据库只不过是
javascript - Ajax返回数组在PHP中显示[object Object],[object Object]
在 Jquery 中，我创建两个数组，一个嵌入另一个数组，就像这样...... arrayOne = [{name:'a',value:1}, {name:'b',value:2}] var arra
javascript - 为什么 ({}+{}) ="[object Object][object Object]"？
这个问题在这里已经有了答案: What is the explanation for these bizarre JavaScript behaviours mentioned in the 'Wa
angular - 无法解析...的所有参数([object Object]，[object Object]，？，？)
我被放在别人的代码上，有一个类用作其他组件的基础。当我尝试 ng serve --aot(或 build --prod)时，我得到以下信息。 @Component({ ...,
javascript - getJSON 只返回 [object Object],[object Object]
我正在测试一些代码，并使用数据创建了一个 json 文件。问题是我在警报中收到“[object Object],[object Object]”。没有数据。我做错了什么？这是代码:
javascript - print[ [object Object],[object Object]] 到json数组
我想打印 [object Object],[object Object] 以明智地 "[[{ 'x': '1', 'y': '0' }, { 'x': '2', 'y': '1' }]]"; 在 ja
javascript - Couchdb 列表仅返回 [object Object][object Object]
我有一个功能 View ，我正在尝试以特殊格式的方式输出。但我无法让列表功能正常工作。我得到的唯一返回是[object Object][object Object] [object Object]
javascript - TypeError Object[object object] 没有方法 SubSelf，TypeError Object[object object] 没有方法 intersectsPlane
在使用优秀的 Sim.js 和 Three.js 库处理 WebGL 项目时，我偶然发现了下一个问题: 一路走来，它使用了 THREE.Ray 的下一个构造函数: var ray = new THRE
javascript - React js 多选 [object Object], [object Object]
我正在使用 Material UI 进行多重选择。这是我的代码。 {listStates.map(col => (
javascript - jquery ajax [object Object] [object Object] 在列表中输出
我的代码使用ajax: $("#keyword").keyup(function() { var keyword = $("#keyword").val(); if (keyword.
angular - 无法解析 AuthenticationService : ([object Object], 的所有参数？，[object Object])
我遇到了下一个错误，无法理解如何解决它。 Can't resolve all parameters for AuthenticationService: ([object Object], ?, [o
Angular 10 FormArray ERROR 错误 : Cannot find control with name: '[object Object], [object Object],[object Object]
我正在尝试创建一个显示动态复选框的表单，至少应选中其中一个才能继续。我还需要获取一组选中的复选框。这是组件的代码: import { Component, OnInit } from '@angul
javascript - 为什么我在 UI 中没有收到验证 Flash 消息，我收到这样的 Flash 错误 [object Object],[object Object],[object Object]
我正在开发 NodeJs 应用程序，它是博客应用程序。我使用了快速验证器，我尝试在 UI 端使用快速闪存消息将帖子保存在数据库中之前使用闪存消息验证数据，我成功地将数据保存在数据库中，但在提交表单后消
jquery - $.getJSON 返回 “undefined” 或 [object Object] [object Object]
我知道有些人问了同样的问题并得到了解答。我已经查看了所有这些，但仍然无法解决我的问题。我有一个 jquery snipet，它将值发送到处理程序，处理程序处理来自 JS 的值并将数据作为 JSON 数
c# - object == object 而不是 object.id == object.id 潜在问题
我继承了一个非常草率的项目，我的任务是解释为什么它不好。我注意到他们在整个代码中都进行了这样的比较 (IQueryable).FirstOrDefault(x => x.Facility == fac
javascript - Object, Object 和 [1 : Object, 2 : Object]? 有什么区别
我只是在删除数组中的对象时偶然发现了这一点。代码如下: friends = []; friends.push( { a: 'Nexus', b: 'Muffi
objective-c - setting object = nil and [object release] VS [object release] and object = nil 有什么区别？
这两个代码片段有什么区别: object = nil; [object release] 对比 [object release]; object = nil; 哪个是最佳实践？最佳答案 object
javascript - Object.create(Object.prototype) , Object.create(Object) 和 Object.create(null) 之间的区别
我应该为其他人将从中继承的第一个父对象传递哪个参数，哪个参数更有效 Object.create(Object.prototype) Object.create(Object) Object.creat
objective-c - 执行cancelPreviousPerformRequestsWithTarget :selector:object: for all objects
我在不同的对象上安排不同的选择器 [self performSelector:@selector(doSmth) withObject:objectA afterDelay:1]; [self per
objective-c - 在 Objective-C 中打印 &object 和 object 的区别
NSLog(@"%p", &object); 和 NSLog(@"%p", object); 有什么区别？两者似乎都打印出一个内存地址，但我不确定哪个是对象的实际内存地址。最佳答案这就是我喜欢的

首页

博学

6Ren·AI

商城

objective-c - 核心数据批量插入突然减慢到速度的 1/10