- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我有一个数据挖掘应用程序,它访问一个网站以检索个人记录 [另一个网站仍由我的公司运营,但没有用于访问它的 API]。我知道第一条记录是“1”但是(没有人为干预)我不知道最后一条记录。按顺序处理数据可能需要一段时间(例如 4000 条记录 = 大约 45 分钟)。为了改善用户体验,我想快速确定完成百分比。
理想情况下,我会实现类似于二进制搜索的方法来确定从服务器中提取最少的最后一条记录。我碰巧知道这些记录是由人类创造的,所以如果今天总共有 4000 条记录,明天可能会在 4000-4020 之间,但我想避免引入假设到我的数据收集应用程序,因为这需要用户进行某种管理。
这种“最后索引”搜索(间隙有限)是否有既定的模式/算法?虽然我可以积极地(在一定程度上)使现有应用程序并行(例如,可能快 8 倍),但我如何才能快速确定用户等待持续时间?
特定于实现的信息,我正在用 C# 实现它并可以访问 LINQ,但我认为这是一种独立于语言的算法。
编辑 我已经为大多数用户提供了缓存机制,但是现有数据可能会非常频繁地更改(每天 5%-10%),因此缓存机制很快就会过时.我想避免需要 central-cache 这样所有用户都不会受到这些更改的影响,此外还有多个项目和缓存可能需要访问“网站”我什至可能无法访问或我开发的服务 - 我希望它保留在“用户域”内。因此,有时需要尽快进行“全面更新”。
最佳答案
好吧,正如您所说,您可以使用类似二分查找的方法。您正在尝试找到有效记录索引 (n) 的最小上限。从 n = 1 开始,然后加倍直到结束。 n 现在是上限。现在在 n/2 和 n 之间进行二进制搜索,以将其减少到最小上限。
很明显,这可以被调整为一次拉下 8 条或更多记录(如果你发现你已经结束的唯一方法是看到足够多的相邻记录,这听起来无论如何都是必要的空条目)。
关于algorithm - 确定最后 "record"的最快方法 .. 理想情况下是并行的...(有间隙),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5364527/
recorder = new MediaRecorder(); recorder.setAudioSource(MediaRecorder.AudioSource.VOICE_CALL
在我的表中,我有四列。 r_id id(用户 ID) v_id(公司 ID) 率 我所做的就是从用户那里对公司(v_id)进行评分。 假设,如果用户一对第一家公司(v_id)进行评分,那么当同一用户对
我的表中有 10 条记录,当我删除记录 5 并创建新记录时,新记录将取代已删除的记录,如下所示: 在删除之前记录其ID: 1个2个3个4个5个6个78个910 删除记录 5 并插入新记录后,id 为
我有两个 belongsToMany 模型: const apptsModel = db.define('Appts', { id: {type: Sequelize.INTEGER, pri
有没有办法在 iOS Playground 上使用录音机?运行时,它会询问我是否允许使用我的麦克风,并且录音机实例似乎可以正常工作,但是,我无法使用 record() 函数。我当前的环境是 iOS 1
我有 2 个表,状态表与配置文件表相连。 Profile 表存储唯一的 tagId,status 表存储多个重复的 tagid 条目。我想按tagid的最后一条记录和第一条记录分组显示。 表:简介注意
我是 的新手 typescript 我需要遍历 Record键入对值进行一些更新并返回 Record . 这是定义类型的方式: type Parent = Readonly>; type Childr
我发现在开发 extjs 应用程序(拉力赛应用程序)时,有时我需要从记录中获取的数据在 record.raw 中而不是在 record.data 中。两者有什么区别,为什么会这样? 编辑 - 添加示例
我需要交叉引用 2 个表。 在 tb1 中是 booking_ref,投资者 在 tb2 中是 booking_ref、investor、cost 麻烦的是如果没有成本,表2中没有记录 所以我有以下查
鉴于:我在 Kafka 中有两个主题,假设主题 A 和主题 B。Kafka Stream 从主题 A 读取记录,处理它并生成与消费记录相对应的多条记录(假设记录 A 和记录 B)。现在,问题是如何使用
我有一个包含 6 个元素的排序数组列表。前 5 个元素有一些值,第 6 个元素为空。 我想循环遍历这个ArrayList,并将第一个记录的前5个元素与下一个记录中的相同元素进行比较。如果任一元素不同,
我有一个包含 3 列的表:ID、Name、ParentID。 如何删除特定记录及其所有子记录(n 层深)? 使用 Entity Framework 3.5。 最佳答案 表是自引用的是应用程序逻辑,它没
获取记录时如何获取最新的记录? 例如: 第一次迭代我用对象名称 Country 保存“Singapore”, 第二次迭代我用对象名称 Country,second 保存“USA” 现在当我获取它的时候
我将使用 C# 和 Xamarin 制作的 iOS 应用重写到 Swift,原因很明显是 Xamarin 的定价和低文档。正在关注this tutorial因为在我的 UITableView 上包含一
假设我有一个线束二进制文件,它可以根据命令行选项产生不同的基准。我对采样这些基准非常感兴趣。 我有3个选择: 更改线束二进制文件以生成一个“性能记录”子进程,该子进程运行基准测试并进行采样 只需执行“
什么 SQL 查询会按名称查找记录,以及具有相同地址但可能不同名称的所有记录? 我有一个选民登记数据库,当我查找个人时,我还想看看还有谁在该地址登记。 我的数据库称为 voters,其中的表称为 ex
我在我的 mac 上设置了一个 Tsung 配置,并尝试在我正在开发的网站上记录一个测试。 我跑了:“tsung-recorder start”并在 firefox localhost:8090 中为
我需要将 JOOQ 的记录结果集转换为表记录列表。有什么方法可以做到吗? 最佳答案 是的,您可以使用 Result.into(Table) .一个例子: Result result = create.
我正在尝试将 CKReference 添加到云工具包中的记录,但尝试不断触发“服务记录已更改”。从我的 println 显示的控制台消息(下面的控制台消息和代码), 我正在上传带有 0 个引用的记录,
我有两个类:Artist 和 Instrument。每个 Artist 可以演奏一个或多个 Instrument。每个 Instrument 可以分配给一个或多个 Artist。所以,我设置了以下类:
我是一名优秀的程序员,十分优秀!