- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我对 Entity Framework 的性能有一个非常特殊的问题。我将框架的版本 7 与 SQLite 提供程序(均来自 nuget)一起使用。数据库有大约 1000 万条记录,但将来会有大约 1 亿条记录。 db的构建非常简单:
public class Sample
{
public int SampleID { get; set; }
public long Time { get; set; }
public short Channel { get; set; } /* values from 0 to 8191, in the presented test 0-15 */
public byte Events { get; set; } /* 1-255 */
}
public class Channel
{
public int ChannelID { get; set; }
public short Ch { get; set; }
public int Es { get; set; }
}
public class MyContext : DbContext
{
// This property defines the table
public DbSet<Sample> Samples { get; set; }
public DbSet<Channel> Spectrum { get; set; }
// This method connects the context with the database
protected override void OnConfiguring(DbContextOptionsBuilder optionsBuilder)
{
var connectionStringBuilder = new SqliteConnectionStringBuilder { DataSource = "E://database.db" };
var connectionString = connectionStringBuilder.ToString();
var connection = new SqliteConnection(connectionString);
optionsBuilder.UseSqlite(connection);
}
}
我尝试按 channel 对事件进行分组,然后将它们汇总为类似频谱的内容。当我使用 linq2sql 时,我的性能非常低。对于 10m 的记录,查询大约需要 15 分钟并获得大约 1 GB 的 RAM,然后抛出 OutOfMemoryException - 我认为 Entity Framework 正在将所有记录作为对象加载到内存中 - 但为什么呢?另一方面,简单的 SQL 需要大约 3 秒,并且不会占用大量 RAM。
using (var db = new MyContext())
{
var res1 = from sample in db.Samples
group sample by sample.Channel into g
select new { Channel=g.Key, Events = g.Sum(s => s.Events) };
res1.ToArray();
var res2 = db.Natas.FromSql("SELECT Channel as ChannelID, Channel as Ch, SUM(Events) as Es FROM Sample GROUP BY Channel");
var data = res2.ToArray();
}
有什么建议吗?感谢您的帮助;)
最佳答案
建议?忽略 Entity Framework 。
如:这完全不是 EF 问题,甚至都不好笑。
看EF发出的SQL,然后从那个层级优化。呵呵,你对SQL影响不大;但对于像这样的简单语句,SQL 将是最佳的。
什么不是最佳的 - 并且有一个暗示你从未看过 SQL - 是数据库。指数在那里?代码优先的惊人之处在于它对数据库的复杂性一无所知,您需要首先从“我的数据库是否最优”的角度来看待它。指数。而且 - 可悲的是 - 硬件。如果您达到 1 亿行,您需要在数据库中拥有处理这个问题的能力。
I think that Entity Framework is loading all records as objects into memory - but why?
性能调试的规则 1:不要思考 - 检查。查看生成的 SQL(日志,res1 变量可以向您显示)并查看提交到数据库的内容。
您可能只有那么多数据。您只字不提存在多少个 channel - 这很可能需要一台更大的机器。
检查它。
此外:除非您需要,否则将结果拉入数组并不明智。在这种情况下,数组存在内存问题(重新分配以获得大小),而 LIST 可能更好(使用更多内存但不需要重新分配)。不过,一般来说,您希望避免具体化结果集——即从可枚举的对象开始工作。并非总是如此,但是您的测试可能会简单地显示出那一侧的问题。结果数组可能很大。并且需要一 block 内存。
严肃地说,质疑您对数据库技术的选择。 SqlLite 很好——它很小,很轻。它在内存中。它不适合大量数据,它不是一个完整的数据库服务器。使用 Sql Express 可能会好得多(如果有的话:SQL Express 将使用不在您的进程中但独立的内存进行缓存)。我个人不会将 SqlLite 用于可能使用数亿条记录的东西。
另外:请注意您的 SQL 是不同的。 EF 部分有一个 OrderBy(不需要),而 SQL 则没有。订购可能很昂贵。这让我们回到“获取 Entity Framework 生成的 SQL”。
关于c# - ( Entity Framework )分组依据 - 低性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36234017/
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicates: What is a framework? What does it do? Why do we need a f
我在按照 http://msdn.microsoft.com/en-us/data/jj591621.aspx 处的 Microsoft Data Developer 过程启用代码优先迁移时遇到了一些
我正在从 迁移项目 Entity Framework 4.3 在 .net 4 上运行到 Entity Framework 5 在 .net 4.5 上运行。在不做任何更改的情况下,当我尝试运行该项目
我正在使用 Entity Framework 6 并使用 EntityFramework Extended 来执行一些批量更新和批量删除。批量更新和批量删除工作正常,但我还需要知道更新/删除的实体(即
我在实体上添加了一个列,然后从模型中生成数据库或构建解决方案,然后收到一条消息,提示我刚添加的新列未映射。该数据库以前是从模型创建的,没有错误。 当我右键单击Entity并选择Table Mappin
每次我尝试运行我的代码时都会崩溃,因为我尝试启动函数以调用 SDK 的任何部分。 我在构建过程中包含了 FoundationSDK: 并且我在头文件中包含了对 SDK 的引用: 但是每次我运行这个,我
我以前能够毫无问题地提交我的申请。我的工作流程中唯一改变的部分是使用 Sourcetree。在对以下框架进行更新后,我在提交到 iOS App Store 时收到此警告。我还收到一封电子邮件,其中包含
假设我为 Asp.NET Web 应用程序安装了 .NET Framework 2.0、3.0、3.5。 我意识到 Framework 3.0 和 3.5 只是 Framework 2 的扩展,不太清
是否有 SaveChanges 事件在保存更改后但在更新更改跟踪器之前触发? 我正在使用 EF 6。 我需要在某个实体的状态发生变化时执行任务。 我已经覆盖了 SaveChanges 来设置它。我可以
我正在使用一个现有的数据库,并且我已经将其中一个表映射为一个实体(因为我需要映射一个外键)。 因此,在初始化此数据库时,我希望 EF 忽略此实体,因为它已经存在。 我该怎么做? 最佳答案 您应该使用
我有 3 个表需要与 Entity Framework 进行映射,但我不确定解决此问题的正确方法。这是我的 3 个实体: public class User { [Key] public
我首先使用 VS 2010 和 Entity Framework 代码(版本 6)。我有两个实体,每个实体都在自己的上下文中,我想在它们之间创建一对多关系。 上下文 1 具有以下实体: public
我知道 EF 在 CodePlex 上是开源的,但我没有看到当前发布的 5.0 版本的分支。我在哪里可以得到这个源代码? 最佳答案 没有。他们只开源了 post 5 版本。第一次签到可能足够接近,但再
我们目前有一个数据库很大的系统,存储过程既用于CUD又用于查询。数据集用于从 SP 查询中检索结果。 现在我们正在研究使用 Entity Framework 针对同一个数据库开发另一个项目。在查询数据
我有一个每 10 秒运行一次的 Windows 服务......每次运行时,它都会获取一些测试数据,对其进行修改并使用 EntityFramework 将其保存到数据库中。但是,在每一秒运行时,当我尝
我对在我们的场景中仅将 Entity Framework 与存储过程一起使用的合理性有疑问。 我们计划拥有一个 N 层架构,包括 UI、BusinessLayer (BLL)、DataAccessLa
当我使用 Entity Framework 时,我想在上下文中查询出一条记录并将其添加到具有相同架构的另一个上下文中,在查询出记录后,我将其从上下文中分离出来,但是相关实体都没有了,是吗?有什么办法解
我正在使用 Entity Framework 5 构建 ASP.Net MVC4 Web 应用程序。我必须使用现有的 sql server 数据库,但也想使用 Code First,所以我遵循了本教程
在 Entity Framework 4.0 中使用 T4 模板创建 POCO 会丢失什么?为什么使用 Entity Framework 4.0 时的默认行为不创建 POCO? 最佳答案 你会失去很多
我在网上使用 Repository Pattern 和 EF 看了很多例子。但他们都没有真正谈到与相关实体的合作。 就像说用户可以有多个地址。 IUserRepository User CreateU
我是一名优秀的程序员,十分优秀!