- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在将我的旧 PHP 脚本与更新、更高级的 Django 版本和 PHP 脚本进行比较,完全吐出 HTML,并且所有功能都运行得更快。快得多,以至于 Django 一定有问题。
首先,了解一些背景信息:我有一个显示销售数据报告的页面。数据可以按多种方式过滤,但主要按日期过滤。这使得缓存它有点困难,因为结果的可能性几乎是无穷无尽的。完成了很多数字和计算,但在 PHP 中处理从来都不是什么大问题。
更新:
经过一些额外的测试后,我认为没有任何原因导致速度下降。如果我只是对数据进行数字运算并吐出 5 行呈现的 HTML,它并没有那么慢(仍然比 PHP 慢),但如果我呈现大量数据,它就会非常慢。
每当我运行一个大型报表(例如全年的所有销售额)时,机器的 CPU 使用率都会达到 100%。不知道这是否意味着很多。我正在使用 mod_python 和 Apache。也许切换到 WSGI 可能有所帮助?
我的模板标签显示了从 0.1 秒到 1 秒的非常大的集合的小计/总计过程。我在报告中给他们打了大约 6 次电话,所以他们似乎不是最大的问题。
现在,我运行了一个 Python 分析器并返回了这些结果:
Ordered by: internal time List reduced from 3074 to 20 due to restriction ncalls tottime percall cumtime percall filename:lineno(function) 2939417 26.290 0.000 44.857 0.000 /usr/lib/python2.5/tokenize.py:212(generate_tokens) 2822655 17.049 0.000 17.049 0.000 {built-in method match} 1689928 15.418 0.000 23.297 0.000 /usr/lib/python2.5/decimal.py:515(__new__) 12289605 11.464 0.000 11.464 0.000 {isinstance} 882618 9.614 0.000 25.518 0.000 /usr/lib/python2.5/decimal.py:1447(_fix) 17393 8.742 0.001 60.798 0.003 /usr/lib/python2.5/tokenize.py:158(tokenize_loop) 11 7.886 0.717 7.886 0.717 {method 'accept' of '_socket.socket' objects} 365577 7.854 0.000 30.233 0.000 /usr/lib/python2.5/decimal.py:954(__add__) 2922024 7.199 0.000 7.199 0.000 /usr/lib/python2.5/inspect.py:571(tokeneater) 438750 5.868 0.000 31.033 0.000 /usr/lib/python2.5/decimal.py:1064(__mul__) 60799 5.666 0.000 9.377 0.000 /usr/lib/python2.5/site-packages/django/db/models/base.py:241(__init__) 17393 4.734 0.000 4.734 0.000 {method 'query' of '_mysql.connection' objects} 1124348 4.631 0.000 8.469 0.000 /usr/lib/python2.5/site-packages/django/utils/encoding.py:44(force_unicode) 219076 4.139 0.000 156.618 0.001 /usr/lib/python2.5/site-packages/django/template/__init__.py:700(_resolve_lookup) 1074478 3.690 0.000 11.096 0.000 /usr/lib/python2.5/decimal.py:5065(_convert_other) 2973281 3.424 0.000 3.424 0.000 /usr/lib/python2.5/decimal.py:718(__nonzero__) 759014 2.962 0.000 3.371 0.000 /usr/lib/python2.5/decimal.py:4675(__init__) 381756 2.806 0.000 128.447 0.000 /usr/lib/python2.5/site-packages/django/db/models/fields/related.py:231(__get__) 842130 2.764 0.000 3.557 0.000 /usr/lib/python2.5/decimal.py:3339(_dec_from_triple)
tokenize.py 排在首位,这在我进行大量数字格式化时可能有一定意义。 Decimal.py 有意义,因为报告基本上是 90% 的数字。我不知道内置方法 match
是什么,因为我没有在我自己的代码中做任何正则表达式或类似的事情(Django 在做什么?)最接近的是我正在使用 itertools ifilter。
看来这些是罪魁祸首,如果我能弄清楚如何减少它们的处理时间,那么我的页面就会快得多。
有人对我如何开始减少这种情况有任何建议吗?我真的不知道如何在不简单地删除它们的情况下解决这个标记化/十进制问题。
更新:我对大部分数据运行了一些带/不带过滤器的测试,结果时间几乎相同,后者快一点但不是问题的原因。 tokenize.py 到底发生了什么?
最佳答案
由于您没有任何类型的代码示例,因此有很多事情可以假设您的问题。
这是我的假设:您正在使用 Django 的内置 ORM 工具和模型(即 sales-data = modelobj.objects().all() ),而在 PHP 端,您正在处理直接的 SQL 查询并使用一个查询集。
Django 正在对从数据库查询到 ORM/Model 对象和相关管理器(默认为 objects())的数据类型进行大量类型转换和转换。
在 PHP 中,您控制着转换并确切地知道如何从一种数据类型转换为另一种数据类型,您仅基于该问题就可以节省一些执行时间。
我建议尝试将一些花哨的数字工作转移到数据库中,特别是如果您正在进行基于记录集的处理 - 数据库从早餐中吃掉了这种处理。在 Django 中,您可以将 RAW SQL 发送到数据库:http://docs.djangoproject.com/en/dev/topics/db/sql/#topics-db-sql
我希望这至少能让你指明正确的方向......
关于python - 做一些 python 分析后,Django(?)对大型数据集真的很慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1173798/
我有一个 view我拖了一个UITableView在里面,还有 2 UIImageView s(第一个显示背景图像,第二个只是在 View 顶部显示一个非常小的标题和图像)。 它们都设置为 weak特
我尝试用 C# 编写简单的 PostgreSQL 查询。第一个 connection.open() 需要 20 秒。其他连接立即执行。 PGAdmin 工作也很慢。如果我打开“查看所有行”,它也需要大
我制作了一个 html5 视频播放器,我注意到如果当前播放的视频有点大,搜索时间会异常地长。 越接近终点,寻找的时间越长;独立于我之前是否去过那里/与当前时间点的距离有多近,或者我是否缓冲了整个视频。
我正在使用 MaterialDatePicker,但速度很慢。 public class MainActivity extends AppCompatActivity { MaterialDa
我想知道为什么 MyBatis 是 慢 在我的应用程序中。 对于 SELECT COUNT(*) ,所用时间为: 20 秒 - 第一个请求 2-3 秒 - 后续请求 缓存很可能使后续请求更快。 配置
我已经安装了一个默认的开箱即用的 FreeSwitch 实例,但是当我尝试进行内部调用(分机到分机)时,大约需要 12 秒才能建立调用并且我可以听到铃声。 当我查看日志时,我几乎立即看到了连接请求,但
我已经放弃了让它跑得更快的实际尝试。 我最大的问题是,当我插入 html 时,应用程序会变慢到爬行。我有一个进度条,我正在调用 QCoreApplication.processEvents() (顺便
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 9
Doxygen 在我们的代码库上运行大约需要 12 个小时。这主要是因为有很多代码要处理(约 1.5M 行)。然而,它很快就会接近我们无法进行夜间文档更新的地步,因为它们需要太长时间。我们已经不得不减
我正在重写我的旧渲染管道。我根据自己的喜好创建了一个非常精简的原型(prototype),令我震惊的是,我原来相当复杂且优化不佳的管道与 super 简单的原型(prototype)具有完全相同的性能
我想为我的网站使用 Gridster,但我需要使用“add_widget”命令添加很多小部件。我做了一个测试,我认为“add_widget”功能存在问题:网格越来越慢并且存在内存泄漏。 您可以在此视频
我有一份包含图表和表格的报告。 我正在使用 html2canvas与 jsPDF将此报告导出为 PDF 文件。 但是这个过程耗时很长,超过11000ms。 我尝试更改格式和质量,但没有任何效果。 请看
我正在查询大于时间戳的类的所有修订,使用: AuditReaderFactory .get(emf.createEntityManager()) .createQuery().forR
我最近想加速一个加密系统。而在这个系统中,它将使用mysql,因此它包括文件。 而且我发现系统运行缓慢并不是因为加解密,而是因为处理一些sql语句。 它将在运行时使用内存数据库,并使用 中的 mys
谁能看出为什么这需要大约 20 秒?我正在运行下面的代码以将 JSON 请求发布到本地服务器 192.168.1.127。 curl -H "Content-type: application/jso
我有两个表:Posts 和Tags,其中存储了用户发布的文章以及他们为文章附加的标签。 PostTags 表用于表示文章 ID 和标签 ID 的关系。结构如下: 帖子: id | title | au
一个我应该能够自己回答但我没有,而且在谷歌中也找不到任何答案的问题: 我有一个表,其中包含具有以下结构的 500 万行: CREATE TABLE IF NOT EXISTS `files_histo
以下查询在具有大约 50 万行的表上执行需要 20 多秒: SELECT images.id, images.user_id, images_locale.filename, extension, s
我正在使用 $.getJSON 来提取对象 list (100 个项目,不是一个大集合),但 XHR 调用需要 8-10 秒。 想了解我是否缺少某些内容或我可以采取哪些措施来加快我的计划? 最佳答案
在这段代码中,我从网站获取一个字符串并将其显示在标签上。在标签上显示字符串真的很慢!大约 10 秒。但是在控制台 println (date) 上打印字符串时是立即的。我该如何解决这个问题?
我是一名优秀的程序员,十分优秀!