- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要使用 php 将大型 XML 文件解析到 mysql(500.000 行 xml)。但使用下面的代码,一个 xml 文件需要几个小时。这如何优化? (我想也许制作一个数组来立即解析到 mysql,而不是一次解析每个变量?)
foreach ($data as $dat) {
$object = $dat;
$UID = $object['id'];
$test = mysql_query("SELECT * FROM reports WHERE UID = '$UID'");
if ($test['UNIQUEID'] ==null) {
$temp = array("MEDIA" => "{$name}");
foreach ($object as $obj){
mysql_query("INSERT INTO reports
(MEDIA, UID)
VALUES
('$name', '$UID')");
foreach ($obj as $ats) {
$attname = $ats['name'];
mysql_query("UPDATE reports
SET $attname = '$ats'
WHERE UID = '$UID'
");
}
}
}
echo "Done";
}
编辑:XML:
<object id="382177">
<attributes>
<attribute kind="number" name="REVNO">1</attribute>
<attribute kind="string" name="UNIQUEID">XXX</attribute>
<attribute kind="number" name="EVENTVERSION">1</attribute>
<attribute kind="string" name="EVENTASSOCID">4568190</attribute>
<attribute kind="number" name="EVENTASSOCRELNO">2</attribute>
<attribute kind="string" name="EVENTTYPE">PageFlow</attribute>
<attribute format="%Y-%m-%d %H:%M:%S" kind="time" name="EVENTTIME">2014-02-09 09:40:52</attribute>
<attribute kind="string" name="EVENTMSG">PageLocked=1</attribute>
<attribute kind="string" name="EVENTUSER">XXX</attribute>
<attribute kind="string" name="EVENTAPPL">XXX</attribute>
<attribute kind="string" name="NAME">XXX</attribute>
<attribute kind="string" name="NEWSROOM">XXX</attribute>
<attribute kind="string" name="PRODUCT">XXX</attribute>
<attribute kind="string" name="PUBDATE">11-02-2014</attribute>
<attribute kind="string" name="ZONE">XXX</attribute>
<attribute kind="string" name="EDITION">1</attribute>
<attribute kind="string" name="PAGENAME">XXX</attribute>
<attribute kind="number" name="PAGENO">1</attribute>
<attribute kind="string" name="ARTICLE"></attribute>
</attributes>
</object>
编辑 2:感谢 Mike,这段代码极大地提高了性能:
foreach ($data as $key) {
$lat = array();
$lat = $key->attributes;
$UID = $key['id'];
mysql_query("INSERT INTO reports
(MEDIA, UID, REVNO, UNIQUEID, EVENTVERSION, EVENTASSOCID, EVENTASSOCRELNO, EVENTTYPE, EVENTTIME, EVENTMSG, EVENTUSER, EVENTAPPL, NAME, NEWSROOM, PRODUCT, PUBDATE, ZONE, EDITION, PAGENAME, PAGENO, ARTICLE, LAYOUTDESK, LAYOUTSTATE, RUNNINGPAGENO, SECTIONNAME, SECTIONNO, LASTOPERATOR, LASTREV, LASTDATAOPERATOR, LASTDATAREV, TYPE, SUBTYPE, LAYOUTTEMPLATE, EDITORIALSOURCEUID)
VALUES
('$name', '$UID', '{$lat->attribute[0]}', '{$lat->attribute[1]}', '{$lat->attribute[2]}', '{$lat->attribute[3]}', '{$lat->attribute[4]}', '{$lat->attribute[5]}', '{$lat->attribute[6]}', '{$lat->attribute[7]}', '{$lat->attribute[8]}', '{$lat->attribute[9]}', '{$lat->attribute[10]}', '{$lat->attribute[11]}', '{$lat->attribute[12]}', '{$lat->attribute[13]}', '{$lat->attribute[14]}', '{$lat->attribute[15]}', '{$lat->attribute[16]}', '{$lat->attribute[17]}', '{$lat->attribute[18]}', '{$lat->attribute[19]}', '{$lat->attribute[20]}', '{$lat->attribute[21]}', '{$lat->attribute[22]}', '{$lat->attribute[23]}', '{$lat->attribute[24]}', '{$lat->attribute[25]}', '{$lat->attribute[26]}', '{$lat->attribute[27]}', '{$lat->attribute[28]}', '{$lat->attribute[29]}', '{$lat->attribute[30]}', '{$lat->attribute[31]}')");
}
最佳答案
插入一条记录,然后一次更新多个列将带来可怕的性能。您应该从 XML 中解析每条记录的所有数据,并将其全部插入到一个 INSERT
中。这会给你带来性能上的巨大提升
此外,如果您在插入之前检查每个插入的唯一性,您应该使用唯一索引修改架构并使用“INSERT...IGNORE...”,检查受影响的行数以检查每行是否已插入(如果您需要检查)。
您可以使用INSERT
的批处理形式一次插入一批记录。
如果这还不够,请尝试先将 XML 解析为 CSV,然后使用 LOAD DATA INFILE
批量插入所有数据。
关于php - 优化mysql查询-foreach循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22831535/
我有三张 table 。表 A 有选项名称(即颜色、尺寸)。表 B 有选项值名称(即蓝色、红色、黑色等)。表C通过将选项名称id和选项名称值id放在一起来建立关系。 我的查询需要显示值和选项的名称,而
在mysql中,如何计算一行中的非空单元格?我只想计算某些列之间的单元格,比如第 3-10 列之间的单元格。不是所有的列...同样,仅在该行中。 最佳答案 如果你想这样做,只能在 sql 中使用名称而
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
我正在为版本7.6进行Elasticsearch查询 我的查询是这样的: { "query": { "bool": { "should": [ {
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
是否可以编写一个查询来检查任一子查询(而不是一个子查询)是否正确? SELECT * FROM employees e WHERE NOT EXISTS (
我找到了很多关于我的问题的答案,但问题没有解决 我有表格,有数据,例如: Data 1 Data 2 Data 3
以下查询返回错误: 查询: SELECT Id, FirstName, LastName, OwnerId, PersonEmail FROM Account WHERE lower(PersonEm
以下查询返回错误: 查询: SELECT Id, FirstName, LastName, OwnerId, PersonEmail FROM Account WHERE lower(PersonEm
我从 EditText 中获取了 String 值。以及提交查询的按钮。 String sql=editQuery.getText().toString();// SELECT * FROM empl
我有一个或多或少有效的查询(关于结果),但处理大约需要 45 秒。这对于在 GUI 中呈现数据来说肯定太长了。 所以我的需求是找到一个更快/更高效的查询(几毫秒左右会很好)我的数据表大约有 3000
这是我第一次使用 Stack Overflow,所以我希望我以正确的方式提出这个问题。 我有 2 个 SQL 查询,我正在尝试比较和识别缺失值,尽管我无法将 NULL 字段添加到第二个查询中以识别缺失
什么是动态 SQL 查询?何时需要使用动态 SQL 查询?我使用的是 SQL Server 2005。 最佳答案 这里有几篇文章: Introduction to Dynamic SQL Dynami
include "mysql.php"; $query= "SELECT ID,name,displayname,established,summary,searchlink,im
我有一个查询要“转换”为 mysql。这是查询: select top 5 * from (select id, firstName, lastName, sum(fileSize) as To
通过我的研究,我发现至少从 EF 4.1 开始,EF 查询上的 .ToString() 方法将返回要运行的 SQL。事实上,这对我来说非常有用,使用 Entity Framework 5 和 6。 但
我在构造查询来执行以下操作时遇到问题: 按activity_type_id过滤联系人,仅显示最近事件具有所需activity_type_id或为NULL(无事件)的联系人 表格结构如下: 一个联系人可
如何让我输入数据库的信息在输入数据 5 分钟后自行更新? 假设我有一张 table : +--+--+-----+ |id|ip|count| +--+--+-----+ |
我正在尝试搜索正好是 4 位数字的 ID,我知道我需要使用 LENGTH() 字符串函数,但找不到如何使用它的示例。我正在尝试以下(和其他变体)但它们不起作用。 SELECT max(car_id)
我有一个在 mysql 上运行良好的 sql 查询(查询 + 连接): select sum(pa.price) from user u , purchase pu , pack pa where (
我是一名优秀的程序员,十分优秀!