python - PYMSSQL/SQL Server 2014 : is there a limit to the length of a list of PKs to use as a subquery?-6ren

python - PYMSSQL/SQL Server 2014 : is there a limit to the length of a list of PKs to use as a subquery?

转载作者：行者123 更新时间：2023-12-01 03:10:45

27

4

我已经实现了一个 python 脚本，以便使用以下方案将数百万个文档(由 .NET Web 应用程序生成，所有内容都放入一个目录中)划分到子文件夹中:年/月/批处理，因为所有这些文档来自的任务最初是分成批处理的。我的 python 脚本对 SQL Server 2014 执行查询，其中包含每个文档所需的所有数据，特别是创建它的月份和年份。然后它使用 shutil 模块移动 pdf。因此，我首先执行第一个查询来获取给定月份和年份的批处理列表:

queryBatches = '''SELECT DISTINCT IDBATCH
                FROM [DBNAME].[dbo].[WORKS]
                WHERE YEAR(DATETIMEWORK)={} AND MONTH(DATETIMEWORK)={}'''.format(year, month)

然后我执行:

for batch in batches:
  query = '''SELECT IDWORK, IDBATCH, NAMEDOCUMENT
             FROM [DBNAME].[dbo].[WORKS]
             WHERE NAMEDOCUMENTI IS NOT NULL and
                   NAMEDOCUMENT not like '/%/%/%/%.pdf' and 
                   YEAR(DATETIMEWORK)={} and 
                   MONTH(DATETIMEWORK)={} and 
                   IDBATCH={}'''.format(year,month,batch[0])

根据 PYMSSQL 使用文档，其记录被收集到游标中。所以我继续:

IDWorksUpdate = []
row = cursor.fetchone()
while row:

  if moveDocument(...):
    IDWorksUpdate.append(row[0])
  row = cursor.fetchone()

最后，当周期结束时，在 IDWorksUpdate 中，我拥有 WORKS 的所有 PK，其文档已成功正确移动到子文件夹中。因此，我关闭光标和连接，然后实例化新的。最后我执行:

subquery = '('+', '.join(str(x) for x in IDWorksUpdate)+')'
query = '''UPDATE [DBNAME].[dbo].[WORKS] SET NAMEDOCUMENT = \'/{}/{}/{}/\'+NAMEDOCUMENT WHERE IDWORK IN {}'''.format(year,month,idbatch,subquery)

newConn = pymssql.connect(server='localhost', database='DBNAME')
newCursor = newConn.cursor()

try:
    newCursor.execute(query)
    newConn.commit()
except:
    newConn.rollback()
    log.write('Error on updating documents names in database of works {}/{} of batch {}'.format(year,month,idbatch))
finally:
    newCursor.close()
    del newCursor
    newConn.close()

今天早上，我发现只有几个批处理的更新查询在数据库中执行失败，即使文档已正确移动到子目录中也是如此。该批处理有超过 55000 个文档需要移动，因此 IDWorksUpdate 是否会溢出并导致最终更新查询的创建失败？我认为 55000 并不是一个很大的整数列表。问题是，在 PYMSSQL 中，我们不能同时对同一数据库有多个连接/游标，因此我无法在移动相应文件时更新记录。所以我想创建一个文档被正确移动的作品的 PK 列表，最后用新的连接/光标更新它们。可能发生了什么？我做错了吗？

更新

我刚刚编写了一个简单的脚本来重现将要执行的查询以更新记录，这是我从 SQL Server 收到的错误:

The query processor ran out of internal resources and could not produce a query plan. This is a rare event and only expected for extremely complex queries or queries that reference a very large number of tables or partitions. Please simplify the query. If you believe you have received this message in error, contact Customer Support Services for more information.

这是查询:

UPDATE [DBNAME].[dbo].[WORKS] SET NAMEDOCUMENT = '/2016/12/1484/'+NAMEDOCUMENT WHERE IDWORK IN (list of 55157 PKs)

事实是该表非常大(大约有 1400 万条记录)。但我需要 PK 列表，因为只有文档已正确处理和移动的任务才能更新。我不能简单地运行:

UPDATE [DBNAME].[dbo].[WORKS] SET NAMEDOCUMENT = '/2016/12/1484/'+NAMEDOCUMENT WHERE YEAR(DATETIMEWORK)=2016 and 
MONTH(DATETIMEWORK)=12 and IDBATCH=1484

这是因为当我们的服务器受到加密锁攻击时，我必须仅处理和移动仍然存在的文档，等待其他文档被释放。我应该将这些字符串拆分为子列表吗？怎么办？

更新2

似乎以下可能是一个解决方案:我将 PK 列表分成 10000 个 block (一个完全实验的数字)，然后执行与 block 一样多的查询，每个查询都有一个 block 作为子查询。

def updateDB(listID, y, m, b, log):

newConn = pymssql.connect(server='localhost', database='DBNAME')
newCursor = newConn.cursor()

if len(listID) <= 10000:

    subquery = '('+', '.join(str(x) for x in listID)+')'
    query = '''UPDATE [DBNAME].[dbo].[WORKS] SET NAMEDOCUMENT= \'/{}/{}/{}/\'+NAMEDOCUMENT WHERE IDWORKIN {}'''.format(y,m,b,subquery)

    try:
        newCursor.execute(query)
        newConn.commit()
    except:
        newConn.rollback()
        log.write('...')
        log.write('\n\n')
    finally:
        newCursor.close()
        del newCursor
        newConn.close()   
else:
    chunksPK = [listID[i:i + 10000] for i in xrange(0, len(listID), 10000)]

    for sublistPK in chunksPK:

        subquery = '('+', '.join(str(x) for x in sublistPK)+')'
        query = '''UPDATE [DBNAME].[dbo].[WORKS] SET NAMEDOCUMENT= \'/{}/{}/{}/\'+NAMEDOCUMENT WHERE IDWORK IN {}'''.format(y,m,b,subquery)

        try:
            newCursor.execute(query)
            newConn.commit()
        except:
            newConn.rollback()
            log.write('Could not execute partial {}'.format(query))
            log.write('\n\n')

    newCursor.close()
    del newCursor
    newConn.close()

这可能是一个好的/安全的解决方案吗？

最佳答案

正如MSDN文档中所述

IN (Transact-SQL)

Explicitly including an extremely large number of values (many thousands of values separated by commas) within the parentheses, in an IN clause can consume resources and return errors 8623 or 8632. To work around this problem, store the items in the IN list in a table, and use a SELECT subquery within an IN clause.

(您引用的错误消息是错误 8623。)

将 IN 列表值放入临时表中，然后使用

... WHERE IDWORK IN (SELECT keyValue FROM #inListTable)

让我觉得比你描述的“分块”方法更直接。

关于python - PYMSSQL/SQL Server 2014 : is there a limit to the length of a list of PKs to use as a subquery?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42913329/

27

4

0

文章推荐： python - 调试潜在狄利克雷分配实现

文章推荐： jquery - 在 Jquery 中加载页面时展开第一个菜单选项

文章推荐： Scala:从嵌套案例类到展平案例类

r - 如何创建像这样的多维度列表 DATA<-list(list(list(),list(),list()),list(list(),list(),list()),list(list() ，列表()，列表()))？
我想使用 R 预定义这样的列表 DATA<-list( list(list(),list(),list()), list(list(),list(),list()), list(list(),l
haskell - 如何 `List + List = List[List]]`
如何将一个列表添加到另一个列表，返回一个列表的列表？ foo :: [a] -> [a] -> [[a]] 例如，我想要的结果是: foo [1,2] [3,4] 将是 [[1,2], [3,4]]。
python - 从 "lists of lists"和 "list"创建两个单独的 "list of lists"
我还没有在这里找到类似问题的解决方案，所以我会寻求你的帮助。有 2 个列表，其中之一是列表列表: categories = ['APPLE', 'ORANGE', 'BANANA'] test_re
python - "Flatten"list 包含lists of lists to lists of lists
这个问题不同于Converting list of lists / nested lists to list of lists without nesting (这会产生一组非常具体的响应，但无法解决
java - 无法从 List 转换为 List>
原始列表转换为 List正好。为什么原始列表的列表不能转换为 List 的列表？ { // works List raw = null; List wild = raw; } {
java - 涉及类型参数时，List> 不能赋值给 List>
在下面的代码中，get()被调用并将其结果分配给类型为 List> 的变量. get()返回 List>并在类型参数为 T 的实例上调用设置为 ? ，所以它应该适合。 import java.util
java - 无法从 List 转换为 List>
原始列表转换为 List正好。为什么原始列表的列表不能转换为 List 的列表? { // works List raw = null; List wild = raw; } {
scala - 在不够多态的情况下，为什么实现 `List a -> List a -> List a` 的方法比 `List Char -> List Char -> List Char` 少
在insufficiently-polymorphic 作者说: def foo[A](fst: List[A], snd: List[A]): List[A] There are fewer way
kotlin - List > + List = List <任何>？
我有下面的代码有效。 class ListManipulate(val list: List, val blockCount: Int) { val result: MutableList>
java - 有没有一种好的方法可以将 List>> 转换为 List>> 而不需要 3 个嵌套循环？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
Scala - 将列表列表转换为单个列表 : List[List[A]] to List[A]
在 scala (2.9) 中转换列表列表的最佳方法是什么？我有一个 list : List[List[A]] 我想转换成 List[A] 如何递归地实现这一点？或者还有其他更好的办法吗？最佳答案
list - 标准ML : Searching through a list of lists
我编写了这个函数来确定给定元素是否存储在元组列表的列表中，但目前它只搜索第一个列表。我将如何搜索其余列表？ fun findItem (name : command, ((x,y)::firstlis
Java List of List of List，更好的解决方案？
我创建了一个类名 objectA，它有 4 个变量:约会时间;字符串文本；变量 1，变量 2 我需要创建一个 ObjectA() 列表。然后首先按时间对它们进行分组，其次按 var1，然后按 var2
python : Removing a List from List of List?
我有一套说法 char={'J','A'} 和列表的列表 content = [[1,'J', 2], [2, 'K', 3], [2, 'A', 3], [3,'A', 9], [5, 'J', 9
java - 访问List>>> titles = new ArrayList>>>();
我有以下列表 List >>> titles = new ArrayList >>> ();我想访问它的元素，但我不知道该怎么做.. 该列表有 1 个元素，它又包含 3 个元素，这 3 个元素中的
scala - 如何将 List[List[Long]] 转换为 List[List[Int]]？
转换 List[List[Long]] 的最佳方法是什么？到 List[List[Int]]在斯卡拉？例如，给定以下类型列表 List[List[Long]] val l: List[List[Lo
Java:将 List> 转换为 List>
我有一个来自 Filereader (String) 的 List-List，如何将其转换为 List-List (Double):我必须返回一个包含 line-Array 的第一个 Values 的
c# - 将 List> 转换为 List>
我收集了List> 。我需要将其转换为List> 。这是我尝试过的， List> dataOne = GetDataOne(); var dataTwo = dataOne.Select(x => x
java - List> 和 List 是 java 中不兼容的类型
这个问题在这里已经有了答案: Cannot convert from List to List> (3 个答案) 关闭 7 年前。我没有得到这段代码以任何方式编译: List a = new Ar
java - List> 和 List 是 java 中不兼容的类型
这个问题在这里已经有了答案: Cannot convert from List to List> (3 个答案) 关闭 7 年前。我没有得到这段代码以任何方式编译: List a = new Ar

首页

博学

6Ren·AI

商城

python - PYMSSQL/SQL Server 2014 : is there a limit to the length of a list of PKs to use as a subquery?