gpt4 book ai didi

sql-server - Spark 和 MSSQL 插入速度

转载 作者:行者123 更新时间:2023-12-05 05:19:17 27 4
gpt4 key购买 nike

我遇到了一个问题,使用 JDBC 驱动程序将数十万条记录插入 MSSQL 数据库大约需要一个小时。

  • 星火版本:2.2.0
  • MSSQL JDBC 驱动版本:6.1.0.jre8

查看配置文件我注意到 Spark(或者最有可能是 JDBC 驱动程序)正在为我的 DataFrame 中的每一行生成一个单独的插入,这当然很慢。

我查看了 JDBC 配置,但没有找到启用批量插入的方法。

有没有办法配置 Spark 应用程序,使其使用 BULK INSERT 插入数据或生成大批量数据?

最佳答案

微软发布特别版Spark connector for Azure SQL Database提供同样适用于普通 MsSql 数据库的此功能。您可以在他们的 GitHub 页面上查看批量插入示例 https://github.com/Azure/azure-sqldb-spark#bulk-copy-to-azure-sql-database-or-sql-server

关于sql-server - Spark 和 MSSQL 插入速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46647540/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com