- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我在数据库中有许多表,它们至少有一列包含一个 Url。这些在整个数据库中重复了很多次。所以我将它们规范化为一个专用表,我只在需要的地方使用数字 ID。我经常需要加入它们,因此数字 ID 比完整字符串要好得多。
在MySql + C++
中,为了一次插入很多Urls,我曾经使用多行INSERT IGNOREs
或者mysql_set_local_infile_handler()
。然后使用 IN ()
批处理 SELECT
以从数据库中拉回 ID。
在 C# + SQLServer
中,我注意到有一个 SqlBulkCopy
类在批量插入中非常有用且速度很快。但我还需要批量选择来解析插入后的 Url ID。 是否有任何这样的辅助类可以像 SELECT WHERE IN (many, urls, here)
一样工作?
或者对于在 C# 中以一致的方式将 Urls 转换为数字,您有更好的主意吗?我考虑过 crc32
'ing urls 或 crc64
'ing 他们但我担心碰撞。我不在乎碰撞是否很少,但如果不是……那将是一个问题。
PS:我们讨论数千万个 Url 是为了了解规模。
PS:对于基本的大型插入,SQLBulkCopy
比 SqlDbType.Structured
更快。此外,它还有用于状态跟踪回调的 SqlRowsCopied
事件。
最佳答案
还有比 SQLBulkCopy 更好的方法。
它叫做 Structured Parameters它允许您将表值参数传递给存储过程或通过 ADO.NET 进行查询。
文章中有代码示例,所以我只会强调你需要做些什么来启动它并工作:
UrlTable
UrlTable
UrlTable
具有相同结构的 DataTable
,用 URL 填充它并将它传递给 SqlCommand
through 作为结构化参数。请注意,列顺序对应关系在数据表和表类型之间至关重要。ADO.NET 在幕后所做的事情(如果您对查询进行概要分析,您会看到这一点)是在查询之前它声明了一个类型为 UrlTable
的变量并用什么填充它(INSERT 语句)您传入结构化参数。
除此之外,在查询方面,您可以使用 SQL 中的表值参数执行几乎所有操作(连接、选择等)。
关于C# 和 SQLServer 标准化大量的 Urls,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25241966/
在我的 Windows 类库(由 MVC 网站使用)中,我安装了 NugetPackage Microsoft.SqlServer.Types (Spatial)。 现在,我正在使用 ado.net
测试sql: 复制代码代码如下: SET STATISTICS IO ON SET STATISTICS TIME ON SELECT COUNT(1)&n
我正在从 SqlConnection 构建 DbContext。当我使用它时,我收到以下错误: The Entity Framework provider type 'System.Data.Enti
我使用dotNet 4.5创建了WCF服务。数据库层是使用Entity Framework 6构建的。 我使用IIS 8托管了该服务。它运行正常。 现在,我需要使用Windows窗体客户端使用该服务,
我正在尝试从 SqlServer 1 上的 sql 数据库中导出一些表。在我们的内部网 LAN(就在我旁边)中有一个我制作的临时 Sql Server,称为 SqlServer 2。 我不想备份整个数
Error 1 Copying file bin\EntityFramework.SqlServer.xml to obj\Debug\Package\PackageTmp\bin\Entit
我正在尝试使用 SMO 通过 Powershell 恢复数据库,但是当我尝试定义和使用服务器对象时,出现以下错误: Cannot convert argument "srv", with value:
出于某种原因,我需要将我的表列之一从“NOT NULL”更新为“NULL”。命令很简单: ALTER TABLE TBLOGDOCMESSAGE ALTER COLUMN PROCESSID BIGI
我想知道我正在尝试做的事情是否可行。我相信它是在 TSQL 中使用 PIVOT 函数,但对 PIVOT 函数没有足够的经验来知道从哪里开始。 基本上,我正在尝试采用以下名为 #tmpbudgetdat
我正在尝试将子查询作为带有条件的列。 我从 SQL Server 得到的错误是: 子查询返回了 1 个以上的值。当子查询跟随 =、!=、、>= 或当子查询用作表达式时,这是不允许的。 我正在选择更多的
我有一个正在查询的 SQL 服务器数据库,我只想在特定行为空时获取信息。我使用了一个 where 语句,例如: WHERE database.foobar = NULL 它不返回任何东西。但是,我知道
1、拼接字符串(整个字符串不分割)步骤: 首先在字符串的前后加单引号; 字符串中的变量以'''+@para+'''在字符串中表示; 若在执行时存在类型转换错误,则应用相应的类型
说明: 收缩日志的原因有很多种,有些是考虑空间不足,有些则是应用程序限制导致的。 ?
Rand()函数是系统自带的获取随机数的函数,可以直接运行select rand() 获取0~1之间的float型的数字。 如果想要获取0~100之间的整数随机数,可以这样使用 select ro
将以下内容保存为 openSql.bat 双击运行即可 复制代码 代码如下: @echo ========= SQL Server Ports =================== @ech
新增的APPLY表运算符把右表表达式应用到左表表达式中的每一行。它不像JOIN那样先计算那个表表达式都可以,APPLY必选先逻辑地计算左表达式。这种计算输入的逻辑顺序允许吧右表达式关联到左表表达式。
SQL Server本身提供了这么一个DMV来返回这些信息,它就是sys.dm_exec_sessions 。 比如在我的机器上做一下查询: 复制代码 代码如下: SELECT * FROM
尽管从技术上讲,其它排名函数的计算与ROW_NUMBER类似,但它们的的实际应用却少很多。RANK和DENSE——RANK主要用于排名和积分。NTILE更多地用于分析。 先创建一个示例表: 复制
1、文件和文件组的含义与关系 每个数据库有一个主数据文件.和若干个从文件。文件是数据库的物理体现。 文件组可以包括分布在多个逻辑分区的文件,实现负载平衡。文件组允许对文件进行分组,以便于管理和数据的
我想很多人都知道,在oracle里面,存储过程里面可以传入数组(如int[]),也就是说,可以传多条记录到数据,从而一起更新。减少数据库的请求次数。 但SqlServer呢?bulk Insert这
我是一名优秀的程序员,十分优秀!