您的位置:首页 > 其它

一些插入记录的方法比较

2012-10-11 17:55 323 查看
有同事写了个工具,对C#中,两种插入记录到SQL SERVER数据库的方法进行了比较,发现二者的性能相差天与地:

1、SqlBulkCopy,批量插入方式,5万条记录,仅花4秒
2、拼凑出一条条SQL语句,单条插入,5万条记录,耗时7分钟

//方式一,批量插入
using (SqlBulkCopy sqlBulkCopy = new SqlBulkCopy((SqlConnection)connection)) 
            { 
                sqlBulkCopy.DestinationTableName = dataTable.TableName; 
                sqlBulkCopy.BatchSize = 100000; // 一次批量的插入的数据量 
                sqlBulkCopy.BulkCopyTimeout = 360;  
                // 自定义的DataTable和数据库的字段进行对应 
                foreach (DataColumn column in dataTable.Columns) 
                { 
                    sqlBulkCopy.ColumnMappings.Add(column.ColumnName, column.ColumnName); 
                } 
                sqlBulkCopy.WriteToServer(dataTable); 
            }

//方式二,单条插入
sqlString = "INSERT INTO Table2 (Int,Long,Float,Real,Date,NText,String1,String2,String3,String4) VALUES (@Int,@Long,@Float,@Real,@Date,@NText,@String1,@String2,@String3,@String4)"; 
                IDataParameter[] parameters = new IDataParameter[10]; 
                int count = Convert.ToInt32(txtCount.Text); 
                for (int i = 0; i < count; i++) 
                { 
                    parameters[0] = DBHelper.CreateParameter("Int", i); 
                    parameters[1] = DBHelper.CreateParameter("Long", i * 10); 
                    parameters[2] = DBHelper.CreateParameter("Float", i * 100 + 0.33); 
                    parameters[3] = DBHelper.CreateParameter("Real", i * 1000 + 0.999); 
                    parameters[4] = DBHelper.CreateParameter("Date", DateTime.Now); 
                    parameters[5] = DBHelper.CreateParameter("NText", DateTime.Now.ToLongTimeString()); 
                    parameters[6] = DBHelper.CreateParameter("String1", "String1_" + i.ToString()); 
                    parameters[7] = DBHelper.CreateParameter("String2", "String2_" + (i * 100 + 0.33).ToString()); 
                    parameters[8] = DBHelper.CreateParameter("String3", "String3_" + (i * 1000 + 0.999).ToString()); 
                    parameters[9] = DBHelper.CreateParameter("String4", "String4_" + DateTime.Now.ToShortDateString() + " _ " + DateTime.Now.ToLongDateString());
                    DBHelper.ExecuteNonQuery(connection, CommandType.Text, sqlString, parameters); 
                } 
                connection.Close();

为什么二者相差会这么大呢?
类似方式二的方式其实我也经常使用,数据库连接串在循环开始前已经打开,且只打开一次,循环结束再关闭,看起来无可挑剔。
不过我一直怀疑用代码来操作数据库,速度比不上直接在数据库里操作快。所以今天特地在数据库运行以下语句

3、方式三,直接在数据库运行循环插入
use [test]
go

TRUNCATE TABLE table2;
declare @i int
set @i = 0;
while @i < 50000
BEGIN
INSERT INTO [dbo].[Table2]
           ([Int]
           ,[Long]
           ,[Float]
           ,[Real]
           ,[Date]
           ,[NText]
           ,[String1]
           ,[String2]
           ,[String3]
           ,[String4])
     VALUES
           (0
           ,0
           ,0.33
           ,0.999
           ,'2012-10-10 15:23:01.433'
           ,'15:23:01'
           ,'String1_0                                         '
           ,'String2_0.33                                                                                        '
           ,'String3_0.999                                                                                                                                                                                           '
           ,'String4_2012-10-10 _ 2012年10月10日                                                                                                                                                                                                                            '
           );
           SET @i = @i + 1;
end;

结果时间也是7分多,跟在C#里操作不相上下!
恰好同事这样告诉我:

今天查网上的文章,为啥微软提供批量写入和单条插入性能差异这么大
结果是,批量是直接复制文件方式进行写入,因此各服务器差不多
单条是直接反映数据库读写性能表现,每插一条需要遍历整个表然后才插入
因此快慢是真实反映数据库读写性能数据的速度。

插一条记录需要遍历整个表?这种说法我是第一次听到,将信将疑。
方式三这里,是每插入一条记录就commit一次事务的,是这里耗了时间吧?但是SQL SERVER写数据时,是不直接写硬盘的,而是修改内存中的数据,然后定期check in,将改动写到磁盘,或者有什么操作触发了会用到这些脏数据(dirty data),也不得不写回到硬盘。既然如此,平常的commit数据会这么消耗资源吗?
不清楚。但可以试一下。
将方式三稍加修改,循环外显示加上事务,这样子应该会取消了循环体内,原先默认的每插入一条就提交一次事务的设置:
use [test]
go

TRUNCATE TABLE table2;
declare @i int
set @i = 0;
BEGIN TRAN;
while @i < 50000
BEGIN
INSERT INTO [dbo].[Table2]
           ([Int]
           ,[Long]
           ,[Float]
           ,[Real]
           ,[Date]
           ,[NText]
           ,[String1]
           ,[String2]
           ,[String3]
           ,[String4])
     VALUES
           (0
           ,0
           ,0.33
           ,0.999
           ,'2012-10-10 15:23:01.433'
           ,'15:23:01'
           ,'String1_0                                         '
           ,'String2_0.33                                                                                        '
           ,'String3_0.999                                                                                                                                                                                           '
           ,'String4_2012-10-10 _ 2012年10月10日                                                                                                                                                                                                                            '
           );
           SET @i = @i + 1;
end;
COMMIT TRAN;

结果性能获得飞跃,5万条记录只有4秒!

其实这也可以通过方式4来加以印证
4、方式4
建立一个与table2相同结构的表table1,然后直接INSERT ... SELECT...
TRUNCATE TABLE table1;
INSERT INTO [test].[dbo].[Table1]
           ([Int]
           ,[Long]
           ,[Float]
           ,[Real]
           ,[Date]
           ,[NText]
           ,[String1]
           ,[String2]
           ,[String3]
           ,[String4])
SELECT [Int]
      ,[Long]
      ,[Float]
      ,[Real]
      ,[Date]
      ,[NText]
      ,[String1]
      ,[String2]
      ,[String3]
      ,[String4]
  FROM [test].[dbo].[Table2]

结果也是4秒,不相伯仲。

方式一里面,SqlBulkCopy,是将一个DataTable对象导入到数据库中,导入前,直接编辑这个DataTable就行了,比较方便。
另外,这个方法类似于SQL SERVER里面的BULK INSERT,而BULK INSERT在数据库为简单模式的情况下,是不产生日志的,所以这个SqlBulkCopy,也就是方式一应该是最快的。
SqlBulkCopy这个方法我觉得有点类似使用SqlDataAdapter,以往使用经验中,这个操作也比单条插入要快,但那时不知道是什么原因。
其实现在也不清楚是什么原因啊!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: