C#优化:在数据库中插入2亿行

Dav*_*ang 5 c# datatable sqlbulkcopy

我有以下(简化)代码,我想优化速度:

long inputLen = 50000000; // 50 million 
DataTable dataTable = new DataTable();
DataRow dataRow;
object[] objectRow;
while (inputLen--)
{
    objectRow[0] = ...
    objectRow[1] = ...
    objectRow[2] = ...

    // Generate output for this input
    output = ...

    for (int i = 0; i < outputLen; i++) // outputLen can range from 1 to 20,000
    {
         objectRow[3] = output[i];
         dataRow = dataTable.NewRow();
         dataRow.ItemArray = objectRow;
         dataTable.Rows.Add(dataRow);
    }
}

// Bulk copy
SqlBulkCopy bulkTask = new SqlBulkCopy(connection, SqlBulkCopyOptions.TableLock, null);
bulkTask.DestinationTableName = "newTable";
bulkTask.BatchSize = dataTable.Rows.Count;
bulkTask.WriteToServer(dataTable);
bulkTask.Close();
Run Code Online (Sandbox Code Playgroud)

我已经在使用SQLBulkCopy试图加快速度,但似乎为DataTable本身分配值证明是缓慢的.

我不知道DataTables是如何工作的所以我想知道我是否通过首先创建一个可重用的数组,然后将其分配给DataRow,然后将DataRow添加到DataTable来创建不必要的开销?或者首先使用DataTable不是最佳的?输入来自数据库.

我不太关心LOC,只关心速度.谁能就此给出一些建议?

Sim*_*ier 13

对于这么大的桌子,你应该改用

public void WriteToServer(IDataReader reader)
Run Code Online (Sandbox Code Playgroud)

方法.

这可能意味着你必须IDataReader用自己的代码实现一个"虚假"的界面(如果你没有从现有的数据中获取数据IDataReader),但这样,你将从头到尾获得"流媒体",并且将避免2亿次循环.