将大数据查询(60k+ 行)导出到 Excel

RJB*_*RJB 5 javascript c# asp.net excel gridview

我创建了一个报告工具作为内部 Web 应用程序的一部分。该报告将所有结果显示在一个 GridView 中,我使用 JavaScript 将 GridView 的内容逐行读取到 Excel 对象中。JavaScript 继续在不同的工作表上创建数据透视表。

不幸的是,我没想到如果返回超过几天,GridView 的大小会导致浏览器过载问题。该应用程序每天有几千条记录,假设每月有 6 万条记录,理想情况下我希望能够返回长达一年的所有结果。行数导致浏览器挂起或崩溃。

我们在带有 SQL Server 的 Visual Studio 2010 上使用 ASP.NET 3.5,预期的浏览器是 IE8。该报告由一个 gridview 组成,它根据用户选择的人群从少数存储过程中的一个获取数据。网格视图位于 UpdatePanel 中:

<asp:UpdatePanel ID="update_ResultSet" runat="server">
<Triggers>
    <asp:AsyncPostBackTrigger ControlID="btn_Submit" />
</Triggers>
<ContentTemplate>
<asp:Panel ID="pnl_ResultSet" runat="server" Visible="False">
    <div runat="server" id="div_ResultSummary">
        <p>This Summary Section is Automatically Completed from Code-Behind</p>
    </div>
        <asp:GridView ID="gv_Results" runat="server" 
            HeaderStyle-BackColor="LightSkyBlue" 
            AlternatingRowStyle-BackColor="LightCyan"  
            Width="100%">
        </asp:GridView>
    </div>
</asp:Panel>
</ContentTemplate>
</asp:UpdatePanel>
Run Code Online (Sandbox Code Playgroud)

我对我的团队来说相对较新,所以我遵循了他们将 sproc 返回到 DataTable 并将其用作后面代码中的 DataSource 的典型做法:

    List<USP_Report_AreaResult> areaResults = new List<USP_Report_AreaResult>();
    areaResults = db.USP_Report_Area(ddl_Line.Text, ddl_Unit.Text, ddl_Status.Text, ddl_Type.Text, ddl_Subject.Text, minDate, maxDate).ToList();
    dtResults = Common.LINQToDataTable(areaResults);

    if (dtResults.Rows.Count > 0)
    {
        PopulateSummary(ref dtResults);
        gv_Results.DataSource = dtResults;
        gv_Results.DataBind();
Run Code Online (Sandbox Code Playgroud)

(我知道你在想什么!但是是的,从那以后我学到了更多关于参数化的知识。)

LINQToDataTable 函数没什么特别的,只是将列表转换为数据表。

有几千条记录(最多几天),这很好用。GridView 显示结果,并且有一个按钮供用户单击以启动 JScript 导出器。外部 JavaScript 函数将每一行读入 Excel 工作表,然后使用它来创建数据透视表。数据透视表很重要!

function exportToExcel(sMyGridViewName, sTitleOfReport, sHiddenCols) {
//sMyGridViewName = the name of the grid view, supplied as a text
//sTitleOfReport = Will be used as the page header if the spreadsheet is printed
//sHiddenCols = The columns you want hidden when sent to Excel, separated by semicolon (i.e. 1;3;5).
//              Supply an empty string if all columns are visible.

var oMyGridView = document.getElementById(sMyGridViewName);

//If no data is on the GridView, display alert.
if (oMyGridView == null)
    alert('No data for report');
else {
    var oHid = sHiddenCols.split(";");  //Contains an array of columns to hide, based on the sHiddenCols function parameter
    var oExcel = new ActiveXObject("Excel.Application");
    var oBook = oExcel.Workbooks.Add;
    var oSheet = oBook.Worksheets(1);
    var iRow = 0;
    for (var y = 0; y < oMyGridView.rows.length; y++)
    //Export all non-hidden rows of the HTML table to excel.
    {
        if (oMyGridView.rows[y].style.display == '') {
            var iCol = 0;
            for (var x = 0; x < oMyGridView.rows(y).cells.length; x++) {
                var bHid = false;
                for (iHidCol = 0; iHidCol < oHid.length; iHidCol++) {
                    if (oHid[iHidCol].length !=0 && oHid[iHidCol] == x) {
                        bHid = true;
                        break; 
                    } 
                }
                if (!bHid) {
                    oSheet.Cells(iRow + 1, iCol + 1) = oMyGridView.rows(y).cells(x).innerText;
                    iCol++;
                }
            }
            iRow++;
        }
    }
Run Code Online (Sandbox Code Playgroud)

我想要做的是:创建一个解决方案(可能是客户端),可以处理这些数据并将其处理成 Excel。有人可能会建议使用HtmlTextWriter,但 afaik 不允许自动生成数据透视表并创建一个令人讨厌的弹出警告......

我试过的:

  • 填充一个 JSON 对象——我仍然认为这有潜力,但我还没有找到让它工作的方法。
  • 使用 SQLDataSource——我似乎无法使用它来获取任何数据。
  • 分页和循环页面 - 混合进度。虽然通常很难看,但我仍然遇到问题,即为显示的每个页面查询和返回整个数据集。

更新: 我仍然对替代解决方案持开放态度,但我一直在追求 JSON 理论。我有一个有效的服务器端方法,可以从 DataTable 生成 JSON 对象。我不知道如何将该 JSON 传递到(外部)exportToExcel JavaScript 函数中....

    protected static string ConstructReportJSON(ref DataTable dtResults)
    {
        StringBuilder sb = new StringBuilder();
        sb.Append("var sJSON = [");
        for (int r = 0; r < dtResults.Rows.Count; r++)
        {
            sb.Append("{");
            for (int c = 0; c < dtResults.Columns.Count; c++)
            {
                sb.AppendFormat("\"{0}\":\"{1}\",", dtResults.Columns[c].ColumnName, dtResults.Rows[r][c].ToString());
            }
            sb.Remove(sb.Length - 1, 1); //Truncate the trailing comma
            sb.Append("},");
        }
        sb.Remove(sb.Length - 1, 1);
        sb.Append("];");
        return sb.ToString();
    }
Run Code Online (Sandbox Code Playgroud)

任何人都可以展示如何将此 JSON 对象携带到外部 JS 函数中的示例吗?或任何其他导出到 Excel 的解决方案。

Gre*_*reg 6

编写 CSV 文件既简单又高效。但是,如果您需要 Excel,也可以通过使用 Microsoft Open XML SDK 的 open XML Writer以合理有效的方式完成,即可以处理 60,000 多行。

  1. 如果您还没有安装 Microsoft Open SDK,请安装它(谷歌“下载 microsoft open xml sdk”)
  2. 创建控制台应用程序
  3. 添加对 DocumentFormat.OpenXml 的引用
  4. 添加对 WindowsBase 的引用
  5. 尝试运行一些像下面这样的测试代码(需要一些使用)

只需在http://polymathprogrammer.com/2012/08/06/how-to-properly-use-openxmlwriter-to-write-large-excel-files/ 上查看 Vincent Tan 的解决方案 (下面,我稍微清理了他的示例帮助新用户。)

在我自己的使用中,我发现使用常规数据非常简单,但我确实必须从我的真实数据中去除“\0”字符。

using DocumentFormat.OpenXml;
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Spreadsheet;
Run Code Online (Sandbox Code Playgroud)

...

        using (var workbook = SpreadsheetDocument.Create("SomeLargeFile.xlsx", SpreadsheetDocumentType.Workbook))
        {
            List<OpenXmlAttribute> attributeList;
            OpenXmlWriter writer;

            workbook.AddWorkbookPart();
            WorksheetPart workSheetPart = workbook.WorkbookPart.AddNewPart<WorksheetPart>();

            writer = OpenXmlWriter.Create(workSheetPart);
            writer.WriteStartElement(new Worksheet());
            writer.WriteStartElement(new SheetData());

            for (int i = 1; i <= 50000; ++i)
            {
                attributeList = new List<OpenXmlAttribute>();
                // this is the row index
                attributeList.Add(new OpenXmlAttribute("r", null, i.ToString()));

                writer.WriteStartElement(new Row(), attributeList);

                for (int j = 1; j <= 100; ++j)
                {
                    attributeList = new List<OpenXmlAttribute>();
                    // this is the data type ("t"), with CellValues.String ("str")
                    attributeList.Add(new OpenXmlAttribute("t", null, "str"));

                    // it's suggested you also have the cell reference, but
                    // you'll have to calculate the correct cell reference yourself.
                    // Here's an example:
                    //attributeList.Add(new OpenXmlAttribute("r", null, "A1"));

                    writer.WriteStartElement(new Cell(), attributeList);

                    writer.WriteElement(new CellValue(string.Format("R{0}C{1}", i, j)));

                    // this is for Cell
                    writer.WriteEndElement();
                }

                // this is for Row
                writer.WriteEndElement();
            }

            // this is for SheetData
            writer.WriteEndElement();
            // this is for Worksheet
            writer.WriteEndElement();
            writer.Close();

            writer = OpenXmlWriter.Create(workbook.WorkbookPart);
            writer.WriteStartElement(new Workbook());
            writer.WriteStartElement(new Sheets());

            // you can use object initialisers like this only when the properties
            // are actual properties. SDK classes sometimes have property-like properties
            // but are actually classes. For example, the Cell class has the CellValue
            // "property" but is actually a child class internally.
            // If the properties correspond to actual XML attributes, then you're fine.
            writer.WriteElement(new Sheet()
            {
                Name = "Sheet1",
                SheetId = 1,
                Id = workbook.WorkbookPart.GetIdOfPart(workSheetPart)
            });

            writer.WriteEndElement(); // Write end for WorkSheet Element
            writer.WriteEndElement(); // Write end for WorkBook Element
            writer.Close();

            workbook.Close();
        }
Run Code Online (Sandbox Code Playgroud)

如果您查看该代码,您会注意到两个主要写入,首先是工作表,然后是包含工作表的工作簿。工作簿部分是最后的无聊部分,较早的工作表部分包含所有行和列。

在您自己的改编中,您可以将真实的字符串值从您自己的数据写入单元格。相反,在上面,我们只是使用行和列编号。

writer.WriteElement(new CellValue("SomeValue"));
Run Code Online (Sandbox Code Playgroud)

值得注意的是,Excel 中的行编号从 1 开始而不是 0。从索引为零开始编号的行将导致“损坏文件”错误消息。

最后,如果您正在处理非常大的数据集,切勿调用 ToList()。使用数据阅读器风格的数据流方法。例如,您可以拥有一个IQueryable并在for each 中使用它。您永远不想依赖同时将所有数据保存在内存中,否则您会遇到内存不足限制和/或内存利用率高的问题。

  • 这对我开始来说真的很好。有很多陷阱,但一旦你理解了模式,它就变得更有意义了。花一些时间查看有效 xlsx 中的底层 xml (2认同)

Kev*_*ell 1

我会尝试使用displaytag来显示结果。您可以将其设置为每页显示一定数量,这应该可以解决您的超载问题。然后,您可以设置显示标签以允许 Excel 导出。