martes, 19 de julio de 2016

El Demo del Día: Leer Archivos de Excel 2007 usando OLEDB

Leer Archivos de Excel 2007 usando OLEDB

Vamos a retomar nuevamente los Demos, con algo muy solicitado que es leer Archivos de Excel 2007 (XSLX), esta forma de lectura la usaba hace muchos años, pero ahora la comparto para los que no han llevado un curso conmigo.

1. Técnicas para Leer Archivos de Excel

Para leer un archivo de Excel con todas sus hojas hay varias formas que describo brevemente a continuación:

- Automatización ActiveX o COM

Consiste en abrir una instancia de Excel desde otra aplicación (en este caso en .NET) y obtener el valor de cada celda o de un rango de celda por cada hoja. Esta forma es la mas usada y es la de peor rendimiento y requiere tener instalado el Excel. Esta forma es la mas antigua cuando todavía no existía ADO.

- Usando OLEDB

Consiste en usar el proveedor de OLEDB en ADO.NET para conectarse a un archivo de Excel 12.0 (XSLX) para lo cual es necesario tener instalado "Microsoft Access Database Engine 2010 Redistributable" el cual puede descargarse de la siguiente dirección:
https://www.microsoft.com/en-us/download/details.aspx?id=13255
En esta página habrán 2 ejecutables:
- AccessDatabaseEngine.exe (25.3 MB) para equipos con S.O. de 32 bits
- AccessDatabaseEngine_X64.exe (27.3 MB) para equipos con S.O. de 64 bits
Esta forma es la que veremos en este Demo.

- Usando Archivos

Es la forma mas óptima y consiste en descomprimir el archivo XLSX y leer los XML donde se encuentran definidos los datos y las hojas. Esto se puede hacer de forma nativa o usando Librerías de Terceros como SpreedSheet (DevExpress), NPOI, EPPlus, ExcelDataReader, etc.
En el siguiente Demo que subiré trataré como leer Excel en forma nativa usando archivos XML.

2. Crear una Aplicación Windows Forms en C#

Abrir Visual Studio y crear una aplicación Windows Forms en C# llamada "Excel_Leer_OLEDB", cambiarle de nombre al formulario por "frmVisorExcel" y realizar el diseño similar a la figura mostrada:

En el diseño hay una etiqueta (lblArchivo), un cuadro de texto (txtArchivo), 2 botones (btnAbrir y btnNuevo) y un control Tab (tabExcel) sin ninguna página ya que estas se crean en tiempo de ejecución en función al número de hojas.

3. Escribir el Código de la Aplicación en C#

Abrir el formulario "frmVisorExcel" y escribir el siguiente código:

using System;
using System.Data;
using System.Data.OleDb;
using System.Windows.Forms;

namespace Excel_Leer_OLEDB
{
    public partial class frmVisorExcel : Form
    {
        public frmVisorExcel()
        {
            InitializeComponent();
        }

        private void abrirExcel(object sender, EventArgs e)
        {
            OpenFileDialog ofd = new OpenFileDialog();
            ofd.Title = "Selecciona el archivo de Excel a abrir";
            ofd.Filter = "Archivo de Excel 2007|*.xlsx";
            ofd.InitialDirectory = @"C:\Data\NET\Practicas\Archivos\Excel";
            if (ofd.ShowDialog().Equals(DialogResult.OK))
            {
                string archivo = ofd.FileName;
                txtArchivo.Text = archivo;
                tabExcel.Controls.Clear();
                using (OleDbConnection con = new OleDbConnection
                ("provider=Microsoft.Ace.oledb.12.0;data source=" + archivo + ";
                 extended properties=Excel 12.0"))
                {
                    try
                    {
                        con.Open();
                        DataTable tblHojas = con.GetOleDbSchemaTable(OleDbSchemaGuid.Tables,
                        new object[] { null, null, null, "TABLE" });
                        foreach (DataRow fila in tblHojas.Rows)
                        {
                            if (fila["TABLE_NAME"].ToString().EndsWith("$"))
                            {
                                string nombreHoja = fila["TABLE_NAME"].ToString();
                                DataTable tblHoja = new DataTable();
                                using (OleDbDataAdapter dap = new OleDbDataAdapter
                                ("Select * From [" + nombreHoja + "]", con))
                                {
                                    dap.Fill(tblHoja);
                                }
                                DataGridView dgv = new DataGridView();
                                dgv.Dock = DockStyle.Fill;
                                dgv.ReadOnly = true;
                                dgv.SelectionMode = DataGridViewSelectionMode.FullRowSelect;
                                dgv.AllowUserToAddRows = false;
                                dgv.DataSource = tblHoja;
                                TabPage pagina = new TabPage();
                                pagina.Text = nombreHoja.Replace("$","");
                                pagina.Controls.Add(dgv);
                                tabExcel.Controls.Add(pagina);
                            }
                        }                      
                    }
                    catch (Exception ex)
                    {
                        MessageBox.Show(ex.Message,"Error al leer el Excel");
                    }
                }
            }
        }

        private void nuevaLectura(object sender, EventArgs e)
        {
            txtArchivo.Clear();
            tabExcel.Controls.Clear();
        }
    }
}

Nota: El método "abrirExcel" estaasociado al evento click del botón "btnAbrir" y el método "nuevaLectura" esta asociado al evento click del botón "btnNuevo".

4. Ejecutar y Probar la Aplicación Windows Forms

Grabar la aplicación y pulsar F5 para ejecutarla, luego clic al botón "..." y se mostrará el diálogo de abrir mostrando los archivos de Excel 2007 (xlsx), tal como se muestra en la siguiente figura:

Dialogo de Abrir archivos de Excel

Seleccionar un archivo del diálogo y se cargarán todas las hojas del libro, mostrándose en una página del control Tab una grilla, tal como se muestra en la siguiente figura:

Primer Tab con la primera Hoja

En mi caso abrí un archivo con 2 hojas, la primera que tiene Personajes de JavaScript y la segunda con algunos términos de programación, tal como se muestra en la siguiente figura:

Segundo Tab con la segunda Hoja

Si se desea se puede abrir cualquier otro archivo dando click nuevamente al botón "...", tal como se muestra en la siguiente figura:

Archivo Excel con solo una Hoja

En este último caso se abrió un archivo con solo una Hoja de Productos.

5. Comentario Final

En este Demo hemos visto como Leer todas las hojas de un libro de Excel 2007 usando OLEDB, para lo cual se uso el método "GetOleDbSchemaTable()" con la restricción de tablas para obtener todos los nombres de tablas pero solo mostramos las que terminan en $, que son las Hojas de Excel.

Se uso un "OleDbDataAdapter" para ejecutar el comando Select para obtener los datos de la hoja en un "DataTable" y luego se creó dinámicamente una grilla, un tabPage y se agregó la grilla al tabPage y el tabPage al tabControl para que se vea los datos de cada hoja.

El que desea conservar todos los datos para después trabajarlos y luego guardarlos en una base de datos, en ves de usar un DataTable local (en el DataAdapter) debe usar un DataSet global (a nivel de clase).

Espero que les sea útil este Demo y en estos días publicaré una técnica más rápida que es leer archivos xml dentro del paquete (xlsx) la cual es más rápida aunque mas laboriosa y que algunos usan sin darse cuenta al usar librerías de lectura de archivos Excel.

6. Descarga la Aplicación Windows

2016_07_19_Demo_Excel_Leer_OLEDB

2 comentarios:

  1. Muchas gracias por su aporte profesor, y por ayudarnos a entender los pro y contras de las alternativas para esta funcionalidad. Saludos

    ResponderBorrar
  2. Muy interesante el Demo profesor, gracias por la explicación sobre las formas que existen para leer un archivo de Excel. Y hacernos entender los Pro y contras de cada una de las formas.

    ResponderBorrar