• ¿Qué es Pentaho Data Integration?

      Pentaho Data Integration PDI es la herramienta más avanzada en la actualidad para desarrollar ETLs de data industrial, entrega la mayor eficiencia del mercado. En este curso en línea, analizamos los principales conceptos y fundamentos del software Pentaho Data Integration, maximizando sus conocimientos en procesos ETL. Pentaho Data Integration es una potente herramienta para transformaciones de datos (ETLs), con PDI puede realizar tareas como la migración de datos, la transformación de datos, las conversiones del sistema o la carga de bases de datos, además de tareas avanzadas como la transferencia de archivos, envíos de correo electrónico, integración con servicios web y programaciones con scripts de programaciones.

      ¿Qué conocimiento necesitas?

      • Recomendable conocimientos básicos de SQL.

      • Recomendable (no indispensable) Curso de Fundamentos de Pentaho.

      • Recomendable (no indispensable) Curso de Dasboards Básico y/o Avanzado con Pentaho.

      • Portar una laptop personal para las clases de mínimo 4GB de RAM.

      Metodología

      • Exposición teórica de los temas

      • Desarrollo de casos prácticos

      • Acceso a las clases grabadas

      • Acceso al material exclusivo

      Sobre el Instructor

      foto de instructor bandera de Perú

      Ing. Pablo A. Valdivia

      Ing. con más de 20 años de experiencia como consultor nacional e internacional en proyectos de Business Analytics y Big Data. Director/Gerente en empresas locales y multinacionales, especialista en Gobierno Electrónico, con dominio de tecnologías emergentes en Cloud como AWS, Azure
      y GCP. Es instructor en soluciones de clase mundial como Pentaho/IDempiere/Odoo, Actualmente se desempeña como Chief Data Architect at GIS y Chief Executive Officer in EGS GROUP.

      Contenido del curso

      MÓDULO 1: Pentaho Data Integration (PDI)

      • Características

      • Definición y uso de integración de datos

      • Licencia

      • Ejemplificación de tareas de integración de datos

      • Configuración de variables de entorno

      • Startup de PDI: Configuración de variables de entorno | Descarga | Instalación | Configuración de Driver JDBC de MySQL

      • Scripts de ejecución de Spoon

      • Layout de Spoon: Principal | Tabs | Panel Design | Panel View | Accesos rápidos

      • Tipos y utilización de Repositorio: Conexión con Repositorio de Pentaho BA | Repositorio en Base de Datos | Repositorio en sistema de archivos | Opción Repository Manager | Metadata

      • Principales opciones de la GUI de Spoon: General | Apariencia

      • Características y diferencias de Transformations y Jobs

      • Práctico: creación de Transformation que genera valores aleatorios

      MÓDULO 2: Transformations, Panel Execution, Panel Execution Results

      • Descripción de las características, funcionamiento y comportamiento de las Transformations

      • Descripción del Panel Execute, que se despliega antes de ejecutar las Transformations/Jobs: Environment Type | Options |

      • Log Level | Parameters | Variables

      • Descripción y ejemplificación del Panel Execution Results

      • Descripción y análisis de las opciones más importantes de sus Tabs:

        • Tab Execution History

        • Tab Botón SQL

        • Tab Logging

        • Tab Step Metrics

        • Tab Performance Graph

        • Tab Metrics

        • Tab Preview data

      • Práctico: creación de Transformation que realiza cálculos lógicos y matemáticos

      • Práctico: creación de Transformation que analiza los valores del flujo de datos y bifurca el flujo en dos sentidos diferentes; en el primer sentido realizará cálculos y exportará los resultados; en el segundo caso irá a un Step de control

      • Práctico: creación de Transformation que obtiene datos de un archivo CSV, los formatea, ordena, concatena y exporta en otro formato

      MÓDULO 3: Variables de Entorno, Parameters, Arguments

      • Descripción y uso de las Variables de Entorno

      • Ejemplos y notación de las Variables de Entorno

      • Descripción y uso de los Parámetros

      • Modos de creación de Parámetros

      • Descripción, definición y uso de Argumentos

      • Descripción y uso de la opción Preview

      • Práctico: creación de Transformación cuyos valores obtenidos dependa de los Parámetros asignados en la ejecución

      • Práctico: creación de Transformación que obtenga valores de Argumentos, ejecute una función JavaScript y genere un documento HTML

      MÓDULO 4: Expresiones Regulares (RegEx), JavaScript (JS)

      • Descripción, aplicación y ejemplos de RegEx

      • Documentación y patrones más utilizados de las RegEx

      • Aplicación de RegEx en PDI

      • Práctico: creación de Transformation que obtenga los nombres de las librerías presentes en PDI y que mediante RegEx separe sintácticamente su nombre, extensión y versión

      • Descripción y documentación de JS

      • Aplicación de JS en PDI

      • Descripción, ejemplificación y aplicación avanzada de Step Modified Java Script Value:

        • Transform Scripts

        • Transform Constants: SKIP | ERROR | CONTINUE

        • Transform Functions

        • Input/Output Fields

        • Opciones: Position | Compatibility mode | Optimization level

        • Configuración de la Grilla Fields para obtener dataset de salida

        • Añadir, modificar y configurar distintos tipos de Script: Transform | Start | End

        • Práctico: creación de Transformation que obtenga página HTML y realice Web Scrapping utilizando RegEx y JS

      MÓDULO 5: Dataflow

      • Práctico: creación de Transfomation que realice las siguientes tareas: análisis, distribución, mapeo, clasificación, aplicación de rangos, aplicación de secuencia condicionada, conversiones

      • Manejo del Dataflow:

        • Unión básica de Datasets

        • Unión de Datasets con diferente Metadata

        • Unión de Datasets estableciendo condición de relación

        • Unión de Datasets de forma secuencial

        • Dividir Dataset entre diversos Steps

        • Compartir Dataset completo

        • Compartir Dataset de forma distributiva

      • Práctico: creación de Transformation que realice las siguientes tareas; convertir de filas a columnas, convertir de columnas a filas, unir Datasets, mapeo y distribución de Datasets, aplicación de fórmulas avanzadas, compartir Dataset

      MÓDULO 6: Variables Globales

      • Descripción, uso, ejemplos

      • Administración de Variables Globales

      • Práctico: creación de Transformation que realice las siguientes tareas: utilizar Variables de Entorno para establecer URL y nombres de archivos; trabajar con datos en formato XML; convertir filas en columnas; comparar dos flujos de datos por aproximación utilizando algoritmo Levenshtein; obtener valores mínimos y máximos; trabajar con datos JSON

      MÓDULO 7: Hops

      • Descripción y administración de Hops de Transformations y Jobs

      • Configuración avanzada de Hops de Transformations: Habilitar/Deshabilitar | Cambiar dirección | Condición | Borrar | Bulk Change

      • Configuración avanzada de Hops de Jobs y análisis de Status: Incondicional | Exito | Fracaso | Habilitar/Deshabilitar

      • Descripción de Notas en Transformations/Jobs

      • Descripción de las opciones de Grilla

      MÓDULO 8: Share objects

      • Descripción y tipos de Objetos Compartidos

      • Administración, ejemplificación y utilización de Objetos Compartidos

      • Configuración de Metadata de Objetos Compartidos

      • Práctico: creación de Transformation que realice las siguientes tareas; obtener diferentes archivos de salida dependiendo de condiciones establecidas en el flujo de datos; comparar flujos de datos identificando elementos nuevos, eliminados y modificados; utilizar Variables de Entorno y RegEx

      MÓDULO 9: Jobs

      • Descripción, características y principales usos

      • Comportamiento y modo de funcionamiento de los Jobs

      • Configuración para ejecución de Steps en paralelo

      • Configuración para ejecución de Transformations por cada fila analizada del Dataset

      • Análisis y explicación de Ruta de Ejecución de los Steps de Jobs

      • Práctico: creación de un Job que realice las siguientes tareas; controle el workflow de ejecución de dos Transformations; evalúe la salida de status de los diferentes Steps

      • Práctico: creación de un Job que realice las siguientes tareas; ejecutar una Transformation que genere un Dataset; guardar el Dataset en la lista Result rows; ejecutar una segunda Transformation que obtenga el Dataset de la lista Result rows; configurar salidas de log y analizar los resultados

      • Práctico: creación de Transformations y Jobs para ejemplificar las diferentes utilizaciones de Result Filenames

      MÓDULO 10: Descripción, uso y ejemplificación de Result Rows

      • Descripción, uso y ejemplificación de Result Rows

      MÓDULO 11: Descripción, uso y ejemplificación de Result Filenames

      • Descripción, uso y ejemplificación de Result Filenames

      MÓDULO 12: Descripción, uso, alcance y ejemplificación de Variables On The Fly

      • Descripción, uso, alcance y ejemplificación de Variables On The Fly

      MÓDULO 13: E-Mail & Web

      • Ejemplificación, uso y configuración avanzada de envío de e-mails

      • Utilización de diferentes protocolos: POP3 | IMAP | MBOX

      • Práctico: creación de Transformations y Jobs que realicen las siguientes tareas; obtener de un archivo CSV una lista de URLs web con los discos de artistas de rock; obtener el documento HTML de cada URL web; filtrar de cada documento HTML la sección dedicada a la lista de canciones de cada disco; generar un archivo CSV por cada disco con la información de sus respectivas canciones.

      • Práctico: creación de un Job que realice las siguientes tareas: utilizar Variables de Entorno y RegEx para obtener una lista de archivos; validar direcciones de e-mail; enviar e-mail que contenga como adjuntos los archivos obtenidos

      MÓDULO 14: Descripción de los principales Steps de Validación en Transformations y Jobs

      • Descripción de los principales Steps de Validación en Transformations y Jobs

      MÓDULO 15: Database

      • Presentación y restauración de Bases de Datos para realización de práctico

      • MySQL:

        • Definición y características

        • Community Server VS Enterprise Edition

        • MySQL Workbench: Características | Instalación | Layout

        • Creación de Nueva Instancia

        • Explicación de las principales opciones de la Sección Administrativa: Server Status | Client Connections | Users and Privileges | Status and System Variables | Data Export | Data Import/Restore | Startup/Shutdown | Server Logs | Option File:

      • Explicación de las principales opciones de la Sección SQL: Panel Schemas | Tab Info | Snippets | Log Output | SQL Canvas | Tabs | Accesos rápidos

      • Descripción, uso y realización de acciones avanzadas sobre Bases de Datos:

        • Obtener Dataset

        • Insertar registros

        • Actualizar registros

        • Borrar registros

        • Añadir columna

        • Ejecutar Script SQL

      • Utilización y configuración avanzada de Error handling

      • Definición y utilización de opción Clear Cache Database

      • Práctico: creación de Job que realice múltiples tipos de acciones sobre Bases de Datos

      MÓDULO 16: Descripción de principales Steps para trabajar con Bases de Datos

      • Descripción de principales Steps para trabajar con Bases de Datos

      MÓDULO 17: Data Warehouse

      • Creación de Transformation para trabajar con Slowly Changing Dimension (SCD) Tipo 1

      • Creación de Transformation para trabajar con Slowly Changing Dimension (SCD) Tipo 2

      MÓDULO 18: Pan & Kitchen

      • Descripción de las principales herramientas PDI: Spoon | Pan | Kitchen | Carte

      • Opciones avanzadas ejecución de Transformations o Jobs por líneas de comandos

        • Parámetros

        • Argumentos

        • Registro Log

      MÓDULO 19: Scheduling

      • Descripción, ejemplificación y uso de Calendarización de ejecución de Transformations y Jobs

      • Calendarización utilizando Cron

      • Calendarización utilizando Task Scheduler

      MÓDULO 20: Marketplace

      • Descripción y características del Marketplace de PDI

      • Instalación de plugins: Weka, DataCleaner

      MÓDULO 21: Transformations como Datasource

      • Utilización de Transformation como Datasource para Dashboards (CDE)

      • Utilización de Transformation como Datasource para Reporting (PRD)

      MÓDULO 22: Bonus Track: Delivery PRD

      • Descripción y características de Pentaho Report Designer (PRD)

      • Configuración y ejecución de reportes PRD en Transformation PDI

      • Práctico: creación de una Transformation que realice las siguientes tareas: exportar reporte en formato pdf utilizando

      • Parámetros, JS, RegEx y Variables de Entorno; envío de reporte como archivo adjunto en un e-mail

      MÓDULO 23: E-Mail & Web

      • Transform | Split Fields

      • Transform | Value Mapper

      • Transform | Number range

      • Transform | Add value fields changing sequence

      • Transform | String operations

      • Transform | Row flattener

      • Transform | Row Normaliser

      • Transform | Add constants

      • Transform | Calculator

      • Transform | Sort rows

      • Transform | Concat Fields

      • Transform | Add sequence

      • Transform | Select values

      • Transform | Replace in string

      • Transform | Split Fields

      • Transform | Value Mapper

      • Transform | Number range

      • Transform | Add value fields changing sequence

      • Transform | String operations

      • Transform | Row flattener

      • Transform | Row Normaliser

      • Flow | Append streams

      • Flow | Switch / Case

      • Flow | Filter rows

      • Flow | Java Filter

      • Flow | Dummy

      • Flow | Append streams

      • Flow | Switch / Case

      • Joins | Join Rows

      • Job | Copy rows to result

      • Job | Get rows from result

      • Job | Set files in result

      • Job | Get files from result

      • Job | Set Variables

      • Job | Get Variables

      • Utility | Write to log

      • Utility | Mail

      • Utility | Mail validator

      • Utility | If field value is null

      • Input | Email messages input

      • Input | Table input

      • Input | Generate Rows

      • Input | Generate random value

      • Input | Data Grid

      • Input | CSV file input

      • Input | Fixed file input

      • Input | Get System Info

      • Input | GZIP CSV Input

      • Input | Get File Names

      • Lookup | Table exists

      • Lookup | Web Services Lookup

      • Lookup | File exists

      • Lookup | HTTP Client

      • Lookup | Stream lookup

      • Lookup | Database lookup

      • Lookup | Database join

      • Validation | Data Validator

      • Output | Table output

      • Output | Update

      • Output | Insert / Update

      • Output | Delete

      • Output | Synchronize after merge

      • Output | Pentaho Reporting Output

      • Output | Text file output

      • Output | Microsoft Excel Output

      • Data Warehouse | Combination lookup/update

      • Data Warehouse | Dimension lookup/update

      • Scripting | Execute SQL script

      • Scripting | Execute row SQL script

      • Scripting | Formula

      • Scripting | Modified Java Script Value

      Preguntas frecuentes

      ¿Tengo acceso ilimitado a las clases?

      Cuando realices la compra vas a poder acceder las veces que quieras dentro de un periodo de dos meses.

      ¿Cuándo inicia el curso?

      Cuando tú quieras, lo puedes hacer a tu ritmo, ya que el acceso a es ilimitado durante dos meses.

      ¿Cómo obtengo el certificado del curso?

      Luego de que termines el curso, debes de desarrollar las actividades correspondientes y publicarlo. El instructor revisará y si todo es conforme se emitirá la certificación.

      ¿Cuáles son las formas de pago?

      Puedes realizar el pago a través de PayPal, tarjeta de crédito ó débito. También puedes realizar el pago en efectivo, en Perú en una de nuestras cuentas bancarias y en otros países mediante Western Union, cuando agregues el curso al carrito selecciona la opción de pago en efectivo. Una vez realizado el pago en un plazo máximo de 48 horas te llegará un correo con tus datos de acceso para el curso.

      ¿En qué moneda están los precios?

      El pago es dólares americanos, sólo los alumnos peruanos pueden realizar el pago en Soles.

      ¿A quién escribo si tengo dudas?

      Para consultas sobre los cursos:
      +51 902 572 982.

      ¿Porqué confiar en nosotros?

      Instructores

      Nuestros instructores son certificados en tecnologías como Pentaho, AWS, GCP, Azure y cuentan con experiencia en los temas, dictados, con una amplia experiencia real en aulas.

      Acceso exclusivo a nuestro foros y canales de comunicación (telegram/discord)

      Tenemos foros, tutoriales y material de acceso exclusivo, retos y muchos recursos con los que puedes empezar desde ya, y así conocer más de nuestro trabajo.

      Aprende con la práctica

      El nivel de retención de aprendizaje es mayor cuando se práctica haciendo, por ello todos los cursos tienen actividades lo que te permitirá retener un 75% de lo aprendido.

      Tutoría constante

      Los miembros del equipo responderán oportunamente a tus preguntas y constantemente compartiremos recursos exclusivos para los alumnos.

      Feedback

      La interación entre estudiantes e instructures en los cursos presenciales nos brindan un feedback para los cursos en la modalidad virtual. Además tenemos clases en vivo en nuestro canal de Youtube.

      Comunidad

      Ingresarás a una comunidad, en dónde si necesitas ayuda tus compañeros y el equipo siempre buscarán la mejor forma de ayudarte.

      Procesos ETL con Pentaho Data Integration

      Este curso es una experiencia nueva de aprendizaje hacia temáticas complejas.

      36 vídeos

      Certificación por 48 horas académicas

      Acceso Inmediato

      Disponible las 24 horas

      Acceso habilitado durante dos meses

      Desarrolla Proyectos Prácticos

      Descargar temario

      Visítanos en:

Productos Relacionados

Obtenga acceso!
OFERTA TERMINA EN
Ahorre hasta un 40%
Sesiones en vivo
Foros Gratuitos
Material Exclusivo
Acceder ahora!
Get Access Now! & Save 50%
Personal Trainer FREE Nutrition Custom Workout App
Get Access Now!