Instalación de Pentaho Data Integration
La herramienta Pentaho Data Integration (PDI) es un interfaz visual para la extracción, transformación y carga de datos en entornos empresariales, en este post veremos como realizar la instalación de la herramienta y realizar nuestro primera transformación.
Esta herramienta pertenece a la empresa Hitachi Vantara y forma parte de la plataforma Pentaho que son un conjunto de herramientas para Business Intelligence. PDI en sus inicios se llamaba Kettle, luego paso a ser Spoon. Tiene disponible una versión gratuita cien por cien funcional que nos permitirá realizar un ETL completo.
El programa PDI está realizado en java por lo que no tendremos problemas en ejecutarlo tanto en las plataforma de Windows como en las de Linux. A continuación realizaremos la instalación desde cero para un sistema de Windows.
Antes de proceder a ejecutar PDI deberemos comprobar que tenemos instalado java, simplemente abrimos la consola de comandos y ejecutamo java -version
La instalación del programa no tiene misterio, tras la comprobación de java procederemos a descargar de la url https://sourceforge.net/projects/pentaho/files/Data%20Integration/ la última versión, en nuestro caso es la versión 9.
Una vez dercagado el zip lo descomprimiremos en el directorio que queramos, el programa no tiene instalador, en el directorio descomprimido tenemos el programa que lanza la aplicación spoon.sh o spoon.bat dependiendo si utilizas linux o windows.
Una vez lanzado tiene el siguiente aspecto:
En el caso de que no se inicie el programa, puede ser que no nos muestre ningún error, la solución es ejecutar otro programa incluido en el paquete llamado SpoonDebug.bat que nos generará un log en el fichero SpoonDebug.txt donde podremos ver el error que nos provoca el inicio de la aplicación.