AzYou's Notes

Tulisan iseng yang semoga bermanfaat

Pentaho Data Integration (Kettel)

PDI bukan Partai Demokrasi Perjuangan yaa.. :) tapi Pentaho Data Integration. PDI adalah nama lain dari Kettle. Kettle adalah aplikasi ETL (Extract, Transformation and Load) yang sangat populer dan merupakan salah satu ETL terbaik di pasar BI dunia saat ini.

Aplikasi Kettle sendiri merupakan bagian dari aplikasi BI Pentaho. Sebelumnya proyek ini berdiri sendiri dan kemudian diakuisisi oleh Pentaho pada tahun 2006. Sejak diakuisisi oleh Pentaho, Kettle dikenal juga dengan Pentaho Data Integration (PDI).
Pdi startup screen.jpgKettle merupakan merupakan inisiatif dari Matt Casters yang sampai saat ini tetap aktif sebagai project leader dari Kettle.
Kettle terdiri dari 4 aplikasi, yaitu :
  • Spoon, yaitu aplikasi grafis berbasis swing yang digunakan untuk merancang file skema job dan transformation
  • Pan, yaitu script yang digunakan untuk menjalankan file skema transformation melalui terminal / command line
  • Kitchen, yaitu script yang digunakan untuk menjalankan file skema job melalui terminal / command line
  • Carte, yaitu temporary web server yang digunakan untuk mengeksekusi job/transformation secara cluster atau parallel
Kesemua aplikasi tersebut di atas dijalankan melalui shell atau batch script yang berkaitan. Tapi saya ingin membahas tentang Spoon, karena saya baru belajar yang Spoon itu.. hehehe :D

Skema yang ingin dibuata adalah seperti ini :
Disana akan banyak tools yang bisa digunakan, tapi saya akan menggunakan 6 tools saja untuk perkenalan. :D

  • MS. Exel Input : Untuk menginput data dari file exel.
  • Add Constant : Untuk membuat row baru pada data kita yang isinya bisa kita masukkan sendiri.
  • Row Normalizer : Untuk menormalkan baris dari data yang sudah menjadi kolom.
  • String Cut : Untuk memotong data / Substring data.
  • Select/Rename Value : Untuk merename nama field yang kita punya atau kita bisa memilih field yang mau di pakai atau tidak.
  • Table Output : Keluaran data menjadi tabel di database (Kali ini saya memakai mysql sebagai editor).
Untuk pemakaiannya saya akan jelaskan di session berikutnya.. :D

0 komentar: