Pengertian Data Warehouse, seperti pendapat beberapa ahli
berikut ini :
Menurut
W.H. Inmon dan Richard D.H., data
warehouse adalah koleksi data yang mempunyai sifat berorientasi
subjek, terintegrasi, time-variant dan bersifat tetap dari koleksi data dalam
mendukung proses pengambilan keputusan management.
Menurut
Vidette Poe, data warehouse
merupakan database yang bersifat
analisis dan read only yang digunakan sebagai fondasi dari sistem
penunjang keputusan.
Menurut
Paul Lane, data warehouse
merupakan database relasional yang didesain lebih kepada query dan
analisa dari pada proses transaksi, biasanya mengandung history data
dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban
kerja analisis dari beban kerja transaksi dan memungkinkan organisasi
menggabung/konsolidasi data dari berbagai macam sumber
Jadi,
Bang Vandawablog menyimpulkan data warehouse merupakan
metode dalam perancangan database,
yang menunjang DSS(Decission Support System) dan EIS (Executive Information
System). Secara fisik data warehouse adalah database, tapi perancangan
data warehouse dan database sangat berbeda. Dalam perancangan database
tradisional menggunakan normalisasi, sedangkan pada data warehouse
normalisasi bukanlah cara yang terbaik.
Istilah-istilah yang berkaitan
dengan data warehouse :
1. Data Mart
Adalah
suatu bagian pada data warehouse
yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau
operasi pada suatu perusahaan.
2. On-Line Analytical Processing (OLAP)
Merupakan
suatu pemrosesan database yang
menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam
bentuk laporan, analisis, query dari data yang berukuran besar.
3. On-Line Transaction Processing(OLTP)
Merupakan
suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi
sehari-hari.
4. Dimension Table
Tabel
yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan.
Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi
waktu(yang berupa perbulan, perkwartal dan pertahun).
5. Fact Table
Merupakan
tabel yang umumnya mengandung angka dan data history dimana key (kunci)
yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign
key(kunci asing) yang merupakan primary key (kunci utama) dari
beberapa dimension table yang berhubungan.
6. DSS
Merupakan sistem yang
menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem ini
dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
Karakteristik
data warehouse menurut Inmon, yaitu :
1. Subject Oriented (Berorientasi subject)
Data
warehouse berorientasi subject artinya data warehouse didesain untuk
menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan
pada proses atau fungsi aplikasi tertentu.
2. Integrated (Terintegrasi)
Data
Warehouse dapat menyimpan data-data yang
berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten
dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa
dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang
keseluruhan konsep data warehouse
itu sendiri.
3. Time-variant (Rentang Waktu)
Seluruh
data pada data warehouse
dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat
interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan
cara antara lain :
- Cara pertama, adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
- Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
Cara
yang ketiga,variasi waktu yang disajikan data
warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan
tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan
data yang ada bersifat read-only.
4. Non-Volatile
Karakteristik
keempat dari data warehouse adalah
non-volatile,maksudnya data pada data warehouse tidak di-update secara real
time tetapi di refresh dari sistem operasional secara reguler. Data
yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri
dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap
data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
Berbeda
dengan database operasional yang
dapat mela4kukan update,insert dan delete terhadap data yang mengubah isi dari
database sedangkan pada data warehouse
hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan
akses data (mengakses data warehouse seperti melakukan query atau menampilan
laporan yang dibutuhkan, tidak ada kegiatan updating data).
B. Sistem Data Warehouse
Keunggulan
teknologi Client Server memungkinkan data warehouse diterapkan dalam berbagai macam cara
untuk menampung kebutuhan pemakai sistem secara lebih proposional. Dalam suatu
kasus, misalkan saja pemakai tertentu perlu menggabungkan data dari sebuah
sistem pengumpulan data yang statis dengan data dari sistem operasional yang
dinamis hanya dengan sebuah query saja.
Berikut
ini adalah tiga jenis dasar Sistem
Data Warehouse :
1.
Functional
Data Warehouse (Data Warehouse Fungsional)
Kata operasional disini merupakan database yang diperoleh dari kegiatan sehari-hari. Data warehouse
dibuat lebih dari satu dan dikelompokkan berdasar fungsi-fungsi yang ada di
dalam perusahaan seperti fungsi keuangan(financial),marketing,personalia
dan lain-lain.
Keuntungan dari bentuk data warehouse seperti ini adalah, sistem mudah dibangun dengan biaya
relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data
dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
2.
Centralized
Data Warehouse (Data Warehouse
Terpusat)
Bentuk ini terlihat seperti bentuk data warehouse
fungsional, namun terlebih dahulu sumber data dikumpulkan dalam satu tempat
terpusat, kemudian data disebar ke dalam fungsinya masing-masing, sesuai
kebutuhan persuhaan. Data warehouse terpusat ini, biasa digunakan oleh
perusahaan yang belum memiliki jaringan eksternal.
Keuntungan dari bentuk ini adalah data benar-benar terpadu
karena konsistensinya yang tinggi sedang kerugiannya adalah biaya yang mahal
serta memerlukan waktu yang cukup lama untuk membangunnya.
3.
Distributed
Data Warehouse (Data Warehouse terdistribusi)
Pada data warehouse terdistribusi ini, digunakan gateway
yang berfungsi sebagai jembatan penghubung antara data warehouse dengan
workstation yang menggunakan sistem
beraneka ragam. Dengan sistem
terdistribusi seperti ini memungkinkan perusahaan dapat mengakses sumber data
yang berada diluar lokasi perusahaan(eksternal).
Keuntungannya adalah data
tetap konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan atau mengalami proses
sinkronisasi. Sedangkan kerugiannya adalah lebih kompleks untuk diterapkan
karena sistem operasi dikelola
secara terpisah juga biaya nya yang paling mahal dibandingkan dengan dua bentuk
data warehouse lainnya.
Semoga bermanfaat......
» JANGAN LUPA LIKE N Komentarnya Yeach...