Pengantar Data Mining


Mengapa perlunya datamining?
  1. Meledaknya pertumbuhan data: dari terabytes hingga petabytes
  2. Banyak data, namun pengetahuan sedikit! 
  3. “Necessity is the mother of invention”—Analisis data set dalam jumlah yang besar secara otomatis
Datamining ( Sudut Pandang Komersial)
  1. Banyak data: dikumpulkan dan di-’gudang’-kan 
  2. Komputer: lebih murah dan powerfull 
  3. Tekanan persaingan yang kuat 
  4. Banyak data: dikumpulkan dan di-’gudang’-kan 
        • Data web, e-commerce 
        • Data penjualan 
        • Transaksi bank/CC 
        • Data nilai mahasiswa
Datamining ( Sudut Pandang Sains)
  1. Data dikumpulkan dan disimpan dg kecepatan tinggi (GB/jam) 
  2. Teknik tradisional tidak dapat diterapkan 
  3. Membantu Saintis 
  4. Data dikumpulkan dan disimpan dg kecepatan tinggi (GB/jam)
        • Sensor satelit 
        • Teleskop 
        • Ekspresi gen 
        • Klafikasi dan segment data 
        • Membuat Hipotesa
Definisi Datamining
  1. Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data ( Jiawei Han & Micheline Kamber).
  2. Pensarian informasi yg implisit, belum diketahui, dan kemungkinan berguna, yang diperoleh dari data .
  3. Penggalian dan analisis (dg alat otomatis atau semi-otomatis) terhadap himpunan data yg besar untk menemukan pola-pola yang bermakna.
Bukan Dataminig Dataminig
  • Melihat nomor telpon di buku telpon 
  • Query web dg Search Engine, misal dg kata kunci “amazon” 


  • Beberapa nama pelanggan lebih banyak tinggal di propinsi tertentu 
  • Pengelompok web dari search engine berdasarkan konteks. (Mis. Sungai Amazon, hutan hujan Amazon, Amazon.com)

Datamining - Knowledge Discovery






Disiplin Ilmu




Teknik biasa tidak cocok, karena:
-Besarnya data
-Dimensi data yang tinggi
-Kompleksitas data yang tinggi
-Data tersebar dan heterogen


0 komentar

Post a Comment