Ukuran Kemiripan dan Ketidakmiripan Antar Data

  • Data: kumpulan obyek beserta atributnya. 
  • Atribut : (fitur, variabel, atau field): properti atau karakteristik yang melekat pada suatu obyek. 
    • Kumpulan sejumlah atribut mendeskripsikan suatu obyek (entitas atau record). 
Tipe Atribut


Nominal

Data kualitatif yang tidak memiliki urutan.
Contoh: warna rambut, agama, nama, kode pos
Ordinal
Data kualitatif yang dapat diurutkan.
Contoh: rasa makanan dalam skala 1-10, peringkat di kelas, tinggi badan dalam {tinggi, sedang, rendah}.
Interval
Data kuantitatif (ukuran) dimana perbedaan nilai antara dua data sangat berarti.
Contoh: tanggal di kalender, temperatur dalam Celcius atau Fahrenheit.
Ratio
Data kuantitatif dimana perbedaan nilai data dan perbandingannya sangat berarti.
Contoh: temperatur dalam Kelvin (2K = 2*1K), panjang suatu benda, hasil perhitungan
Kemiripan vs Ketidakmiripan
  • Kemiripan (Similarity) 
    • Pengukuran numerik untuk menunjukkan seberapa mirip dua obyek data. 
    • Umumnya berada pada rentang 0 (no similarity) dan 1 (complete similarity) 
    • Bernilai lebih tinggi jika obyek semakin mirip. 
  • Ketidakmiripan (Dissimilarity) 
    • Pengukuran numerik untuk menunjukkan seberapa berbeda dua obyek data. 
    • Umumnya berada pada rentang 0 (obyek mirip) dan ~ (obyek berbeda) 
    • Bernilai lebih rendah jika data semakin tidak mirip. 
  • Istilah PROXIMITY (kedekatan) mengacu pada kemiripan atau ketidakmiripan antar data. kumpulan obyek beserta atributnya.

0 komentar

Post a Comment