Perbedaan Supervised Learning and Unsupervised Learning

Machine learning adalah sub artificial inteligence. Machine learning itu sendiri terbagi menjadi jika dikategorikan berdasarkan label. Label yang dimaksudkan disini adalah target variable ada tidak dasar datanya. Dalam artikel ini pertama-tama akan dibahas mengenai definisi masing masing dan aplikasinya dalam kehidupan nyata. Kemudian akan disajikan kesimpulan dan perbandingan antara keduanya.

Supervised Learning

Supervised Learning dalam bahasa indonesia adalah pembelajaran yang ada supervisornya. Maksud disini ada supervisornya adalah label di tiap data nya. Label maksudnya adalah tag dari data yang ditambahkan dalam machine learning model. Contohnya gambar kucing di tag “kucing” di tiap masing masing image kucing dan gambar anjing di tag “anjing” di tiap masing gambar anjing. Machine learning kategori dapat berupa clasification (“anjing”, “kucing”, “beruang”, dsb) dan regression ( berat badan, tinggi badan dsb). Supervised learning banyak digunakan dalam memprediksi pola dimana pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk adalah hasil pembelajaran data lengkap tersebut. Tentunya jika kita memasukan data baru, setelah kita melakukan ETL (Extract Transform Load) maka kita mendapat info feature feature dari sample baru tersebut. Kemudian dari feature feature tersebut di compare dengan pattern clasification dari model yang didapat dari labeled data. Setiap label akan dicompare sampai selesai, dan yang memiliki percentage lebih banyak akan diambil sebagai prediksi akhir.

Hasil gambar untuk supervised learning

Source : boozallen.com

Contoh algoritma yang digunakan pada supervised learning meliputi :

  1. Clasification (Categorical) and Regression (Numerical)
  2. Logistic Regression
  3. Model Ensemble
  4. Time series

Example of Data in ERP 
Source : https://medium.com/@gowthamy

Di contoh diatas, kita akan memprediksi harga rumah dengan luas tanah 3950 sqrft dengan 6 kamar tidur, dan 4 kamar mandi. Harga disini adalah target. Kita akan mentrain model machine learning kita dengan 3 data dengan harga propertinya. Kita memasukan 3 data yang lengkap ini ke dalam machine learning model kemudian setelah berhasil di train, kita harus menghitung besar accuracy dari model yang didevelop. Kemudian jika kurang dari 80% diperlukan remodel, sampai accuracy sebesar besarnya dan loss sekecil kecilnya.

Jika sudah dimodel bagus disimpan ke file .h5. Jika sudah, gunakan model itu untuk memprediksi harga row yang mau diprediksi harganya. Tetapi jangan lupa mengunci modelnya supaya nggak trainable, kalo misalnya tidak mau menambah weight ke model tersebut. Akan keluar price forecast dari data tersebut.

Unsupervised Learning

Unsupervised learning memiliki keunggulan daari unsupervised learning. Jika unsupervised learning memiliki label sebagai dasar prediksi baik serta membuat clasification dan regression algorithm memungkinkan. Tetapi dalam realitanya, data real itu banyak yang tidak memiliki label. Label kebanyakan jika data sudah masuk ke ERP apapun bentuk ERPnya dan bagaimana kalo datanya berupa natural input seperti suara, gambar, dan video. Unsupervised learning tidak menggunakan label dalam memprediksi target feautures / variable. Melainkan menggunakan ke samaan dari attribut attribut yang dimiliki. Jika attribut dan sifat sifat dari data data feature yang diekstrak memiliki kemirip miripan, maka akan dikelompok kelompokan (clustering). Sehingga hal ini akan menimbulkan kelompok kelompok (cluster). Jumlah cluster bisa unlimited. Dari kelompok kelompok itu model melabelkan, dan jika data baru mau di prediksi, maka akan dicocok kan dengan kelompok yang mirip mirip featurenya.

 

Bagaimana Cara Kerja Unsupervised Learning
Sumber : Boozalen.com

 

Tetapi unsupervise learning tidak memiliki outcome yang spesifik layaknya di supervise learning, hal ini dikarenakan tidak adanya ground truth / label dasar. Walaupun begitu, unsupervised learning masih dapat memprediksi dari ketidakadaan label dari kemiripan attribute yang dimilik data.

Algoritma yang digunakan di unsupervised learning :

  1. Clustering
  2. Anomaly Detection
  3. Training Model
  4. Association Discovery