Apa Itu Semi-supervised Learning

  • Whatsapp

Apa Itu Semi-supervised Learning – Semi-supervised learning umumnya dipakai pada masalah-masalah yang dapat ditangani oleh supervised learning. Namun, pada semisupervised learning tidak seluruh data yang di-training perlu diberikan label MACHINE LEARNING merupakan salah satu kata kunci yang sedang trending saat ini pada berbagai bidang industri. Banyak industri-industri yang merasakan manfaat dari penggunaan machine learning, misalnya perusahaan asuransi yang mampu menawarkan produk asuransi yang tepat untuk pelanggan atau perusahaan telekomunikasi yang mampu melakukan segmentasi perilaku pelanggan dalam menggunakan produk mereka. Secara umum, metode machine learning yang paling sering digunakan oleh industri adalah salah satu atau kombinasi dari metode supervised learning dan unsupervised learning.

Baca Juga  HP dengan Kamera Setara DSLR dari LG

Teknik supervised learning merupakan metode machine learning yang bertujuan untuk memberikan label atau memprediksi suatu nilai, berdasarkan data lain yang yang telah memiliki label/nilai. Contohnya, suatu perusahaan asuransi memiliki data tentang beberapa pelanggan yang telah mereka tawari sebuah produk beserta catatan mengenai respons, menolak atau menerima, saat diberikan tawaran. Data ini dapat menjadi input bagi teknik supervised learning untuk memprediksi respons pelanggan lain yang belum dicoba dan menjadi target penawaran berikutnya.

Beberapa contoh dari model-model yang termasuk dalam metode supervised learning adalah Random Forest, XGBoost, dan Super Learner. Sementara, metode unsupervised learning merupakan metode pembelajaran dari data yang bertujuan untuk memahami pola dari data tanpa intervensi dari pengguna. Hasil keluaran dari metode unsupervised learning ini bisa berupa identifikasi kelompok-kelompok individu pada data yang biasanya direpresentasikan dengan label, maupun mengidentifikasi asosiasi antarkategori yang terjadi pada data. Salah satu penerapan metode unsupervised learning adalah mengidentifikasi segmentasi perilaku pelanggan pada perusahaan telekomunikasi serta asosiasi antarproduk yang dibeli oleh pelanggan supermarket. Karena metode unsupervised learning bisa mendeteksi pola data secara otomatis, metode ini tidak membutuhkan data latih yang berlabel.

Beberapa contoh dari metode ini adalah K-means, Self-organizing Map, dan Market Basket Analysis. Selain kedua metode yang sudah sangat mainstream tersebut, terdapat metode lain dalam machine learning yang mulai berkembang baru-baru ini, yaitu metode semi-supervised learning. Metode ini bisa memanfaatkan data yang telah berlabel maupun tidak berlabel untuk tujuan yang sama seperti supervised learning. Metode ini umumnya dipakai pada masalah-masalah yang dapat ditangani oleh supervised learning, tetapi untuk memberi label pada data yang berjumlah ribuan maupun jutaan membutukan waktu yang tidak sedikit. Banyak pakar yang menyebutkan bahwa teknik semi-supervised learning dapat dibedakan menjadi dua kategori yaitu metode inductive dan metode transductive.

Metode Inductive

Metode inductive memiliki tujuan yang sama seperti supervised learning yaitu melakukan prediksi atau memberikan label pada data baru. Berbeda dengan supervised learning yang seluruh individu pada data training-nya harus memiliki label/kelas, pada metode inductive ini kita bisa menggabungkan data individu yang sudah memiliki label dan data individu yang belum memiliki label untuk dijadikan sebagai data training. Terdapat beberapa model yang tergabung dalam metode inductive. Salah satu yang paling tua adalah self-training. Model tersebut menggunakan satu jenis supervised learning yang dimodelkan menggunakan data training yang sudah berlabel untuk melakukan pelabelan pada data yang belum berlabel. Data yang dilabeli dengan cara ini selanjutnya disebut dengan data pseudolabel. Setelah itu, dilakukan training kembali dengan supervised learning menggunakan kedua data tersebut.

Model lainnya yang ada di dalam metode inductive adalah cluster label. Model ini melakukan proses training dengan menerapkan unsupervised clustering terlebih dahulu pada gabungan data yang sudah berlabel maupun belum berlabel. Selanjutnya, pada masing-masing cluster dilakukan training dengan model supervised classification menggunakan data yang berlabel. Kemudian, data yang tidak berlabel pada setiap cluster dilabeli menggunakan model supervised classification itu. Metode inductive ini secara tujuan sama seperti supervised learning sehingga metode bersangkutan dapat dijadikan alternatif penyelesaian masalah yang dapat ditangani oleh supervised learning. Beberapa contoh penerapan metode inductive adalah pada sentiment analysis, object recognition, dan image segmentation.

Metode Transductive

Metode transductive memiliki tujuan yang berbeda dengan inductive. Metode inductive bertujuan untuk melabeli data baru tanpa melakukan training setiap kali data baru datang, sedangkan metode transductive melakukan training setiap kali data baru hadir. Dengan kata lain, model-model yang termasuk dalam metode transductive dirancang untuk menghasilkan prediksi label yang akurat pada data tertentu saja. Prediksi label dilakukan dengan mempertimbangkan kemiripan antara data yang sudah memiliki label dengan data yang belum memiliki label. Salah satu model yang paling umum dalam metode transductive adalah model yang graph-based alias berbasiskan grafik. Graph-based merupakan suatu pendekatan yang dapat menggambarkan kedekatan antara amatan pada data dengan suatu edge yang menghubungkan antara individu. Jika dua amatan terhubung oleh satu edge, kedua amatan ini memiliki kemiripan. Setelah grafik antara amatan yang berlabel dan tidak berlabel dibentuk, barulah permberian label dapat dilakukan. Sampai saat ini penerapan modelmodel yang merupakan metode transductive masih belum terlalu banyak. Namun, teknik ini bisa jadi pilihan jika tujuan utama kita hanya ingin memprediksi untuk individu tertentu saja dengan kriteria yang spesifik.

Related posts

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.