Federated Learning

Metode pembelajaran mesin yang disebut federated learning memungkinkan banyak pihak untuk bersama-sama melatih sebuah model tanpa harus berbagi data lokal mereka. Metode ini berbeda dengan metode desentralisasi yang lebih konvensional, yang biasanya mengasumsikan bahwa sampel data lokal terdistribusi secara merata, serta teknik pembelajaran mesin terpusat biasa, di mana semua dataset lokal diunggah ke satu server. Federated learning memungkinkan banyak pengguna untuk bekerja sama dalam menciptakan model machine learning yang kuat tanpa berbagi data apa pun, sehingga memungkinkan penyelesaian masalah-masalah penting seperti privasi data, keamanan, hak akses, dan akses data yang beragam.

Federated learning telah menjadi perhatian yang signifikan di bidang medis, Mahlool dan Abed dalam “Distributed brain tumor diagnosis using a federated learning environment” mengusulkan sebuah sistem baru untuk diagnosis tumor otak berdasarkan deep learning dan algoritma federated learning (FL). Model yang diusulkan dievaluasi menggunakan teknik validasi silang dengan dua dataset standar yang berbeda, BT-small-2c, dan BT-large-3c. Akurasi klasifikasi yang dicapai adalah 0,82 dan 0,96 secara berurutan. Model klasifikasi yang diusulkan menyediakan sistem yang aktif dan efektif untuk menilai klasifikasi BT dengan keandalan yang tinggi dan temuan klinis yang akurat. Makalah ini difokuskan pada penerapan federated learning dalam bidang medis, khususnya dalam diagnosis tumor otak. Gambar 1 adalah kerangka kerja dari model federasi yang diusulkan yang digunakan dalam penelitian ini.

Gambar 1. Struktur model yang diusulkan menggunakan pendekatan FL

Federated learning telah diterapkan di berbagai domain medis, termasuk deteksi tumor otak dan klasifikasi elektrokardiogram (EKG). Dalam sebuah penelitian, pembelajaran gabungan meningkatkan deteksi tumor otak sebesar 33%, sementara penelitian lain menerapkan teknik pembelajaran gabungan untuk klasifikasi aritmia menggunakan sinyal EKG 12-lead. Pembelajaran federasi telah menunjukkan hasil yang menjanjikan dalam klasifikasi EKG, sehingga memungkinkan pengembangan model yang akurat dan menjaga privasi. Meqdad dkk. dalam makalah “Classification of electrocardiogram signals based on federated learning and a Gaussian multivariate aggregation module” mengusulkan sebuah pendekatan baru untuk mendeteksi kelainan jantung menggunakan federated learning (FL). Pendekatan ini menjawab tantangan dalam mengakses data dari berbagai tempat yang jauh dan menyajikan kemungkinan pembelajaran tanpa perlu mentransfer data dari sumber utama. Makalah ini memperkenalkan pendekatan agregasi dalam FL menggunakan pengoptimal rata-rata bobot stokastik (SWA) dan Gaussian multivariat untuk mengatasi tantangan data yang tidak seimbang. Pendekatan yang diusulkan mencapai akurasi 87,98% dalam pengujian dengan arsitektur VGG19 yang mumpuni.

Pembelajaran federasi telah diterapkan dalam klasifikasi elektrokardiogram (EKG) dan pendeteksian pesan penipuan. Dalam klasifikasi EKG, pembelajaran gabungan telah digunakan untuk mengembangkan model klasifikasi aritmia yang akurat sambil mempertahankan data. Di sisi lain, dalam deteksi pesan penipuan, federated learning telah digunakan untuk melatih model deteksi penipuan tanpa berbagi data mentah, sehingga memungkinkan setiap bank untuk melatih model deteksi penipuan dari data yang didistribusikan di berbagai institusi. Chen dan Halime dalam makalah berjudul “Federated learning for scam classification in small Indonesian language dataset: an initial study” mengeksplorasi penggunaan federated learning (FL) dengan model gated recurrent unit (GRU) untuk mengklasifikasikan pesan-pesan penipuan dalam bahasa Indonesia dengan dataset yang terbatas. Para penulis menyediakan dua model dasar berbasis FL (algoritma FedAvg dan daisy-chained) dan sebuah dataset untuk klasifikasi penipuan dalam bahasa Indonesia. Mereka memeriksa model-model tersebut berdasarkan metrik kinerja seperti presisi, recall, F1, selektivitas, dan akurasi yang seimbang. Model FL dengan algoritma FedAvg memiliki kinerja yang lebih baik di semua metrik kecuali recall. Penelitian ini juga menunjukkan karakteristik algoritma FL dan hyperparameter untuk kasus penggunaan ini sebagai petunjuk untuk menyempurnakan model dasar ini. Secara keseluruhan, makalah ini menunjukkan potensi penggunaan FL untuk klasifikasi penipuan dalam dataset bahasa Indonesia yang terbatas.

Studi tentang pembelajaran federasi ditunjukkan dalam beberapa artikel yang telah disebutkan sebelumnya. Tautan berikut ini akan membawa pembaca ke laman, di mana artikel-artikel tersebut dapat dibaca secara GRATIS: https://www.beei.org/index.php/ dan https://ijeecs.iaescore.com/index.php/

Redaksi: D. Ilham

Editor: I. Busthomi