Tantangan AI terus membelah masyarakat, mengutamakan mereka yang beruntung dan meninggalkan rakyat biasa dalam kemiskinan. Tidak ada solusi singkat untuk ini karena AI modern bertumpu pada asumsi bahwa makin banyak data yang dikumpulkan, semakin baik perangkat lunak yang dihasilkan. Ini tidak lain daripada mengulang hal-hal yang sudah dilakukan selama abad ke-2 SM oleh bangsa Babilonia dengan berbagai metode lain seperti memecah dan menggabungkan untuk mencari hukuman.
Pengembangan AI bertumpu pada data paling relevan untuk melatih banyak model pembelajaran mesin seperti model bahasa dan pengenalan gambar. Data tersebut bersifat sangat pribadi dan jumlahnya jauh lebih besar dibandingkan ukuran modelnya, sehingga memindahkannya ke pusat akan berisiko secara privasi serta inefisien secara teknis karena keterbatasan bandwidth dan biaya komunikasi.
Sementara itu, pengembangan AI dalam sektor medis di Indonesia hampir berhenti beroperasinya karena kekhawatiran terkait pengelolaan data pasien. Banyak proyek AI medis yang terhambat akibat ketidakpastian terhadap tata kelola datanya, sehingga membuat kepercayaan masyarakat mereda.
Namun, ini bukan berarti ada jawaban bagi masalah tersebut. Ada upaya mengubah cara AI belajar dari data dengan memindahkan pembaruan model tanpa pernah mengunggah isi ketikan pengguna ke server pusat. Salah satu pendekatan yang paling banyak dibahas adalah federated learning, metode pelatihan AI dirancang agar data tidak perlu dipindahkan dari tempat asalnya.
Dalam federated learning, model dikirimkan ke lokasi data untuk dilatih secara lokal oleh end user alias kita-kita ini. Data yang dikirim ke pusat adalah hasil pelatihannya sementara data pengguna tetap tersimpan di lokasi asal tersebut. Pengembangan AI modern selama ini bertumpu pada asumsi bahwa makin banyak data yang dikumpulkan dan dipusatkan, maka lebih baik performa model yang dihasilkan.
Namun, data-data paling relevan untuk melatih banyak model pembelajaran mesin seperti model bahasa dan pengenalan gambar berada di perangkat pengguna. Data tersebut bersifat sangat pribadi dan jumlahnya jauh lebih besar dibandingkan ukuran modelnya, sehingga memindahkannya ke pusat akan berisiko secara privasi serta inefisien secara teknis.
Federated learning mengirimkan model ke lokasi data untuk dilatih secara lokal oleh end user alias kita-kita ini. Yang dikirimkan ke pusat adalah hasil pelatihan, sementara data pengguna tetap tersimpan di lokasi asal tersebut. Data pada tiap perangkat tidak seragam, jumlah data antar-pengguna tidak seimbang dan tidak semua perangkat selalu terhubung ke jaringan.
Pendekatan ini pun kemudian menarik perhatian dari dunia medis yang memiliki aturan sangat ketat terkait data serta kerahasiaan pasien. Dalam mengembangkan model AI medis, data yang dibutuhkan tidak cuma sangat besar tetapi juga dilindungi dengan sangat ketat.
Dengan demikian, federated learning memungkinkan pelatihan model secara kolaboratif tanpa pernah memindahkan data pasien. Setiap rumah sakit melatih model menggunakan data lokal, lalu mengirimkan pembaruan parameter untuk digabungkan di pusat.
Pengembangan AI bertumpu pada data paling relevan untuk melatih banyak model pembelajaran mesin seperti model bahasa dan pengenalan gambar. Data tersebut bersifat sangat pribadi dan jumlahnya jauh lebih besar dibandingkan ukuran modelnya, sehingga memindahkannya ke pusat akan berisiko secara privasi serta inefisien secara teknis karena keterbatasan bandwidth dan biaya komunikasi.
Sementara itu, pengembangan AI dalam sektor medis di Indonesia hampir berhenti beroperasinya karena kekhawatiran terkait pengelolaan data pasien. Banyak proyek AI medis yang terhambat akibat ketidakpastian terhadap tata kelola datanya, sehingga membuat kepercayaan masyarakat mereda.
Namun, ini bukan berarti ada jawaban bagi masalah tersebut. Ada upaya mengubah cara AI belajar dari data dengan memindahkan pembaruan model tanpa pernah mengunggah isi ketikan pengguna ke server pusat. Salah satu pendekatan yang paling banyak dibahas adalah federated learning, metode pelatihan AI dirancang agar data tidak perlu dipindahkan dari tempat asalnya.
Dalam federated learning, model dikirimkan ke lokasi data untuk dilatih secara lokal oleh end user alias kita-kita ini. Data yang dikirim ke pusat adalah hasil pelatihannya sementara data pengguna tetap tersimpan di lokasi asal tersebut. Pengembangan AI modern selama ini bertumpu pada asumsi bahwa makin banyak data yang dikumpulkan dan dipusatkan, maka lebih baik performa model yang dihasilkan.
Namun, data-data paling relevan untuk melatih banyak model pembelajaran mesin seperti model bahasa dan pengenalan gambar berada di perangkat pengguna. Data tersebut bersifat sangat pribadi dan jumlahnya jauh lebih besar dibandingkan ukuran modelnya, sehingga memindahkannya ke pusat akan berisiko secara privasi serta inefisien secara teknis.
Federated learning mengirimkan model ke lokasi data untuk dilatih secara lokal oleh end user alias kita-kita ini. Yang dikirimkan ke pusat adalah hasil pelatihan, sementara data pengguna tetap tersimpan di lokasi asal tersebut. Data pada tiap perangkat tidak seragam, jumlah data antar-pengguna tidak seimbang dan tidak semua perangkat selalu terhubung ke jaringan.
Pendekatan ini pun kemudian menarik perhatian dari dunia medis yang memiliki aturan sangat ketat terkait data serta kerahasiaan pasien. Dalam mengembangkan model AI medis, data yang dibutuhkan tidak cuma sangat besar tetapi juga dilindungi dengan sangat ketat.
Dengan demikian, federated learning memungkinkan pelatihan model secara kolaboratif tanpa pernah memindahkan data pasien. Setiap rumah sakit melatih model menggunakan data lokal, lalu mengirimkan pembaruan parameter untuk digabungkan di pusat.