Pembelajaran Kolaboratif Manusia-Mesin

Vadim Tschernezki, Moin Nabi dan Tassilo Klein (ML Research Berlin)

Kami telah memasuki era baru, di mana kami mengalami peningkatan kekuatan komputasi, penyimpanan, dan ketersediaan data besar yang stabil dan kuat. Pembelajaran mendalam telah terbukti menjadi teknik yang ideal untuk memanfaatkan tren ini, menjadikan dirinya sebagai standar de facto dalam pembelajaran yang diawasi. Namun, jenis pembelajaran ini membutuhkan data yang akan diberi label, yang umumnya memerlukan biaya yang besar dalam kurasi data. Oleh karena itu, paradigma alternatif muncul yang memungkinkan untuk memaksimalkan potensi sejumlah besar informasi dengan cara yang baru dan berbeda. Dalam posting blog ini kami memperkenalkan konsep yang menggabungkan kekuatan manusia dan mesin secara kolaboratif. Tetapi sebelum membahas lebih detail, mari kita mulai dengan sebuah cerita yang menunjukkan manfaat dari pendekatan ini.

Pada tahun 1997, Garry Kasparov dikalahkan oleh superkomputer (Deep Blue) dalam pertandingan catur di bawah peraturan turnamen. Itu adalah acara utama, di mana juara catur dunia yang berkuasa dikalahkan oleh mesin. Sementara Kasparov masih belum pulih dari pengalaman ini, ia juga mendapat inspirasi dari Deep Blue. Dia bertanya pada dirinya sendiri: "Bagaimana jika saya bisa bermain melawan komputer - dengan komputer lain di sisi saya - menggabungkan kekuatan kami, intuisi manusia ditambah perhitungan mesin, strategi manusia, taktik mesin, pengalaman manusia, memori mesin?"

Gagasan Kasparov tentang kolaborasi manusia-mesin dalam catur direalisasikan dengan sukses pada tahun 2005 di turnamen catur online yang dibantu komputer di mana para grandmaster bekerja sama dengan superkomputer. Hasilnya cukup tak terduga: pemenangnya adalah sepasang pemain catur amatir Amerika yang mengoperasikan tiga PC biasa secara bersamaan. Tampaknya, dalam hal ini keterampilan pemain untuk memandu komputer memainkan peran yang sangat penting. Hal ini menimbulkan pertanyaan apakah kolaborasi semacam itu juga dapat digunakan untuk tugas-tugas lain. Paragraf berikut akan menjelaskan pendekatan yang muncul dalam konteks ini.

Pendekatan dan Tren

Mesin sebagai Rekan Kerja, bukan hanya Alat

Ketika membandingkan manusia dan mesin, terbukti bahwa kedua belah pihak memiliki karakteristik dan kekuatan yang sangat unik. Manusia hebat dalam membuat keputusan yang intuitif dan kreatif berdasarkan pengetahuan mereka. Komputer pandai memproses data dalam jumlah besar untuk menghasilkan informasi yang bermakna dan kental untuk memperoleh pengetahuan baru dan membuat keputusan yang lebih baik. Memanfaatkan sinergi dari kekuatan yang berbeda ini tampaknya merupakan langkah alami berikutnya.

Dalam penelitian, kombinasi tersebut telah dieksplorasi lebih dalam selama beberapa tahun terakhir dan secara bertahap mengalami lebih banyak momentum. Salah satu pendekatan diusulkan oleh Mintz et al. menggunakan data yang tidak berlabel untuk meningkatkan model ekstraksi hubungan melalui pengawasan jauh. Secara khusus, mereka menggunakan database manusia-curated untuk merancang fungsi pelabelan heuristik dan memasukkannya ke dalam prosedur pelatihan classifier. Klasifikasi kemudian dapat mengekstraksi pola presisi tinggi untuk sejumlah besar relasi. Karena para peneliti merancang fungsi pelabelan yang mendekati perilaku pelabelan annotator manusia, itu membuat pengawasan "jauh".

Teknik lain, yang dikembangkan oleh Wang et al. di bidang visi komputer, meningkatkan deteksi objek dari gambar yang tidak berlabel melalui Penambangan Sampel yang diawasi sendiri. Bagian penting dari metode ini didasarkan pada penemuan kawasan yang dapat dipercaya secara otomatis menemukan dan memberi label semu untuk meningkatkan detektor objek. Ini dicapai dengan menempelkan proposal ini ke dalam gambar berlabel berbeda untuk secara komprehensif menilai nilai konsistensi mereka dalam konteks gambar yang berbeda. Meskipun gambar-gambar ini berlabel pseudo, mereka berkontribusi secara efektif dalam meningkatkan akurasi deteksi dan ketahanan terhadap sampel bising. Akhirnya, kedua pendekatan yang dijelaskan tersebut memberikan anotasi data yang tidak berlabel secara otomatis dan dengan demikian mengurangi jumlah pengawasan manusia dalam proses pelatihan.

Memasukkan Bimbingan Manusia ke dalam Pembelajaran Aktif

Dibandingkan dengan konsep sebelumnya, di mana dataset diperluas dengan data mesin yang dianotasi, kami juga bisa membiarkan pelajar memilih sampel yang sulit dan meminta pelatih manusia untuk membubuhi keterangan, oleh karena itu namanya pembelajaran aktif. Metode ini terbukti sangat efisien, terutama dalam situasi dengan ketersediaan anggaran terbatas untuk melatih sampel - para ahli dapat fokus pada kasus-kasus yang menantang sementara mesin mengambil alih sebagian besar sampel yang biasanya mudah diselesaikan.

Untuk menjelaskan intuisi di balik pembelajaran aktif, pertimbangkan tugas sederhana memberi label gambar anjing sehubungan dengan ras. Kami mulai dengan dataset dasar yang berisi gambar anjing berlabel. Dataset ini mungkin menimbulkan tantangan untuk pelatihan dalam beberapa cara: Sebagian besar mungkin berisi gambar anjing yang menghadap ke arah kamera, sehingga membuat model yang terlatih tidak berbeda dengan anjing yang ditampilkan dari samping. Mungkin juga mengandung jumlah sampel yang tidak seimbang untuk setiap jenis. Atau, mungkin berisi keturunan yang mirip seperti Malinois Belgia dan Anjing Gembala Jerman. Dalam kasus seperti itu, manusia dan mesin akan membutuhkan lebih banyak contoh setiap jenis untuk belajar mengklasifikasikan anjing dengan benar. Pembelajaran aktif membantu memecahkan masalah semacam ini.

Bayangkan kita dapat mencapai akurasi 80% dengan model yang dilatih pada basis data tertentu. Kami diberi anggaran untuk memberi label hingga 100 gambar baru dari 1000 gambar yang tidak berlabel dan bertujuan untuk menggunakan anggaran ini dengan bijak, karena dukungan ahli untuk pelabelan mahal. Oleh karena itu, alih-alih memilih 100 sampel secara acak, kami lebih baik membiarkan pelajar mesin kami memilih sampel yang paling sulit atau yang paling baik menangkap distribusi data yang mendasarinya dan meminimalkan redundansi. Kami membiarkan model menyarankan 100 sampel kepada ahli untuk pelabelan, yang akan diberikan label dengan kepercayaan diri rendah atau ketidakpastian tinggi. Dengan cara ini, akurasi pelajar mesin kami mungkin meningkat menjadi 95% setelah pelatihan alih-alih 90% dalam pengaturan tempat sampel berlabel acak digunakan. Atau, kita juga bisa mengurangi jumlah data yang diberi label dan karenanya, melatih model dengan akurasi 90% yang sama tetapi lebih murah biaya.

Pelatihan Adversarial: Menggabungkan Yang Terbaik dari Keduanya

Untuk menggabungkan pembelajaran aktif dan peningkatan penambahan pelabelan otomatis, kita membutuhkan pelajar mesin yang terdiri dari dua model. Pertama, model diskriminatif untuk mengukur ketidakpastian mengenai akurasi prediksi sampel yang diberikan (pembelajaran aktif) dan kedua, model generatif untuk memprediksi kebenaran tanah pseudo untuk sampel (pelabelan otomatis). Untuk meningkatkan efisiensi pelatihan pelajar, kami bertujuan untuk bersama-sama mengoptimalkan kedua model melalui pelatihan permusuhan. Dengan cara ini, model diskriminatif juga dapat digunakan untuk menetapkan ketidakpastian pada prediksi model generatif dan pada gilirannya meningkatkan akurasi prediksi. Model mutakhir yang telah mendapatkan reputasi kuat di komunitas riset dan memenuhi persyaratan yang disebutkan disebut Generative Adversarial Network (GAN).

Pembelajaran Kolaboratif Manusia-Mesin dengan GAN

Mempertimbangkan kerangka kerja yang ditunjukkan pada gambar di atas, pertama-tama kita menggunakan generator (G) untuk memprediksi kebenaran pseudo ground untuk data yang tidak diberi catatan. Karena pembeda (D) mampu menetapkan tidak hanya ketidakpastian pada kebenaran dasar yang nyata tetapi juga yang diprediksi oleh G, kita dapat mengurutkan sampel yang tidak berlabel dengan kesulitan atau ketidakpastian D. Kami mendefinisikan sampel yang distribusinya belum sepenuhnya ditangkap oleh model namun sama sulitnya dan biarkan D menyarankan mereka ke annotator manusia. Kami menggunakan sampel mudah lainnya dengan ketidakpastian rendah untuk menghasilkan data beranotasi secara otomatis dengan G. Panduan manusia menghasilkan D yang lebih kuat yang disesuaikan dengan persyaratan tugas yang ditentukan oleh guru (pembelajaran aktif). Pada gilirannya, D yang ditingkatkan akan mendorong G untuk memprediksi kebenaran tanah semu yang lebih berkualitas (anotasi otomatis). Karena peningkatan berulang ini, GAN mewakili kerangka kerja alami untuk menggabungkan manusia dan mesin menjadi satu prosedur pelatihan yang dioptimalkan bersama.

Sementara fiksi ilmiah penuh dengan mesin dan robot yang mengancam umat manusia dan dengan demikian menciptakan iklim kecurigaan, konsep pembelajaran kolaboratif manusia dengan pelatihan permusuhan menunjukkan bagaimana mesin dapat secara wajar melengkapi pekerjaan dan kehidupan kita dengan cara yang positif. Faktanya, pendekatan yang dideskripsikan memiliki potensi kuat untuk mentransformasi banyak aplikasi misalnya di sektor kesehatan. Khususnya, tim kami saat ini sedang mengembangkan pendekatan untuk segmentasi gambar resonansi magnetik kardiovaskular 3D (MR), yang merupakan prasyarat penting untuk pembuatan model jantung khusus pasien dan dengan demikian untuk pengobatan penyakit jantung yang kompleks. Tujuan kami adalah membuat model yang belajar dari segmentasi yang dihasilkan sendiri dan secara aktif menyarankan citra MR yang sulit kepada para ahli untuk segmentasi manual. Ini secara signifikan dapat mengurangi biaya dan waktu yang dihabiskan untuk prosedur yang kompleks ini, sehingga ahli radiologi dapat mencurahkan lebih banyak waktu untuk perawatan pasien. Sementara contoh khusus ini menunjukkan dengan baik dampak positif konsep tersebut pada masyarakat, ada banyak bidang aplikasi di luar sektor kesehatan, yang akan mendapat manfaat dari hasil penelitian di bidang ini.

Temukan makalah penelitian lengkap untuk MIDL 2019 di sini: Segmentasi Semantik Berbasis Semangat melalui Pembelajaran Kolaborasi Manusia-Mesin