Jaringan saraf konvolusional (CNN) pertama kali dirancang untuk tujuan pengenalan gambar di bidang visi komputer. Jaringan ini adalah jenis jaringan syaraf tiruan khusus yang telah terbukti sangat efektif dalam menganalisis data visual. Perkembangan CNN didorong oleh kebutuhan untuk membuat model yang dapat mengklasifikasikan dan mengkategorikan gambar secara akurat, dan keberhasilannya dalam bidang ini telah menyebabkan penggunaannya secara luas dalam berbagai aplikasi lain seperti deteksi objek, segmentasi gambar, dan bahkan pemrosesan bahasa alami.
CNN terinspirasi oleh struktur dan fungsi korteks visual di otak manusia. Seperti korteks visual, CNN terdiri dari beberapa lapisan neuron yang saling berhubungan yang memproses berbagai aspek masukan data. Inovasi utama CNN terletak pada kemampuannya untuk secara otomatis mempelajari dan mengekstrak fitur yang relevan dari gambar, sehingga menghilangkan kebutuhan akan rekayasa fitur manual. Hal ini dicapai melalui penggunaan lapisan konvolusional, yang menerapkan filter pada gambar masukan untuk mendeteksi berbagai pola dan fitur visual, seperti tepi, sudut, dan tekstur.
Terobosan pertama dalam CNN datang dengan diperkenalkannya arsitektur LeNet-5 oleh Yann LeCun dkk. pada tahun 1998. LeNet-5 dirancang khusus untuk pengenalan digit tulisan tangan dan mencapai kinerja luar biasa pada kumpulan data MNIST, kumpulan data benchmark yang banyak digunakan untuk mengevaluasi algoritme pengenalan gambar. LeNet-5 mendemonstrasikan kekuatan CNN dalam menangkap fitur hierarki dari gambar, memungkinkan klasifikasi yang akurat bahkan dengan adanya variasi dalam skala, rotasi, dan terjemahan.
Sejak itu, CNN telah berkembang secara signifikan, dengan arsitektur yang lebih dalam dan kompleks dikembangkan. Salah satu kemajuan penting adalah pengenalan arsitektur AlexNet oleh Alex Krizhevsky dkk. pada tahun 2012. AlexNet mencapai terobosan dalam klasifikasi gambar dengan memenangkan ImageNet Large Scale Visual Recognition Challenge (ILSVRC) dengan tingkat kesalahan yang jauh lebih rendah dibandingkan pendekatan sebelumnya. Keberhasilan ini membuka jalan bagi meluasnya adopsi CNN dalam tugas pengenalan gambar.
CNN juga telah berhasil diterapkan pada tugas visi komputer lainnya. Misalnya, dalam deteksi objek, CNN dapat dikombinasikan dengan lapisan tambahan untuk melokalisasi dan mengklasifikasikan objek dalam gambar. Jaringan Neural Konvolusional Berbasis Wilayah (R-CNN) terkenal yang diperkenalkan oleh Ross Girshick dkk. pada tahun 2014 adalah contoh arsitektur seperti itu. R-CNN mencapai hasil mutakhir pada tolok ukur deteksi objek dengan memanfaatkan kekuatan CNN untuk ekstraksi fitur dan menggabungkannya dengan metode proposal wilayah.
Jaringan saraf konvolusional pertama kali dirancang untuk tugas pengenalan gambar di bidang visi komputer. Mereka telah merevolusi bidang ini dengan secara otomatis mempelajari fitur-fitur yang relevan dari gambar, sehingga menghilangkan kebutuhan akan rekayasa fitur manual. Perkembangan CNN telah membawa kemajuan signifikan dalam klasifikasi gambar, deteksi objek, dan berbagai tugas visi komputer lainnya.
Pertanyaan dan jawaban terbaru lainnya tentang EITC/AI/ADL Advanced Deep Learning:
- Mengapa kita perlu menerapkan pengoptimalan dalam pembelajaran mesin?
- Kapan overfitting terjadi?
- Bisakah Convolutional Neural Networks menangani data sekuensial dengan memasukkan konvolusi dari waktu ke waktu, seperti yang digunakan dalam model Convolutional Sequence to Sequence?
- Apakah Generative Adversarial Networks (GANs) mengandalkan gagasan generator dan diskriminator?