Berbicara tentang berbagai area aplikasi Jaringan Neural Buatan tidak mungkin dan tidak lengkap tanpa membahas tentang latar belakang jaringan neural, sejarah penelitiannya, dan kategori utama sistem neural buatan.
Mari langsung saja.

Pengantar

Salah satu inovasi penelitian paling signifikan dalam dekade terakhir adalah diperkenalkannya neurosains dan aplikasi berbasis penginderaan komputer untuk memahami gambar dan pemandangan. Sejak pertengahan abad sebelumnya, masalah pengenalan objek dianggap sebagai tugas paling rumit dalam penginderaan komputer.

Pengenalan objek adalah properti paling mendasar dan fundamental dari sistem visual kita. Ini adalah dasar dari tugas kognitif lainnya, seperti tindakan motorik dan interaksi sosial. Oleh karena itu, pemahaman teoretis dan pemodelan pengenalan objek adalah salah satu masalah sentral dalam neurosains komputasi.

Bagi sebagian besar orang, persepsi visual dianggap sebagai yang paling penting dari panca indera, yang digunakan dalam kehidupan sehari-hari. Hampir dua pertiga dari informasi yang kita terima dari indera kita adalah informasi visual. Ada berbagai macam tugas yang kita lakukan selama pemrosesan persepsi visual: menemukan objek dalam gambar yang menarik perhatian kita, memahami objek apa yang diwakilinya terlepas dari perubahan posisi dan ukuran, mengatasi silau dan perubahan warna, pengenalan objek yang berantakan, dan banyak lagi yang lainnya. Manusia melakukan tugas-tugas tersebut secara alami dan tanpa kesulitan. Namun, tugas-tugas ini akan sangat sulit dilakukan ketika kita mencoba mensimulasikannya dengan sistem buatan.

Salah satu pelopor dalam penelitian sel saraf adalah seorang ahli saraf Spanyol dan pemenang Nobel Santiago Ramón y Cajal, yang merupakan orang pertama yang menjelaskan dan menggambar dengan lengkap (pada abad ke-19) jenis-jenis utama sel saraf dalam otak manusia. Ilustrasi yang indah tersebut dapat Anda lihat di sini. Karena sekarang kita tahu bahwa beberapa kesimpulan beliau salah, tetapi prinsip utama dari fungsi otak dapat dijelaskan dengan benar.

Beberapa generasi ilmuwan setelah Ramón y Cajal mempelajari dasar-dasar organ manusia yang paling kompleks ini, tetapi bahkan hingga saat ini kita tidak sepenuhnya memahami kompleksitas fungsi otak secara keseluruhan. Kira-kira mulai dari tahun 1950-an, para ilmuwan mencoba memodelkan cara kerja otak dengan bantuan analog[1] dan kemudian membuat jaringan neural digital. Konsep jaringan neural tiruan diperkenalkan oleh Warren McCulloch dan Walter Pitts di tahun 1943[2]. Prinsip-prinsip pembelajaran jaringan neural ini pada awalnya diambil dari konsep dasar kerja otak dan aturan membangun sinapsis — yaitu struktur yang memungkinkan neuron (atau sel saraf) untuk meneruskan sinyal listrik atau kimia ke neuron lain[3].

Sehingga kemudian diusulkan pandangan hierarkis tentang sistem visual manusia, berdasarkan lapisan sel yang kompleks dan sederhana di korteks visual. Pada paruh kedua abad sebelumnya, konsep hierarki dalam streaming pemrosesan visual ini pertama kali digunakan oleh para ilmuwan penginderaan komputer untuk membangun model hierarkis teoretis pertama untuk pengenalan objek. Model jaringan neural yang masuk akal secara biologis sudah digunakan dalam penginderaan komputer selama beberapa dekade terakhir. Namun, butuh waktu lama hingga kompleksitas komputasi dari jenis arsitektur ini bisa memungkinkan para peneliti untuk membangun dan melatih model kompleks yang sebenarnya, berdasarkan struktur teoretis ini. Hingga baru sekitar 10 tahun yang lalu, model pertama dari jenis ini mulai muncul.
Karena memiliki struktur multi-lapisan yang kompleks, arsitektur ini disebut ‘nmedalam’.

Keakuratan sistem penginderaan komputer modern lebih tinggi daripada manusia[4].
Mereka dapat melakukan banyak tugas: pengenalan visual tingkat rendah seperti deteksi batasan, tugas tingkat menengah (deteksi ci ri khas, segmentasi semantik) dan tugas tingkat tinggi seperti identifikasi objek.

Dalam makalah ini, kami akan menjelaskan secara singkat tentang teknologi, yang mendasari semua tugas ini dan menjelaskan prinsip dasar penerapan teknologi ini pada masalah pengenalan wajah.

Tantangan pengenalan wajah

Dibandingkan dengan tugas pengenalan objek umum, pengenalan wajah lebih menantang, karena membutuhkan alat yang lebih tepat untuk deteksi, pengenalan, dan identifikasi wajah.
Ada banyak tantangan: adanya penutup (seperti rambut, kacamata, masker, jenggot); perubahan warna, cahaya, dan iluminasi; kepala bergerak, usia dll.

Selain masalah di atas, ada juga kesulitan khusus, terkait dengan pengenalan wajah seperti:

  • kemampuan untuk menangkap perbedaan kecil pada wajah orang yang sama
  • kemampuan untuk menggambarkan kelas objek yang tidak ada dalam sampel pelatihan

Karena semua alasan tersebut, masalah pengenalan wajah untuk biometrik biasanya dianggap sulit.

Deskripsi teknologi

Ada banyak sistem penginderaan komputer untuk pengenalan gambar. Banyak pendekatan telah digunakan sebelumnya, seperti transformasi fitur skala-invarian (SIFT), algoritme dalam penginderaan komputer untuk mendeteksi dan menggambarkan fitur lokal dalam gambar, atau histogram gradien berorientasi (HOG), yaitu deskriptor fitur yang digunakan dalam penginderaan komputer dan pemrosesan gambar untuk tujuan deteksi objek. Dalam tugas pengenalan objek yang khas, salah satu algoritme ini biasanya dikombinasikan dengan pengklasifikasi sederhana, seperti mesin vektor dukungan (SVM) untuk melakukan tugas pengenalan objek. Namun, pendekatan jaringan neural lebih dominan di pasar, karena umumnya mengungguli pendekatan konvensional sejak 2012.

Kinerja pendekatan pengenalan gambar yang berbeda-beda dibandingkan setiap tahun dalam Imagenet Large Scale Visual Recognition Challenge (ILSVCR) sejak 2010. ILSVCR adalah kompetisi di mana tim peneliti mengirimkan program yang mengklasifikasikan dan mendeteksi objek dan pemandangan. Pada tahun 2012, jaring neural konvolusional mendalam mencapai akurasi terbaik dalam sejarah dengan mengungguli kompetitornya sebesar 16%. Sejak itu, jaring konvolusional memenangkan semua kompetisi sampai sekarang. Pada tahun 2015, para peneliti melaporkan bahwa perangkat lunak sudah melebihi kemampuan pengenalan manusia dalam beberapa tugas ILSVCR. Oleh karena itu, pendekatan jaringan neural, terutama jaringan neural konvolusional, dianggap (jika tersedia data yang cukup) sebagai algoritme dengan kinerja terbaik untuk pengenalan gambar (silakan baca di sini dan di sini).

Tantangan serupa, tetapi untuk pengenalan wajah pada gambar, diperkenalkan pada tahun 2015 (tantangan MegaFace pertama). Set data untuk tantangan ini mencakup satu juta foto yang menangkap lebih dari 690 ribu individu yang berbeda. Algoritme berbasis jaringan neural mengungguli semua metode konvensional dan memenangkan tantangan di tahun 2015 dan 2016. Selain itu, pada tahun 2015, algoritme NtechLab-lah yang memenangkan tantangan MegaFace, mengalahkan laboratorium digital terkemuka di dunia, termasuk Google, Beijing University, dan beberapa tim dari seluruh penjuru Rusia.

Apa sebenarnya jaringan neural itu? Apa saj kategori utama jaringan neural tiruan ini?
Bagaimana cara kerja proses pembelajaran mesin? Kami akan mengupas lebih banyak dan mendalam tentang hal ini di salah satu postingan berikut. Jangan kemana-mana!
Dan jangan ragu untuk mengirimkan komentar atau pertanyaan Anda.

[1] Rosenblatt, Frank (1957), The Perceptron-a perceiving and recognizing automaton. Report 85−460−1, Cornell Aeronautical Laboratory.

[2] A logical calculus of the ideas immanent in nervous activity // Bulletin of Mathematical Biology. — New York: Springer New York, 1943. — Т. 5, № 4. — С. 115—133.

[3] Donald Olding Hebb. The Organization of Behavior: A Neuropsychological Theory. — Wiley, 1949. — 335 p

[4] Fukushima К., Miyake S., Takayuki I. Neocognitron: A neural network model for a mechanism of visual pattern recognition. IEEE Transaction on Systems, Man and Cybernetics SMC-13(5):826−34. — 1983.