Arsitektur jaringan saraf yang digunakan pada contoh adalah jaringan saraf feedforward dengan tiga lapisan: lapisan masukan, lapisan tersembunyi, dan lapisan keluaran. Lapisan input terdiri dari 784 unit, yang sesuai dengan jumlah piksel pada gambar input. Setiap unit pada lapisan masukan merepresentasikan nilai intensitas piksel pada citra.
Lapisan tersembunyi terdiri dari 128 unit yang sepenuhnya terhubung ke lapisan input. Setiap unit di lapisan tersembunyi menghitung jumlah input tertimbang dari lapisan input dan menerapkan fungsi aktivasi untuk menghasilkan output. Dalam contoh ini, fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah fungsi unit linier yang diperbaiki (ReLU). Fungsi ReLU didefinisikan sebagai f(x) = max(0, x), di mana x adalah jumlah bobot input ke unit. Fungsi ReLU memperkenalkan non-linearitas ke jaringan, memungkinkannya mempelajari pola dan hubungan yang kompleks dalam data.
Lapisan keluaran terdiri dari 10 unit, masing-masing mewakili salah satu kemungkinan kelas dalam masalah klasifikasi. Unit-unit di lapisan output juga terhubung penuh dengan unit-unit di lapisan tersembunyi. Mirip dengan lapisan tersembunyi, setiap unit pada lapisan keluaran menghitung jumlah bobot masukan dari lapisan tersembunyi dan menerapkan fungsi aktivasi. Dalam contoh ini, fungsi aktivasi yang digunakan pada lapisan keluaran adalah fungsi softmax. Fungsi softmax mengubah jumlah input berbobot menjadi distribusi probabilitas di atas kelas, di mana jumlah probabilitasnya sama dengan 1. Unit dengan probabilitas tertinggi mewakili kelas yang diprediksi dari gambar input.
Singkatnya, arsitektur jaringan saraf yang digunakan dalam contoh terdiri dari lapisan input dengan 784 unit, lapisan tersembunyi dengan 128 unit menggunakan fungsi aktivasi ReLU, dan lapisan output dengan 10 unit menggunakan fungsi aktivasi softmax.
Pertanyaan dan jawaban terbaru lainnya tentang Membangun jaringan saraf untuk melakukan klasifikasi:
- Apakah fungsi pembelajaran asinkron perlu digunakan untuk model pembelajaran mesin yang berjalan di TensorFlow.js?
- Bagaimana model dikompilasi dan dilatih di TensorFlow.js, dan apa peran fungsi kerugian lintas-entropi kategorikal?
- Apa pentingnya tingkat pembelajaran dan jumlah zaman dalam proses pembelajaran mesin?
- Bagaimana data pelatihan dibagi menjadi set pelatihan dan pengujian di TensorFlow.js?
- Apa tujuan TensorFlow.js dalam membangun jaringan neural untuk tugas klasifikasi?