
Proyek berteknologi tinggi selalu dimulai dengan rencana multi-tingkatan yang harus mencakup Biaya Kepemilikan Total (TCO) perangkat lunak dan infrastruktur terkait.
Masalah bagi banyak integrator dan pengguna akhir adalah terkait sistem perangkat keras dan perangkat lunak multi-vendor, banyak biaya tersembunyi mungkin tidak disampaikan pada tahap perencanaan awal.
Sebagai tim dengan pengalaman yang luas dalam menerapkan solusi pengenalan wajah, kami memutuskan untuk berbagi pengalaman kami sendiri dan menyampaikan kesulitan apa yang mungkin Anda temui saat merealisasikan proyek ini.
Kami akan memberikan beberapa tips dalam memilih perangkat lunak pengenalan wajah yang memungkinkan Anda mendapatkan hasil maksimal dengan TCO minimal.
Biaya Lisensi bukan TCO
Beberapa orang percaya bahwa kita cukup memilih perangkat lunak pengenalan wajah dari vendor yang menawarkan harga beli lisensi terendah.
Namun, pendekatan ini kurang tepat dan dapat menghabiskan biaya berkali-kali lipat dari solusi dengan harga lisensi yang lebih tinggi.
Biaya tak terduga dapat muncul akibat dukungan teknis yang tidak termasuk dalam harga lisensi dan hingga keterbatasan serius pada sistem berdasarkan perangkat lunak tersebut ketika kita mencoba mengubah, menambahkan, atau menghapus sesuatu.
Penting untuk diketahui bahwa keberhasilan proyek bergantung pada pilihan solusi, dan setiap detail yang diabaikan dapat menyebabkan kegagalan.
Oleh karena itu, kita perlu memilih perangkat lunak yang fleksibel dan stabil yang memang sejak awal dirancang sesuai seluruh rangkaian tugas yang akan dilakukan, dan dengan kemampuan modifikasi di masa mendatang.
Selalu Pertimbangkan Perangkat Keras
Selain lisensi perangkat lunak, sistem pengenalan wajah apa pun memerlukan banyak perangkat keras, yang mencakup kamera, panjang kabel, sakelar, server untuk pemrosesan video, dan penyimpanan data.
Sering kali, perangkat keraslah yang menjadi pertimbangan utama baik dari segi modal maupun biaya operasional.
Jadi, untuk proyek besar dengan cakupan wilayah yang luas, pengeluaran utama untuk peralatan mungkin bukan pada server atau kamera, tetapi untuk kabel berkualitas tinggi.
Pada saat yang sama, ketika menghitung biaya proyek, Anda tidak boleh mengabaikan pentingnya perangkat lunak, karena pilihan penyedia solusi perangkat lunak secara langsung memengaruhi biaya untuk memastikan daya komputasi yang diperlukan.
Hindari membeli perangkat keras hanya untuk menutupi kebutuhan saat ini, namun harus memiliki cadangan kapasitas, karena pada tahap evaluasi dan desain tidak selalu memungkinkan untuk menilai sepenuhnya persyaratan perangkat keras.
Seiring berkembangnya bisnis, masalah kekurangan server muncul, yang mungkin membutuhkan lebih banyak daya komputasi.
Perangkat lunak itu sendiri harus diperbarui terus-menerus dan juga bisa menjadi sedikit lebih menuntut.
Oleh karena itu, sejak awal, Anda tidak boleh mencoba memilih spesifikasi perangkat keras seminimal mungkin yang hampir tidak memungkinkan semuanya berjalan lancar.
Dengan mengambil keputusan yang mendukung satu atau perangkat lunak lain, Anda mendapatkan standar yang bagus untuk sistem pengenalan wajah, dapat diprediksi pada skala berapa pun, atau sebaliknya, Anda akan mendapatkan solusi mengecewakan yang membutuhkan investasi tanpa akhir.
Jadi apa untungnya memilih solusi perangkat lunak yang ternyata membuat banyak kebocoran anggaran di sana-sini?
Sebagiamana ditunjukkan dalam praktik kami, pertimbangan dan pengoptimalan adalah faktor kunci dari penghematan dalam berbagai proyek yang melibatkan analisis video.
ItPenting untuk mempertimbangkan bagaimana perangkat lunak menggunakan sumber daya yang dialokasikan. Misalnya, baik CPU , dan GPU dapat digunakan untuk memproses streaming video.
Menerapkan solusi hanya dengan menggunakan CPU mungkin terlihat lebih mudah (karena lebih umum, banyak spesialis sudah memiliki pengalaman menggunakannya) dan lebih murah (karena biaya minimum pembelian peralatan tersebut lebih rendah).
Namun, jika jumlah video yang harus diproses sudah maksimal, solusi ini menjadi semakin mahal.

Misalnya, jika kita ambil contoh akan dipasang satu atau dua kamera, bahkan NUC ringkas dengan intel core i5 dapat dengan mudah menangani tugas ini, tetapi untuk memproses 20 kamera, Anda akan memerlukan server dengan CPU 24 core, dan persyaratan lebih lanjut akan semakin meningkat.
Namun untuk solusi berbasis GPU, biaya «awal» untuk membeli solusi ini secara signifikan lebih tinggi, tetapi kinerja solusi tersebut juga lebih unggul. Misalnya, untuk 20 kamera video yang sama yang dapat memproses pengenalan wajah di pusat perbelanjaan kecil, hanya diperlukan satu kartu video RTX 2080Ti dan CPU 4 core, dan yang paling penting, biaya ekspansi akan semakin murah.
Ketika kita menerapkan solusi skala besar untuk ratusan streaming video, selisihnya akan cukup signifikan.
Sebagai contoh, mari kita bandingkan solusi antara format GPU dan CPU untuk 100 kamera video di mal untuk memantau lalu lintas dan mendeteksi orang dalam blacklist.
Saat mengenali wajah dengan track yang belum pernah ada, ini menyiratkan operasi secara real time.
Skenario ini adalah yang paling sulit untuk sistem, karena memiliki persyaratan kecepatan tinggi dan mempertahankan beban kerja yang konstan.
Dalam skenario seperti itu, sistem dapat menghasilkan hingga 1.000.000 pengenalan wajah per hari, dan jumlah wajah yang dikenali secara bersamaan dapat mencapai ratusan.
Kita membutuhkan sekitar 200 core CPU, dengan masing-masing setidaknya 2,8 GHz untuk memberikan kecepatan respons yang layak.
Server standar dengan dua motherboard Intel Xeon 40 core (thread tidak dihitung) sudah cukup.
Jadi kita perlu memasang sistem 5 server yang cukup rumit, tingginya sekitar 5 unit, dengan pembangkitan panas dan konsumsi daya yang sesuai, dan harga sekitar USD70 ribu (termasuk semua komponen lainnya).
Untuk skenario yang sama, menggunakan GPU, kita perlu 1 server 4U dengan 8 GPU Tesla T4 dan CPU murah dengan 8 core untuk memproses permintaan.
Solusi semacam itu akan menelan biaya sekitar USD40 ribu, ini memang jauh lebih murah baik dari segi harga dan perawatan, serta konsumsi daya.
Solusi yang dirancang untuk berjalan pada CPU akan lebih mahal, karena kepadatan prosesor per server jauh lebih rendah daripada kartu video.
Konfigurasi berdasarkan GPU membuat sistem lebih ringkas, fleksibel, dan efisien.
Itulah alasan FindFace Multi dirancang dengan kemampuan untuk berjalan di GPU, yang memungkinkan Anda memproses lebih banyak streaming video dengan biaya lebih hemat.
Aspek penghematan biaya lainnya adalah kemampuan perangkat lunak yang dipilih untuk berintegrasi dengan infrastruktur yang ada dan berfungsi pada berbagai peralatan.
Banyak pelanggan, yang sudah memiliki berbagai sistem pengawasan video, hanya ingin melengkapinya dengan fungsi pengenalan wajah.
Sayangnya, tidak semua penyedia sistem pengenalan wajah mau berkompromi, karena ini akan menyebabkan penurunan kinerja pengenalan secara signifikan.
Umumnya, menerapkan pengenalan wajah berarti memerlukan peningkatan semua peralatan, yang jauh lebih mahal daripada hanya menambahkan di atas kapasitas yang sudah ada saat ini, dan dengan demikian, penghematan biaya tidak mungkin dilakukan.
Tim pengembangan NtechLab menciptakan produk perangkat lunak yang dapat berfungsi dengan berbagai peralatan.
Teknologi kami tidak terpengaruh oleh produsen perangkat keras server atau kamera khusus untuk pengenalan wajah.
Cukup dengan memenuhi spesifikasi perangkat keras dan persyaratan pemasangan kamera.
Berkat jaringan neural yang mampu mendeteksi wajah individu secara efektif, kualitas 30 piksel sudah cukup untuk merekam wajah.
Pilih Perangkat Lunak yang Dapat Diskalakan
Skalabilitas adalah salah satu karakteristik utama dari sistem pengenalan biometrik.
Proyek yang melibatkan penggunaan sistem semacam itu dapat dilokalkan seperti kamera atau terminal tunggal, atau skala besar seperti jaringan kamera yang mencakup seluruh kota metropolitan.
Perlu diingat bahwa setiap proyek harus selalu mempertimbangkan kemungkinan perluasan, yang memerlukan tingkat fleksibilitas sistem yang tinggi.
Seiring bertambahnya kebutuhan bisnis, penskalaan sistem pengenalan wajah tidak dapat dihindari, sehingga pelanggan mau tidak mau harus meningkatkan sistem.
Dan ini tergantung pada penyedia perangkat lunak tertentu, karena harganya mungkin tidak linear.
Banyak vendor sistem pengenalan wajah memiliki batasan penskalaan perangkat lunak, misalnya, ketika satu server tidak dapat menangani lebih dari sejumlah streaming video tertentu atau jumlah total server deteksi untuk sistem terbatas.
Hal ini menyebabkan banyak kerumitan dalam arsitektur solusi akhir serta biaya penerapan, operasional, dan dukungannya.
Pengalaman kami menunjukkan bahwa perangkat lunak deteksi yang tidak dioptimalkan, jika diperluas, dapat menghabiskan biaya 2−3 kali lebih mahal daripada solusi dengan arsitektur yang dirancang dengan matang dan tingkat pengoptimalan yang tinggi.
Untuk sistem pengenalan wajah juga ada aspek tambahan berupa kecepatan pengambilan gambar dan perbandingan dengan gambar dari database, yang ukurannya bisa berkisar dari puluhan ribu hingga miliaran entri wajah.
Dengan bertambahnya jumlah data, solusi yang tidak dioptimalkan memiliki kecepatan pencarian yang lebih rendah, sementara perangkat lunak dengan desain khusus memiliki kecepatan tinggi yang konsisten.
Misalnya, FindFace Multi mampu mencari gambar dalam 0,025 detik untuk 100.000 entri, sementara penskalaan horizontal linear (sharding) memastikan perluasan ke ukuran berapa pun tanpa adanya penurunan kinerja.
Pertimbangan Arsitektur Sistem
Proyek besar untuk menerapkan pengenalan wajah biasanya melibatkan sejumlah besar objek jarak jauh.
Misalnya, di fasilitas industri yang bergerak di bidang ekstraksi dan pemrosesan sumber daya alam, objek dapat terletak beberapa kilometer jauhnya, dan wajar jika bandwidth yang sangat tinggi dan saluran komunikasi yang andal diperlukan untuk membangun interaksi antara semua elemen jaringan.
Mengirimkan streaming video dari kamera ke server pemrosesan memerlukan kecepatan tinggi, sehingga biayanya mahal untuk jarak jauh.
Apakah biaya masuk akal jika kita harus mendukung sistem dengan 30 kamera, masing-masing membutuhkan setidaknya 4 Mbit/dtk untuk kamera HD dan 8 Mbit/dtk untuk FullHD, dan secara kolektif lebih dari 120 Mbit/dtk dan 240 Mbit/dtk?
Biasanya, biaya ini tidak diperhitungkan, yang dapat meningkatkan TCO secara signifikan di kemudian hari.
Tidak semua developer perangkat lunak memperkirakan masalah ini, yang membuatnya sulit untuk mengubah konfigurasi sistem guna memenuhi kebutuhan pelanggan.
Salah satu cara untuk mengurangi biaya bandwidth adalah dengan memindahkan server pra-pemrosesan video langsung ke lokasi tempat kamera dipasang.
Server lokal dapat menerima streaming video secara langsung, menganalisisnya, dan hanya mengirim gambar yang relevan ke server utama.
Pengiriman gambar akan membutuhkan bandwidth yang jauh lebih sedikit, dan bahkan 2−4 kamera dapat beroperasi pada koneksi 1−2 Mbit/dtk.
Tetapi kadang-kadang bahkan kecepatan di angka itu sulit untuk diwujudkan, atau mungkin ada persyaratan untuk kecepatan respons, di mana pada koneksi 1−2 Mbit/dtk bukan termasuk yang tercepat atau koneksi sama sekali tidak stabil.
Untuk sistem seperti itu ada kemungkinan untuk membangun jaringan instalasi independen, yang sepenuhnya otonom, tetapi dengan sinkronisasi database berkas.
Dengan demikian, sistem akan memiliki database wajah terbaru dan tersinkronisasi, kecepatan respons yang tinggi (karena semua komponen ditempatkan secara lokal) dan tidak bergantung pada stabilitas koneksi Internet.
Sangat penting untuk memilih solusi yang memiliki kemampuan untuk bekerja dalam kombinasi hybrid apa pun tanpa kehilangan efisiensinya.
Bagaimana cara menghitung TCO?
Menghitung total biaya kepemilikan proyek pengenalan wajah adalah tugas kompleks yang hanya dapat dilakukan oleh spesialis dengan pengalaman bertahun-tahun dalam integrasi sistem biometrik.
Anda dapat bertanya ke pakar kami yang selalu siaga, mereka akan memilih integrator yang tepat untuk Anda, dengan mempertimbangkan semua detail dan potensi kendala.
Cukup isi formulir kontak dengan deskripsi proyek Anda dan kami akan segera menanggapinya.