
โครงการที่มีเทคโนโลยีสูงมักเริ่มต้นด้วยแผนหลายระดับซึ่งต้องมีต้นทุนรวมในการเป็นเจ้าของ (TCO) ของซอฟต์แวร์ และโครงสร้างพื้นฐานที่เกี่ยวข้อง ปัญหาสำหรับผู้รวมระบบ และผู้บริโภคจำนวนมาก คือ เมื่อพูดถึงระบบฮาร์ดแวร์ และซอฟต์แวร์จากผู้จำหน่ายหลายราย ค่าใช้จ่ายที่ซ่อนอยู่จำนวนมากอาจถูกมองข้ามไปในขั้นตอนการวางแผนขั้นต้น
ในฐานะทีมที่มีประสบการณ์มากมายในการใช้โซลูชั่นการจดจำใบหน้า เราจึงตัดสินใจแบ่งปันประสบการณ์ของเราเอง และบอกคุณถึงข้อผิดพลาดที่คุณอาจพบเจอในขณะที่กำลังทำให้โครงการของคุณประสบความสำเร็จ เราจะให้คำแนะนำในการเลือกซอฟต์แวร์จดจำใบหน้าซึ่งจะช่วยให้คุณได้ผลลัพธ์สูงสุดด้วยการมีต้นทุนรวมในการเป็นเจ้าของ (TCO) ในราคาขั้นต่ำ
ค่าใบอนุญาตไม่ใช่ต้นทุนรวมในการเป็นเจ้าของ (TCO)
บางคนเชื่อว่าการเลือกซอฟต์แวร์การจดจำจากผู้จำหน่ายที่เสนอราคาของสิทธิ์ในการเป็นเจ้าของใบอนุญาตในราคาต่ำที่สุดก็เพียงพอแล้ว อย่างไรก็ตาม วิธีการนี้มีข้อบกพร่อง และอาจมีค่าใช้จ่ายมากกว่าโซลูชั่นที่มีราคาใบอนุญาตที่สูงกว่าหลายเท่า ค่าใช้จ่ายที่ไม่คาดคิดอาจเริ่มต้นด้วยการสนับสนุนทางเทคนิคที่ไม่รวมอยู่ในราคาของใบอนุญาต และจบลงด้วยข้อจำกัดที่ร้ายแรงในระบบซึ่งขึ้นอยู่กับการเปลี่ยนแปลง เพิ่ม หรือลบบางสิ่งบางอย่างจากซอฟต์แวร์ดังกล่าว
สิ่งสำคัญคือต้องตระหนักว่าความสำเร็จของโครงการจะขึ้นอยู่กับตัวเลือกของโซลูชั่น การมองข้ามรายละเอียดต่าง ๆ ไปอาจนำไปสู่ความล้มเหลวได้ ดังนั้นจึงจำเป็นต้องเลือกซอฟต์แวร์ที่ยืดหยุ่น และเสถียรซึ่งได้รับการออกแบบในขั้นต้นจากการคำนึงถึงงานทั้งหมดที่ต้องดำเนินการ และคำนึงถึงการปรับเปลี่ยนในอนาคตด้วย
พิจารณาที่ฮาร์ดแวร์เสมอ
นอกเหนือไปจากใบอนุญาตใช้งานซอฟต์แวร์แล้ว ระบบการจดจำต่าง ๆ ก็มีส่วนเกี่ยวข้องกับฮาร์ดแวร์จำนวนมาก ซึ่งรวมไปถึง กล้อง สายเคเบิลที่มีความยาวหลายกิโลเมตร สวิตช์ เซิร์ฟเวอร์สำหรับการประมวลผลวิดีโอ และการจัดเก็บข้อมูล เป็นต้น ซึ่งมักจะเป็นฮาร์ดแวร์ที่เป็นรายการหลักที่จำเป็นจะต้องลงทุน และมีค่าใช้จ่ายในการดำเนินงาน ดังนั้นในโครงการขนาดใหญ่ทั่วอาณาเขตที่กว้างขวาง รายการค่าใช้จ่ายหลักอาจไม่ใช่เซิร์ฟเวอร์ หรือกล้อง แต่จะเป็นสายเคเบิลคุณภาพสูง ในขณะเดียวกัน คุณไม่ควรลดความสำคัญของซอฟต์แวร์ในขณะที่กำลังทำการคำนวณต้นทุนของโครงการเนื่องจากการเลือกผู้ให้บริการโซลูชั่นด้านซอฟต์แวร์จะส่งผลโดยตรงต่อต้นทุนในการสร้างความมั่นใจว่ากำลังประมวลผลข้อมูลได้ตามที่คุณต้องการ
หลีกเลี่ยงการซื้อฮาร์ดแวร์เพียงเพื่อให้ครอบคลุมความต้องการในปัจจุบัน โดยจำเป็นต้องมีการสำรองความจุเนื่องจากในขั้นตอนของการประเมิน และการออกแบบไม่สามารถประเมินข้อกำหนดสำหรับฮาร์ดแวร์ได้ทั้งหมดเสมอไป ในขณะที่ธุรกิจที่กำลังเติบโตอาจประสบกับปัญหาการขาดแคลนเซิร์ฟเวอร์ซึ่งอาจต้องใช้คอมพิวเตอร์ที่มีพลังในการประมวลผลที่มากขึ้น ตัวซอฟต์แวร์เองจะมีการอัปเดตใหม่ ๆ อย่างต่อเนื่อง และอาจมีความต้องการเพิ่มขึ้นอีกเล็กน้อย ดังนั้นตั้งแต่แรกเริ่ม คุณไม่ควรพยายามลดคุณสมบัติของฮาร์ดแวร์ให้อยู่ในระดับต่ำที่สุดจนไม่สามารถทำงานให้ผลลัพธ์กับคุณได้
จากการตัดสินใจเลือกซอฟต์แวร์ที่คุณชอบ หรืออย่างอื่น คุณจะได้รับระบบการจดจำเบื้องต้นที่เชื่อถือได้ สามารถคาดการณ์ได้ในทุกขนาด หรือคุณอาจจะได้รับโซลูชั่นที่น่าผิดหวัง แบะต้องใช้เงินลงทุนอย่างไม่จบไม่สิ้น แล้วอะไรคือโซลูชั่นที่เหมาะสมของเราซึ่งมีความแตกต่างไปจากซอฟต์แวร์ที่ทำให้เกิดต้นทุนราคาสูง ตามแนวทางปฏิบัติของเรา ความรอบคอบ และการเพิ่มประสิทธิภาพเป็นปัจจัยสำคัญในการประหยัดเงินในโครงการต่าง ๆ ที่เกี่ยวข้องกับการวิเคราะห์วิดีโอ
การพิจารณาว่าซอฟต์แวร์ต้องใช้ทรัพยากรที่ถูกจัดสรรไว้อย่างไรนั้นเป็นสิ่งที่สำคัญ ตัวอย่างเช่น สามารถใช้ได้ทั้ง CPU (หน่วยประมวลผลกลาง) และ GPU (หน่วยประมวลผลกราฟิก) มาทำการประมวลผลการสตรีมมิ่งวิดีโอ การใช้โซลูชั่นโดยใช้เพียง CPU อาจดูง่ายกว่า (เนื่องจากเป็นสิ่งที่ใช้กันโดยทั่วไป ผู้เชี่ยวชาญหลายคนมีประสบการณ์มาแล้ว) และราคาถูกกว่า (เนื่องจากต้นทุนอยู่ในระดับที่ต่ำกว่า) อย่างไรก็ตาม เมื่อจำนวนของสตรีมถึงจำนวนที่ต้องทำการประมวลผล โซลูชั่นนี้จะมีราคาแพงขึ้นเรื่อย ๆ

ตัวอย่างเช่น หากเรากำลังพูดถึงการทำงานกับกล้องหนึ่ง หรือสองตัว แม้แต่คอมพิวเตอร์ในรุ่นถัดไป (NUC) ที่มีขนาดกะทัดรัดที่มี intel core i5 ก็สามารถจัดการงานนี้ได้อย่างง่ายดาย แต่ในการประมวลผลกล้อง 20 ตัว คุณจะต้องมีเซิร์ฟเวอร์ที่มี CPU 24 cores และจะเพิ่มขึ้นเมื่อมีข้อกำหนดเพิ่มเติมเท่านั้น
หากเรากำลังพูดถึงโซลูชั่นที่ใช้ GPU ค่าใช้จ่ายในการ “เริ่มใช้” โซลูชั่นดังกล่าวจะสูงขึ้นอย่างเห็นได้ชัด และประสิทธิภาพของโซลูชั่นดังกล่าวจะสูงกว่าเช่นกัน ตัวอย่างเช่นสำหรับกล้องวิดีโอ 20 ตัวที่ดูแล การจดจำใบหน้าในห้างสรรพสินค้าขนาดเล็ก การ์ดวิดีโอ RTX 2080Ti เพียงการ์ดเดียว และซีพียู 4 core ก็เพียงพอแล้ว และที่สำคัญที่สุดคือค่าใช้จ่ายในการขยายจะน้อยลง
เมื่อเราพูดถึงโซลูชั่นขนาดใหญ่สำหรับการสตรีมมิ่งวิดีโอหลายร้อยรายการจะค่อนข้างเห็นความแตกต่างได้ชัดเจน ตัวอย่างเช่น ลองเปรียบเทียบโซลูชั่นสำหรับกล้องวิดีโอ 100 ตัวในห้างสรรพสินค้าระหว่าง GPU และ CPU ในรูปแบบของการตรวจสอบปริมาณการใช้ข้อมูล และการทำงานกับบัญชีดำ เราจดจำใบหน้าที่การติดตามยังไม่เสร็จสมบูรณ์ซึ่งนั่นหมายถึงการดำเนินการแบบเรียลไทม์ ภาพจำลองนี้เป็นสถานการณ์ที่ยากที่สุดสำหรับระบบเนื่องจากต้องใช้ความเร็วสูง และสามารถรักษาจำนวนของงานให้อยู่ในระดับคงที่ ในสถานการณ์เช่นนี้ ระบบสามารถสร้างการจดจำได้มากถึง 1,000,000 ครั้งต่อวัน และสามารถค้นหาจำนวนใบหน้าที่จดจำได้พร้อม ๆ กันได้หลายร้อยคน
เราต้องการ CPU core ประมาณ 200 core โดยแต่ละ core ต้องมีอย่างน้อย 2.8 GHz เพื่อให้มีความเร็วในการตอบสนองที่เหมาะสม เซิร์ฟเวอร์มาตรฐานที่มี Intel Xeon สองตัวบนบอร์ดมีเพียง 40 core (ไม่นับเธรด) ดังนั้น เราจึงได้ระบบที่ค่อนข้างซับซ้อนซึ่งมีเซิร์ฟเวอร์ 5 เครื่องซึ่งมีความสูงประมาณ 5 เครื่องซ้อนกัน มีการสร้างความร้อน และการใช้พลังงานที่สอดคล้องกัน และมีราคาประมาณ 70,000 ดอลลาร์ (รวมส่วนประกอบอื่น ๆ ทั้งหมด)
สำหรับสถานการณ์เดียวกัน เมื่อใช้ GPU เราจะได้เซิร์ฟเวอร์ 1 4U ที่มี 8 Tesla T4 GPU 8 ตัว และ CPU ราคาไม่แพงที่มี 8 core สำหรับทำการประมวลผลคำร้องขอ โซลูชั่นดังกล่าวจะมีราคาประมาณ 40,000 ดอลลาร์ ซึ่งมีราคาถูกกว่ามากทั้งในแง่ของราคา และการบำรุงรักษา รวมถึงการใช้พลังงาน
โซลูชั่นที่ออกแบบมาให้ทำงานบน CPU จะมีราคาสูงกว่าเนื่องจากความหนาแน่นของโปรเซสเซอร์ต่อเซิร์ฟเวอร์นั้นต่ำกว่าการ์ดวิดีโออย่างมาก การกำหนดค่าตาม GPU ทำให้ระบบมีขนาดกะทัดรัด ยืดหยุ่น และมีประสิทธิภาพมากขึ้น นั่นคือเหตุผลที่ FindFace Multi ได้รับการออกแบบให้สามารถทำงานบน GPU ได้ซึ่งจะช่วยทำให้คุณสามารถประมวลผลการสตรีมม่ิงวิดีโอได้มากขึ้น และมีต้นทุนที่ต่ำลง
คุณยังสามารถประหยัดต้นทุนได้อีกข้อหนึ่ง คือ เลือกความสามารถของซอฟต์แวร์เพื่อนำไปรวมเข้ากับโครงสร้างพื้นฐานที่มีอยู่เดิม และทำงานร่วมกันกับอุปกรณ์ที่หลากหลาย ลูกค้าจำนวนมากที่มีระบบเฝ้าระวังวิดีโอที่มีขนาดใหญ่อยู่แล้วสามารถใช้แค่เพียงการเสริมด้วยฟังก์ชันการจดจำใบหน้าเพิ่มเติมเท่านั้น ไม่ใช่ว่าผู้ให้บริการด้านระบบการจดจำทุกรายเต็มใจที่จะยอมลดคุณสมบัติของระบบเนื่องจากมันทำให้ประสิทธิภาพการจดจำลดลงอย่างเห็นได้ชัด การใช้การจดจำใบหน้ามักจะหมายถึงการอัปเกรดอุปกรณ์ทั้งหมดซึ่งมีราคาแพงกว่าการสร้างจากความจุมากกว่าในปัจจุบัน นี่ยังไม่พูดถึงเรื่องการประหยัดเงิน
ทีมพัฒนาของ NtechLab สร้างผลิตภัณฑ์ซอฟต์แวร์ที่สามารถทำงานได้บนอุปกรณ์ที่หลากหลายได้ โดยไม่มีข้อผูกพันกับผู้ผลิตฮาร์ดแวร์เซิร์ฟเวอร์ หรือกล้องที่ใช้เฉพาะด้านสำหรับการจดจำใบหน้า และดีเพียงพอที่จะจับคู่กับข้อกำหนดของฮาร์ดแวร์ และข้อกำหนดในการติดตั้งกล้อง ด้วยโครงข่ายประสาทเทียมที่สามารถตรวจจับใบหน้าของผู้คนได้อย่างมีประสิทธิภาพ เพียงแค่ 30 พิกเซลก็เพียงพอที่จะสามารถจับภาพใบหน้าได้แล้ว
เลือกซอฟต์แวร์ที่สามารถปรับขนาดได้ตามการคาดการณ์
ความสามารถในการปรับขนาดเป็นหนึ่งในลักษณะสำคัญของระบบการจดจำข้อมูลทางชีวภาพ โครงการที่เกี่ยวข้องกับการใช้ระบบดังกล่าวสามารถจำกัดให้อยู่ในกล้องเดียว หรือในเทอร์มินัลได้ หรือมีขนาดใหญ่เท่ากับ เครือข่ายกล้องที่ครอบคลุมเมืองใหญ่ทั้งหมดก็ได้ โปรดทราบว่าโครงการต่าง ๆ จะต้องคำนึงถึงการขยายขนาดได้อยู่เสมอเนื่องจากระบบต้องการความยืดหยุ่นในระดับสูง
เมื่อความต้องการของธุรกิจเติบโตขึ้น การปรับขนาดของระบบการจดจำจึงเป็นสิ่งที่หลีกเลี่ยงไม่ได้ซึ่งทำให้ลูกค้าบางรายตกอยู่ในสถานการณ์ที่จำเป็นต้องอัปเกรดระบบ และการอัปเกรดระบบนั้นมีมากมายทั้งนี้ขึ้นอยู่กับผู้ให้บริการซอฟต์แวร์เนื่องจากราคาสุดท้ายอาจไม่คงที่ ผู้จำหน่ายระบบจดจำใบหน้าหลายรายมีข้อจำกัดของซอฟต์แวร์ในการปรับขนาด ตัวอย่างเช่น เมื่อเซิร์ฟเวอร์หนึ่งไม่สามารถจัดการกับการสตรีมมิ่งวิดีโอได้เกินจำนวนที่กำหนด หรือระบบจำกัดจำนวนเซิร์ฟเวอร์ในการตรวจจับทั้งหมด สิ่งนี้นำไปสู่ความซับซ้อนอย่างมากในสถาปัตยกรรมโซลูชั่นขั้นสุดท้าย และต้นทุนจากการใช้งาน การดำเนินการ และการสนับสนุน ประสบการณ์ของเราแสดงให้เห็นว่าซอฟต์แวร์ตรวจจับที่ไม่ได้รับการปรับให้เหมาะสมเมื่อขยายขนาดออกไปแล้วอาจมีราคาสูงกว่าโซลูชั่นที่มีสถาปัตยกรรมซึ่งได้รับออกแบบมาอย่างรอบคอบ และมีการเพิ่มประสิทธิภาพในระดับสูง 2−3 เท่า
มุมมองเพิ่มเติมสำหรับระบบการจดจำในรูปแบบของความเร็วในการดึงภาพ และการเปรียบเทียบกับภาพจากฐานข้อมูลซึ่งสามารถมีขนาดได้ตั้งแต่หลายหมื่นถึงหลายพันล้านใบหน้า เมื่อมีปริมาณข้อมูลเพิ่มขึ้น โซลูชั่นที่ไม่ได้รับการปรับให้เหมาะสมจะมีความเร็วในการค้นหาที่ช้ากว่า ในขณะที่ซอฟต์แวร์เฉพาะด้านจะมีความเร็วอยู่ในระดับสูงอย่างสม่ำเสมอ ตัวอย่างเช่น FindFace Multi สามารถค้นหารูปภาพใน 0.025 วินาทีสำหรับข้อมูลบันทึกจำนวน 100,000 รายการ ในขณะที่การขนาดของเชิงเส้นในแนวนอน (การแบ่งส่วน) จะช่วยทำให้สามารถขยายขนาดเท่าไหร่าก็ได้โดยไม่สูญเสียประสิทธิภาพ
พิจารณาสถาปัตยกรรมของระบบ
โครงการขนาดใหญ่ที่ใช้การจดจำใบหน้ามักเกี่ยวข้องกับวัตถุระยะไกลจำนวนมาก ตัวอย่างเช่น หากเรากำลังพูดถึงโรงงานอุตสาหกรรมที่มีการแยก และประมวลผลทรัพยากรธรรมชาติ วัตถุสามารถอยู่ห่างจากกันเป็นกิโลเมตร และเป็นเรื่องปกติที่จะต้องมีช่องทางการสื่อสารที่มีความเร็วสูง และเชื่อถือได้สูงเพื่อสร้างการโต้ตอบกันระหว่างองค์ประกอบทั้งหมดของเครือข่าย
การส่งการสตรีมมิ่งวิดีโอจากกล้องไปยังเซิร์ฟเวอร์ประมวลผลต้องใช้ความเร็วสูง ดังนั้นจึงมีค่าใช้จ่ายสูงหากมีระยะทางไกล มีความสมเหตุสมผลหรือไม่ที่จะมีระบบรองรับกล้องได้ 30 ตัว โดยแต่ละตัวต้องการอย่างน้อย 4 Mbit/s สำหรับกล้อง HD และ 8 Mbit/s สำหรับ FullHD และรวมกันมากกว่า 120 Mbit/s และ 240 Mbit/s โดยปกติแล้ว ค่าใช้จ่ายเหล่านี้จะไม่ถูกนำมาพิจารณา ซึ่งอาจทำให้มีนทุนรวมในการเป็นเจ้าของ (TCO) เพิ่มสูงขึ้นได้ในภายหลัง ไม่ใช่นักพัฒนาซอฟต์แวร์ทุกคนที่คาดการณ์ถึงปัญหานี้ซึ่งทำให้ไม่สามารถเปลี่ยนแปลงการกำหนดค่าของระบบเพื่อตอบสนองความต้องการของลูกค้าได้
วิธีหนึ่งในการลดต้นทุนของปริมาณการรับ และการส่งข้อมูล คือ การย้ายเซิร์ฟเวอร์ประมวลผลวิดีโอล่วงหน้าไปยังตำแหน่งที่ติดตั้งกล้องโดยตรง เซิร์ฟเวอร์ในพื้นที่สามารถรับการสตรีมมิ่งวิดีโอได้โดยตรง วิเคราะห์ และส่งเฉพาะภาพที่เกี่ยวข้องไปยังเซิร์ฟเวอร์หลัก การส่งภาพต้องใช้ปริมาณการรับ และการส่งข้อมูลน้อยลงอย่างเห็นได้ชัดเจน และแม้แต่กล้อง 2−4 ตัวก็สามารถทำงานได้บนการเชื่อมต่อ 1−2 Mbit/s
แต่บางครั้งอาจได้รับบริการความเร็วไม่ถึงระดับที่ต้องการ หรืออาจมีข้อกำหนดสำหรับความเร็วในการตอบสนองซึ่งที่การเชื่อมต่อ 1−2 Mbit/วินาทีนั้นไม่ใช่ความเร็วสูงสุด หรือการเชื่อมต่อไม่เสถียร สำหรับระบบดังกล่าว คุณสามารถสร้างเครือข่ายของการติดตั้งได้เอง มีอิสระในการเลือกได้อย่างเต็มที่ และเชื่อมโยงข้อมูลให้เหมือนกันกับบนฐานข้อมูลของแฟ้มข้อมูลได้ ดังนั้น ในระบบจะมีฐานข้อมูลใบหน้าที่ได้รับการปรับปรุงล่าสุด และเชื่อมโยงข้อมูลให้เหมือนกันกับใบหน้าบนฐานข้อมูล และตอบสนองได้อย่างรวดเร็ว (เนื่องจากมีองค์ประกอบทั้งหมดอยู่ในเครื่อง) และไม่ต้องพึ่งพาความเสถียรของการเชื่อมต่ออินเทอร์เน็ต
สิ่งสำคัญคือต้องเลือก โซลูชั่น ที่มีความสามารถทำงานผสานกันได้อย่างลงตัวโดยไม่สูญเสียประสิทธิภาพ
วิธีการคำนวณต้นทุนรวมในการเป็นเจ้าของ
การคำนวณต้นทุนรวมในการเป็นเจ้าของโครงการที่ใช้ระบบการจดจำใบหน้าจะค่อนข้างมีความซับซ้อน ผู้เชี่ยวชาญที่มีประสบการณ์ในการรวมระบบเทคโนโลยีที่ใช้ในการระบุตัวตนมาแล้วหลายปีเท่านั้นจึงจะสามารถทำการคำนวณต้นทุนรวมนี้ได้ คุณสามารถติดต่อผู้เชี่ยวชาญของเราได้ตลอดเวลาเพื่อให้เราช่วยคุณเลือกผู้รวมระบบที่เหมาะสมกับคุณโดยเราจะคำนึงถึงรายละเอียดทั้งหมด และข้อผิดพลาดที่อาจเกิดขึ้น เพียงแค่คุณกรอก แบบฟอร์มติดต่อ พร้อมคำอธิบายเกี่ยวกับโครงการของคุณ จากนั้นเราจะติดต่อคุณกลับไปโดยเร็วที่สุด