Facial recognition video analytics is evolving. Trends in 2022

تحليلات الفيديو هي برمجيات تعتمد على الذكاء الاصطناعي، تكتشف الوجوه والأجسام الأخرى في بث الفيديو وتتعرف عليها وتستخرج أنواعًا مختلفة من البيانات منه. وتبلغ قيمة السوق العالمية لتحليلات الفيديو حاليًا 5.9 مليار دولار، ومن المتوقع أن تصل إلى 14.9 مليار دولار بحلول عام 2026، وفقًا لتقرير MarketsandMarkets [1].

لا تقتصر على الأمن

لم تعد أنظمة المراقبة بالفيديو مجرد أداة أمنية. فالآن تشمل حالات الاستخدام الجديدة تضمين تقنيات تحليلات الفيديو في المنازل الذكية أو المصانع الذكية أو الموانئ البحرية الذكية أو المدن الذكية لخلق بيئة مريحة وآمنة للجميع، بما في ذلك الأشخاص ذوي الإعاقة.

على سبيل المثال، إذا تعثر شخص وسقط، ثم استلقى ساكنًا في الشارع، فإن أنظمتنا تتعرف على هذه الحالة وترسل تنبيهًا للجهات المعنية. وفي مثال آخر، تجمع كاميرات المدينة بيانات حركة المرور وتستخدم هذه المعلومات لتحديد مناطق الخطر المحتملة.

على سبيل المثال، يمكنك تحديد الموقع الذي كثيرًا ما يعبر منه تلاميذ المدارس في الطريق، ثم تضع قواطع السرعة أو جزر الأمان لتقليل احتمالية وقوع الحوادث. وفي هذه الحالة، التعرف على الوجوه ليس ضروريًا، حيث أن اكتشاف الصور الظليلة يكون كافيًا.

الخوارزميات تتطور إلى منتجات

في بدايات الرؤية الحاسوبية، كان المطورون يبنون خوارزميات تحليلات الفيديو في البيئات الأكاديمية باستخدام بيانات اصطناعية لتعليم الخوارزميات وبرمجتها بشكل أساسي. ولقد تم تنفيذ ذلك في فراغ، لتقييم ما إذا كانت التكنولوجيا تعمل بشكل مفهوم. وكما هو الحال في جميع مجالات المعالجة الحاسوبية، قطعنا شوطًا طويلاً منذ ذلك الحين. واليوم، يُركز تطوير تحليلات الفيديو على الاستخدام العملي فحسب. على سبيل المثال، تنشئ الشركات خوارزميات مصممة لحل تحديات الحياة الواقعية ثم تُصدر البرمجيات في صورة منتج جاهز للاستخدام. ومن الأمثلة الجيدة على ذلك الخدمة الذاتية لتسجيل المغادرة التي تسمح للعملاء بإجراء المدفوعات بناءً على التعرف على الوجوه.

في الوقت الحالي، أصبح تحويل الخوارزميات إلى منتجات أمرًا منتشرًا في كل مكان، بدءً من القياسات الحيوية للتعرف على المركبات وتحليل الصور الطبية وأكثر من ذلك. وفي الوقت الحالي، حتى الباحثين الأكاديميين يستخدمون بيانات حقيقية لتعليم الخوارزميات التي يعملون عليها، مع التركيز على الاستخدام العملي.

مفهوم المنتج متعدد الوظائف (منتج الكل في واحد)

في البداية، كان تطوير خوارزميات تحليلات الفيديو واستخدامها يتم بمعزل عن غيرها من الخوارزميات. ولم يكن التعرف على الوجوه والسيارات والاستجابة للحوادث متاحًا إلا في تطبيقات منفصلة. ومع ذلك، يعمل المطورون اليوم على دمج العديد من الخوارزميات في حزمة متعددة الوظائف مع تحليلات مترابطة. وهذا لصالح المستخدمين لأن هذا التأثير التآزري يتيح حالات استخدام جديدة لم يكن من الممكن تحقيقها في السابق.

واليوم، عادةً ما تتضمن أطقم التطبيقات التعرف على الوجوه والصور الظليلة والسيارات والأجسام الأخرى. كما أن التعرف على الأفعال البشرية سيأتي قريبًا. ويمكن للمستخدمين إدارة جميع أنواع “الأجسام” من واجهة مستخدم واحدة، كما تلتقط نفس الكاميرات جميع بيانات الجسم.

الاستخدام الأمثل للموارد

من بين خوارزميات تحليلات الفيديو الحالية، يوجد العديد من الخوارزميات التي تعمل بشكل جيد ولكنها تتطلب كميات كبيرة من موارد المعالجة الحاسوبية. ومن الواضح أن هذا لا يناسب جميع المستخدمين؛ ونتيجة لذلك يعد الاستخدام الأمثل للموارد أمرًا بالغ الأهمية. ومثال على ذلك، أن أجهزة نشر تحليلات الفيديو الكبيرة تتطلب استثمارات كبيرة.

ولهذا، يعمل المطورون على تحسين الخوارزميات لتحقيق التشغيل السريع على الأجهزة المتوسطة لمساعدة العملاء على توفير التكاليف. فكلما كانت الخوارزمية أقل تطلبًا للموارد، تتزايد قدرة العملاء على تحمل تكاليف تقنية تحليلات الفيديو.

كما تتزايد متطلبات سهولة استخدام منصات تحليلات الفيديو الجديدة هذه. وقد أدى ذلك إلى تطوير أنظمة تكاد تكون قابلة للتوصيل والتشغيل مباشرةً. ولم يعد المستخدمون بحاجة إلى قضاء الوقت واستهلاك الموارد في تهيئة الأنظمة، حيث يمكنهم ببساطة فتح صندوق المنتج والضغط على بعض الأزرار، ليكون النظام جاهز للعمل.

التنبؤ بالاعتداءات حاليًا يكاد يكون مستحيلاً

في حين أن المناطق الحضرية الرئيسية أصبحت أكثر أمانًا للعيش فيها بشكلٍ عام، سواء كانت نيويورك [2] أو موسكو [3]، إلا أننا نتذكر وقوع بعض حوادث العنف المسلح الملفتة للنظر عام 2021، سواء في شوارع المدينة أو داخل أسوار المؤسسات التعليمية.

تسبب هجوم على مدرسة في قازان وجامعة في بيرم في سقوط عشرات القتلى والجرحى. مما أدى إلى زيادة الاهتمام بالبرمجيات التي يمكنها اكتشاف الأسلحة والسلوك العدواني، بالإضافة إلى البرمجيات التي يمكنها أيضًا التنبؤ بالاعتداءات.

وفي الوقت الحالي، من الممكن بالفعل استخدام تحليلات الفيديو للتعرف على الأسلحة والأعمال الخطيرة، مثل الشجارات والأشخاص الذين يسقطون في الشارع. ونتوقع تشغيل هذه البرمجيات في سياق العالم الواقعي، وبمستويات عالية من الدقة، في وقت مبكر من العام المقبل.

ومع ذلك، لا يستطيع الذكاء الاصطناعي حتى الآن التنبؤ بالاعتداءات، على الأقل عن طريق تحليل الفيديو. فعلى الرغم من وجود هذه الخوارزميات التنبؤية بالفعل؛ إلا أنها في مراحل التطوير الأولية. ولا يُمكن استخدامها في الحياة الواقعية في الوقت الحالي بسبب العدد الكبير من النتائج الإيجابية الخاطئة.

المصادر:

1) www.marketsandmarkets.com/Market-Reports/intelligent-video-analytics-market-778.html
2) www.nytimes.com/2021/03/16/upshot/murder-rate-usa.html
3) www.tass.ru/obschestvo/8984151