التطورات في رؤية الكمبيوتر تدفع استقلالية النقل

الرؤية هي مدخلات حسية بشرية قوية. إنها تمكن المهام والعمليات المعقدة التي نأخذها كأمر مسلم به. مع زيادة AoT ™ (استقلالية الأشياء) في تطبيقات متنوعة تتراوح من النقل والزراعة إلى الروبوتات والطب ، أصبح دور الكاميرات والحوسبة والتعلم الآلي في توفير رؤية وإدراك شبيهة بالإنسان مهمًا. انطلقت رؤية الكمبيوتر كنظام أكاديمي في الستينيات ، وبشكل أساسي في الجامعات العاملة في مجال الذكاء الاصطناعي (AI) والتعلم الآلي الناشئ. لقد تقدم بشكل كبير في العقود الأربعة التالية حيث تم إحراز تقدم كبير في تقنيات الحوسبة وأشباه الموصلات. أدت التطورات الحديثة في التعلم العميق والذكاء الاصطناعي إلى تسريع تطبيق رؤية الكمبيوتر لتوفير تصور في الوقت الفعلي ، وانخفاض زمن الوصول وإدراك البيئة ، مما يتيح الاستقلالية والسلامة والكفاءة في مختلف التطبيقات. النقل هو أحد المجالات التي استفادت بشكل كبير.

LiDAR (اكتشاف الضوء وتحديد المدى) هو أسلوب تصوير بصري نشط يستخدم الليزر لتحديد البيئة ثلاثية الأبعاد حول كائن ما. إنها إحدى التقنيات التي تحاول حلول الرؤية الحاسوبية (التي تعتمد فقط على الضوء المحيط ولا تستخدم الليزر للإدراك ثلاثي الأبعاد) تعطيلها. الموضوع الشائع هو أن السائقين البشريين لا يحتاجون إلى LiDAR لإدراك العمق ، لذلك لا ينبغي للآلات أيضًا. ميزات القيادة الذاتية التجارية الحالية L3 (استقلالية كاملة في مناطق جغرافية وظروف مناخية محددة ، مع استعداد السائق لتولي السيطرة في غضون ثوانٍ) منتجات اليوم استخدم LiDAR. لا تزال التقنيات القائمة على الرؤية البحتة غير قادرة على تقديم هذه القدرة تجاريًا.

إعلان

تسلاTSLA
هو مؤيد مهيمن لاستخدام رؤية الكمبيوتر القائمة على الكاميرا السلبية لتوفير استقلالية مركبة الركاب. خلال حدث AI الأخير للشركة ، قدم Elon Musk ومهندسيه عرضًا تقديميًا مثيرًا للإعجاب من قدراتها في مجال الذكاء الاصطناعي وإدارة البيانات والحوسبة التي تدعم ، من بين مبادرات أخرى ، ميزة القيادة الذاتية الكاملة (FSD) في طرازات تسلا المتعددة. تتطلب FSD أن يشارك السائق البشري في مهمة القيادة في جميع الأوقات (وهو ما يتوافق مع استقلالية L2). حاليًا ، يتوفر هذا الخيار على 160,000 سيارة تم شراؤها من قبل العملاء في الولايات المتحدة وكندا. توفر مجموعة من 8 كاميرات في كل مركبة خريطة إشغال 360 درجة. تُستخدم بيانات الكاميرا (وغيرها) من هذه المركبات لتدريب شبكتها العصبية (التي تستخدم الملصقات التلقائية) للتعرف على الأشياء ، ورسم مسارات المركبات المحتملة ، واختيار أفضلها وتفعيل إجراءات التحكم المناسبة. حدثت 75 ألف تحديث للشبكة العصبية على مدار الاثني عشر شهرًا الماضية (تحديث واحد تقريبًا كل 12 دقائق) حيث يتم جمع البيانات الجديدة باستمرار واكتشاف أخطاء التوسيم أو أخطاء المناورة. تنفذ الشبكة المدربة إجراءات التخطيط والتحكم من خلال بنية فائضة على متن الطائرة للإلكترونيات الحاسوبية المصممة لهذا الغرض. تتوقع Tesla أن تؤدي FSD في النهاية إلى مركبات مستقلة (AVs) ، والتي توفر استقلالية كاملة في بعض مجالات التصميم التشغيلي دون الحاجة إلى مشاركة السائق البشري (يشار إليها أيضًا باسم L1 autonomy).

شركات أخرى مثل Phiar و Helm.ai و NODAR يتابعون أيضًا طريق رؤية الكمبيوتر. يهدف NODAR إلى توسيع نطاق التصوير والإدراك ثلاثي الأبعاد لأنظمة الكاميرا الاستريو بشكل كبير من خلال تعلم كيفية ضبط اختلال الكاميرا وتأثيرات الاهتزاز من خلال خوارزميات التعلم الآلي الحاصلة على براءة اختراع. لقد جمعت مؤخرًا 12 مليون دولار لإنتاج منتجها الرئيسي ، Hammerhead ™ ، الذي يستخدم الكاميرات "الجاهزة" من فئة السيارات ومنصات الحوسبة القياسية.

بصرف النظر عن التكلفة والحجم ، هناك حجة متكررة ضد استخدام LiDAR وهي أن نطاقه ودقته محدودة مقارنة بالكاميرات. على سبيل المثال ، تتوفر اليوم أجهزة LiDAR بمدى 200 متر و 5-10 M نقطة / ثانية (PPS أقرب إلى الدقة). عند ارتفاع 200 متر ، ستسجل العوائق الصغيرة مثل الطوب أو حطام الإطارات عددًا قليلاً جدًا من النقاط (ربما 2-3 في الاتجاه الرأسي و3-5 في الاتجاه الأفقي) ، مما يجعل التعرف على الأشياء أمرًا صعبًا. تصبح الأشياء أكثر خشونة في النطاقات الأطول. وبالمقارنة ، يمكن للكاميرات القياسية ذات الدقة الميجابكسل التي تعمل بسرعة 30 هرتز أن تولد 30 ميجا بكسل / ثانية ، مما يتيح التعرف الفائق على الأشياء حتى في النطاقات الطويلة. يمكن للكاميرات الأكثر تقدمًا (12 ميجا بكسل) زيادة هذا بشكل أكبر. تكمن المشكلة في كيفية استخدام هذه البيانات الضخمة وإنتاج تصور عملي مع زمن انتقال بمستوى ميلي ثانية واستهلاك منخفض للطاقة وظروف إضاءة متدهورة.

إعلان


التعرف، شركة مقرها كاليفورنيا ، تحاول حل هذه المشكلة. وفقًا للمدير التنفيذي مارك بوليثو ، تتمثل مهمتها في "تقديم تصور بصري فوق طاقة البشر للمركبات ذاتية القيادة. " تأسست الشركة في عام 2017 ، وجمعت 75 مليون دولار حتى الآن ولديها 70 موظفًا. RK Anand ، أحد خريجي Juniper Networks ، هو أحد المؤسسين المشاركين ورئيس قسم المنتجات. إنه يعتقد أن استخدام الكاميرات عالية الدقة ، مع نطاق ديناميكي يزيد عن 120 ديسيبل ، تعمل بمعدلات إطارات عالية (على سبيل المثال ، OnSemi و Sony و Omnivision) يوفر البيانات المطلوبة لإنشاء معلومات ثلاثية الأبعاد عالية الدقة ، وهو أمر بالغ الأهمية لتحقيق AVs. العوامل المساعدة على ذلك هي:

  1. ASICs المصممة خصيصًا لمعالجة البيانات بكفاءة وإنتاج خرائط ثلاثية الأبعاد دقيقة وعالية الدقة لبيئة السيارة. تم تصنيعها باستخدام عملية TSMC 3 نانومتر ، بحجم رقاقة 7 مم² ، تعمل بتردد 100 جيجاهرتز.
  2. خوارزميات التعلم الآلي الخاصة لمعالجة الملايين من نقاط البيانات في وضع عدم الاتصال لإنشاء الشبكة العصبية المدربة ، والتي يمكنها بعد ذلك العمل بكفاءة والتعلم باستمرار. توفر هذه الشبكة الإدراك وتشمل تصنيف الكائنات وكشفها والتجزئة الدلالية واكتشاف الممرات وإشارات المرور والتعرف على إشارات المرور
  3. تقليل عمليات التخزين خارج الشريحة وعمليات الضرب التي تتطلب طاقة مكثفة وتؤدي إلى زمن انتقال عالٍ. تم تحسين تصميم التعرف على ASIC للرياضيات اللوغاريتمية وإضافة الاستخدامات. يتم تحقيق المزيد من الكفاءات من خلال تجميع الأوزان على النحو الأمثل في الشبكة العصبية المدربة.

أثناء مرحلة التدريب ، يتم استخدام LiDAR التجاري كحقيقة أساسية لتدريب بيانات كاميرا ستيريو عالية الدقة وذات نطاق ديناميكي عالي لاستخراج معلومات العمق وجعلها قوية ضد تأثيرات المحاذاة والاهتزاز. وفقًا للسيد أناند ، فإن تطبيق التعلم الآلي الخاص بهم فعال للغاية بحيث يمكنه استقراء تقديرات العمق التي تتجاوز نطاقات التدريب التي توفرها معايرة LiDAR (التي توفر الحقيقة الأساسية لنطاق 100 متر).

إعلان

تم إجراء بيانات التدريب أعلاه في النهار باستخدام زوج استريو من كاميرات بدقة 8.3 ميجابكسل تعمل بمعدلات إطارات 30 هرتز (حوالي 0.5 مليار بكسل في الثانية). يوضح قدرة الشبكة المدربة على استخراج معلومات ثلاثية الأبعاد في المشهد الذي يتجاوز نطاق 3 متر الذي تم تدريبه به. يمكن أن يقوم حل Recogni أيضًا باستقراء تعلمه باستخدام بيانات النهار إلى الأداء الليلي (الشكل 100).

إعلان

وفقًا للسيد أناند ، فإن بيانات النطاق دقيقة في حدود 5٪ (في نطاقات طويلة) وقريبة من 2٪ (في نطاقات أقصر). يوفر الحل 1000 TOPS (تريليون عملية في الثانية) مع زمن انتقال 6 مللي ثانية واستهلاك طاقة 25 واط (40 TOPS / W) ، مما يجعل الصناعة رائدة. المنافسون الذين يستخدمون الرياضيات الصحيحة هم> 10 مرات أقل في هذا المقياس. يتم حاليًا اختبار حل Recogni لدى العديد من موردي السيارات من المستوى 1.

تنبأ ("توقع ورؤية مكان الإجراء")، ومقرها في فرنسا ، تستخدم الكاميرات القائمة على الأحداث للمركبات وأنظمة مساعدة السائق المتقدمة (ADAS) والأتمتة الصناعية وتطبيقات المستهلك والرعاية الصحية. تأسست في عام 2014 ، و أغلقت الشركة مؤخرًا تمويلها الدائري C بقيمة 50 مليون دولار، بإجمالي 127 مليون دولار تم جمعها حتى الآن. Xiaomi ، الشركة الرائدة في مجال الهواتف المحمولة ، هي واحدة من المستثمرين. هدف Prophesee هو محاكاة الرؤية البشرية التي تتفاعل فيها المستقبلات في شبكية العين مع المعلومات الديناميكية. يركز الدماغ البشري على معالجة التغييرات في المشهد (خاصة للقيادة). الفكرة الأساسية هي استخدام معماريات الكاميرا والبكسل التي تكتشف التغييرات في شدة الضوء فوق عتبة (حدث) وتوفر هذه البيانات فقط إلى مكدس الحوسبة لمزيد من المعالجة. تعمل البيكسلات بشكل غير متزامن (غير مؤطرة كما هو الحال في كاميرات CMOS العادية) وبسرعات أعلى بكثير حيث لا يتعين عليها دمج الفوتونات كما هو الحال في الكاميرا التقليدية القائمة على الإطار والانتظار حتى ينتهي الإطار بأكمله قبل قراءة البيانات. المزايا كبيرة - عرض نطاق ترددي أقل للبيانات وزمن انتقال القرار والتخزين واستهلاك الطاقة. يتميز أول مستشعر رؤية VGA قائم على الأحداث من الدرجة التجارية للشركة بنطاق ديناميكي عالٍ (> 120 ديسيبل) ، واستهلاك منخفض للطاقة (26 ميجاوات على مستوى المستشعر أو 3 nW / حدث). كما تم إطلاق إصدار HD (عالي الوضوح) (تم تطويره بالاشتراك مع Sony) ، بحجم بكسل رائد في الصناعة (<5 ميكرومتر).

إعلان

تشكل هذه المستشعرات جوهر منصة الاستشعار Metavision® ، والتي تستخدم الذكاء الاصطناعي لتوفير تصور ذكي وفعال لتطبيقات الاستقلالية وهي قيد التقييم من قبل العديد من الشركات في مجال النقل. بصرف النظر عن التصور المواجه للأمام لـ AVs و ADAS ، تعمل Prophesee بنشاط مع العملاء لمراقبة السائق داخل المقصورة لتطبيقات L2 و L3 ، انظر الشكل 4:

فرص السيارات مربحة ، لكن دورات التصميم طويلة. على مدار العامين الماضيين ، شهد Prophesee اهتمامًا وجذبًا كبيرًا في مساحة رؤية الماكينة للتطبيقات الصناعية. وهي تشمل العد عالي السرعة وفحص السطح ومراقبة الاهتزازات.

إعلان

أعلن Prophesee مؤخرًا عن التعاون مع كبار المطورين لأنظمة الرؤية الآلية لاستغلال الفرص في الأتمتة الصناعية والروبوتات والسيارات وإنترنت الأشياء (إنترنت الأشياء). الفرص الفورية الأخرى هي تصحيح ضبابية الصورة للهواتف المحمولة وتطبيقات AR / VR. هذه تستخدم مستشعرات تنسيق أقل من تلك المستخدمة لفرص ADAS / AV طويلة المدى ، وتستهلك طاقة أقل ، وتعمل بزمن انتقال أقل بشكل ملحوظ.


تعتبر إسرائيل من رواد الابتكار في مجال التكنولوجيا المتقدمة ، مع استثمارات كبيرة في المشاريع وبيئة ناشئة نشطة. منذ عام 2015 ، تم تنفيذ حوالي 70 مليار دولار من الاستثمارات التي يقودها المشروع في قطاع التكنولوجيا. جزء من هذا في مجال رؤية الكمبيوتر. قادت Mobileye هذه الثورة في عام 1999 عندما أسس أمنون شاشوا ، الباحث الرائد في مجال الذكاء الاصطناعي في الجامعة العبرية ، الشركة للتركيز على التصور المستند إلى الكاميرا لـ ADAS و AVs. تقدمت الشركة بطلب للاكتتاب العام في عام 2014 واستحوذت عليها شركة إنتلINTC
في عام 2017 مقابل 15 مليار دولار. اليوم ، أصبح بسهولة اللاعب الرائد في مجال رؤية الكمبيوتر ومجال AV ومؤخرًا أعلنت نيتها تقديم طلب للاكتتاب العام وتصبح كيانًا مستقلًا. حققت Mobileye عائدات بلغت 1.4 مليار دولار في السنة وخسائر متواضعة (75 مليون دولار). يوفر إمكانات رؤية الكمبيوتر لـ 50 من مصنعي المعدات الأصلية للسيارات الذين ينشرونها عبر 800 طراز من السيارات لإمكانيات ADAS. في المستقبل ، يعتزمون القيادة في استقلالية السيارة L4 (بدون الحاجة إلى سائق) باستخدام خبرة رؤية الكمبيوتر وقدرات LiDAR القائمة على منصة Intel الضوئية للسيليكون. يقدر تقييم Mobileye بحوالي 50 مليار دولار عندما يتم طرحها للجمهور في النهاية.

إعلان

تشامبل كابيتال، ومقرها في القدس ، في طليعة الاستثمار في الشركات التي تطور منتجات تعتمد على رؤية الكمبيوتر لتطبيقات متنوعة من النقل والزراعة إلى الأمن والسلامة. أمير ويتمان هو مؤسس مشارك وشريك إداري ، وقد أسس شركته في عام 2017. استثمر الصندوق الأول 20 مليون دولار في 14 شركة. كان أحد استثماراتهم في Innoviz ، والتي تم طرحها للاكتتاب العام من خلال اندماج SPAC في عام 2018 وأصبحت LiDAR يونيكورن. بقيادة عمر قيلاف (الذي ينحدر من وحدة التكنولوجيا في سلاح المخابرات في جيش الدفاع الإسرائيلي) ، تعتبر الشركة اليوم رائدة في عمليات نشر LiDAR لـ ADAS و AVs ، مع العديد من الانتصارات في التصميم في BMW و Volkswagen.

بدأ صندوق Champel Capital الثاني (Impact Deep Tech Fund II) في يناير 2022 وجمع 30 مليون دولار حتى الآن (الهدف هو 100 مليون دولار بنهاية عام 2022). ينصب التركيز المهيمن على رؤية الكمبيوتر ، مع نشر 12 مليون دولار في خمس شركات. ثلاثة من هؤلاء يستخدمون الرؤية الحاسوبية للنقل والروبوتات.

TankU ، مقرها في حيفا ، بدأت عملياتها في عام 2018 وجمعت تمويلًا قدره 10 ملايين دولار. دان فالدهورن هو الرئيس التنفيذي وتخرج من الوحدة 8200 ، وهي مجموعة النخبة عالية التقنية داخل جيش الدفاع الإسرائيلي والمسؤولة عن استخبارات الإشارات وفك تشفير الرموز. تعمل منتجات SaaS (البرمجيات كخدمة) من TankU على أتمتة وتأمين العمليات في البيئات الخارجية المعقدة التي تخدم المركبات والسائقين. يتم استخدام هذه المنتجات من قبل مالكي أساطيل المركبات والسيارات الخاصة ومحطات الوقود والشحن الكهربائي لمنع السرقة والاحتيال في المعاملات المالية الآلية. تولد خدمات وقود المركبات حوالي 2 تريليون دولار من الإيرادات العالمية سنويًا ، يستهلك أصحاب أسطول المركبات الخاصة والتجارية منها 40٪ أو 800 مليار دولار. يخسر تجار التجزئة ومالكو الأساطيل حوالي 100 مليار دولار سنويًا بسبب السرقة والاحتيال (على سبيل المثال ، استخدام بطاقة وقود الأسطول للمركبات الخاصة غير المصرح بها). يعد الاحتيال في CNP (البطاقة غير موجودة) والتلاعب / سرقة الوقود مصادر إضافية للخسارة ، لا سيما عند استخدام تفاصيل البطاقة المسروقة في تطبيقات الأجهزة المحمولة للدفع.

إعلان

يسهل منتج TUfuel الخاص بالشركة الدفع الآمن بنقرة واحدة ، ويمنع معظم أنواع الاحتيال وينبه العملاء عندما يشتبه في حدوث احتيال. يقوم بذلك بناءً على محرك ذكاء اصطناعي مدرب على بيانات من CCTVs الموجودة في هذه المرافق وبيانات المعاملات الرقمية (بما في ذلك نقاط البيع وغيرها من البيانات الخلفية). تُعد بعض السمات التي يتم مراقبتها للكشف عن الاحتيال ، معلمات مثل مسار السيارة وديناميكياتها ومعرف السيارة ووقت الرحلة والمسافة المقطوعة ووقت التزود بالوقود وكمية الوقود وسجل الوقود وسلوك السائق. تساعد هذه البيانات أيضًا تجار التجزئة على تحسين تشغيل الموقع ، وتعزيز ولاء العملاء ، ونشر أدوات التسويق القائمة على الرؤية. وفقًا للمدير التنفيذي دان فالدهورن ، يكتشف حلهم 70٪ من الأسطول و 90٪ من بطاقات الائتمان و 70٪ من أحداث الاحتيال المتعلقة بالتلاعب.

سونول هي شركة خدمات طاقة تمتلك وتدير شبكة من 240 محطة ومتجرًا صغيرًا في جميع أنحاء إسرائيل. تم نشر TUfuel في مواقعهم وقد أظهر أمانًا محسنًا ومنع الاحتيال وولاء العملاء. تجري تجارب المنتجات في الولايات المتحدة بالتعاون مع مورد عالمي رائد لمحطات الوقود ومعدات المتاجر. مبادرات مماثلة جارية أيضا في أفريقيا وأوروبا.

إعلان

مقرها تل أبيب مركز التجارة الدولية تأسست في 2019 من قبل أكاديميين التعلم الآلي من جامعة بن غوريون. تقوم ITC بإنشاء منتجات SaaS التي "قم بقياس تدفق حركة المرور وتوقع الازدحام وقم بتخفيفه من خلال التلاعب الذكي بإشارات المرور - قبل أن تبدأ الاختناقات في التكون." على غرار TankU ، يستخدم البيانات من الكاميرات الجاهزة (المثبتة بالفعل في العديد من تقاطعات المرور) للحصول على بيانات حركة المرور الحية. يتم تحليل البيانات من آلاف الكاميرات في جميع أنحاء المدينة ، ويتم استخراج المعلمات مثل نوع السيارة والسرعة واتجاه الحركة وتسلسل أنواع المركبات (الشاحنات مقابل السيارات) من خلال تطبيق خوارزميات الذكاء الاصطناعي الخاصة. تتنبأ المحاكاة بتدفق حركة المرور وحالات الازدحام المروري المحتملة حتى 30 دقيقة مقدمًا. يتم ضبط إشارات المرور باستخدام هذه النتائج لتسهيل تدفق حركة المرور ومنع الاختناقات.

يستغرق تدريب نظام الذكاء الاصطناعي شهرًا واحدًا من البيانات المرئية عبر مدينة نموذجية ويتضمن مزيجًا من التعلم الخاضع للإشراف وغير الخاضع للإشراف. تم نشر حل ITC بالفعل في تل أبيب (احتلت المرتبة 25 في أكثر مدن العالم ازدحامًا في عام 2020) ، مع نشر آلاف الكاميرات في مئات التقاطعات التي تسيطر عليها إشارات المرور. يدير نظام ITC حاليًا 75 ألف مركبة ، والتي من المتوقع أن تستمر في النمو. تقوم الشركة بتثبيت ملف قدرة مماثلة في لوكسمبورغ وتبدأ التجارب في المدن الأمريكية الكبرى. على الصعيد العالمي ، يدير حلها 300,000 مركبة مع مواقع تشغيل في إسرائيل والولايات المتحدة الأمريكية والبرازيل وأستراليا. Dvir Kenig ، كبير موظفي التكنولوجيا ، متحمس لحل هذه المشكلة - لإعطاء الناس وقتًا شخصيًا ، وتقليل غازات الاحتباس الحراري ، وتعزيز الإنتاجية الإجمالية ، والأهم من ذلك ، تقليل الحوادث عند التقاطعات المزدحمة. وفقا للسيد كينيغ ، "تُظهر عمليات النشر لدينا انخفاضًا بنسبة 30٪ في الاختناقات المرورية ، وتقليل وقت القيادة غير المنتج ، والإجهاد ، واستهلاك الوقود ، والتلوث."

إعلان

الروبوتات الداخلية وكان تأسست في 2018 و مؤخرا جمع 18 ملايين دولار في التمويل. تقوم الشركة ، التي يقع مقرها بالقرب من تل أبيب بإسرائيل ، بتطوير وبيع حلول الطائرات بدون طيار المستقلة للأمن الداخلي والسلامة ومراقبة الصيانة. يتمتع الرئيس التنفيذي والمؤسس المشارك ، دورون بن دافيد ، بخبرة كبيرة في مجال الروبوتات والطيران تراكمت في IAIIAI
(مقاول رئيسي دفاعي) و MAFAT (منظمة بحثية متقدمة داخل وزارة الدفاع الإسرائيلية) ، والتي تشبه DARPA في الولايات المتحدة. تزيد الاستثمارات المتزايدة في المباني الذكية وأسواق الأمن التجاري من الحاجة إلى أنظمة مستقلة يمكنها استخدام رؤية الكمبيوتر والمدخلات الحسية الأخرى في المساحات التجارية الداخلية الصغيرة والكبيرة (المكاتب ومراكز البيانات والمستودعات ومساحات البيع بالتجزئة). تستهدف الروبوتات الداخلية هذا السوق باستخدام طائرات بدون طيار داخلية مزودة بكاميرات جاهزة ومستشعرات نطاق حراري وأشعة تحت الحمراء.

أوفير بار ليفاف هو مدير الأعمال. ويوضح أن عدم وجود نظام تحديد المواقع العالمي (GPS) قد أعاق الطائرات بدون طيار في الأماكن المغلقة من تحديد مواقعها داخل المباني (عادةً ما يكون نظام تحديد المواقع العالمي محظورًا أو غير دقيق). بالإضافة إلى ذلك ، كانت حلول الإرساء والتشغيل المريحة والفعالة غير متوفرة. تعالج الروبوتات الداخلية هذا الأمر من خلال أربع كاميرات محمولة بطائرات بدون طيار (أعلى ، وأسفل ، ويسار ، ويمين) وأجهزة استشعار نطاق بسيطة ترسم بدقة مساحة داخلية ومحتوياتها. يتم تحليل بيانات الكاميرا (توفر الكاميرات بيانات التوطين ورسم الخرائط) وأجهزة الاستشعار الحرارية (المثبتة أيضًا على الطائرة بدون طيار) بواسطة نظام AI للكشف عن مشكلات الأمان والسلامة والصيانة المحتملة وتحذير العميل. تقوم الطائرات بدون طيار بتشغيل نفسها من خلال "بلاط إرساء" مثبت في السقف ، مما يوفر مساحة أرضية قيمة ويسمح بجمع البيانات أثناء الشحن. تتضح المزايا المالية لأتمتة هذه العمليات العادية حيث يكون العمل البشري معقدًا ومكلفًا من حيث التوظيف والاحتفاظ والتدريب. إن استخدام الطائرات بدون طيار مقابل الروبوتات الأرضية له أيضًا مزايا كبيرة من حيث تكاليف رأس المال والتشغيل ، واستخدام أفضل لمساحة الأرضية ، وحرية الحركة دون مواجهة عقبات وكفاءة التقاط بيانات الكاميرا. وفقًا للسيد بار ليفاف ، سيبلغ إجمالي السوق القابل للعنونة (TAM) في أنظمة الأمان الذكية الداخلية 80 مليار دولار أمريكي بحلول عام 2026. وتشمل مواقع العملاء الرئيسية اليوم المستودعات ومراكز البيانات ومكاتب الشركات العالمية الرائدة.

إعلان


تُحدث رؤية الكمبيوتر ثورة في لعبة الاستقلالية - في أتمتة الحركة والأمن ومراقبة المباني الذكية والكشف عن الاحتيال وإدارة حركة المرور. قوة أشباه الموصلات والذكاء الاصطناعي هي عوامل تمكين قوية. بمجرد أن تتقن أجهزة الكمبيوتر هذه الطريقة الحسية المذهلة بطريقة قابلة للتطوير ، فإن الاحتمالات لا حصر لها.

المصدر: https://www.forbes.com/sites/sabbirrangwala/2022/10/04/advances-in-computer-vision-propel-transportation-autonomy/