مع انتشار الأتمتة ، يتحرك الاستشعار بشكل متزايد بعيدًا عن LiDAR.
بالطبع ، من الخطأ التوصيف الحديث عن "رؤية" الروبوتات ، أو على الأقل اختصار مختزل لتفاعل معقد بين البرامج والأجهزة التي تسمح للروبوتات بالقيام باستشعار أكثر تعقيدًا بمعدات أقل تكلفة بكثير. تتضمن رؤية الآلة مجموعة متنوعة من التقنيات وتعتمد بشكل متزايد على البرامج في شكل التعلم الآلي والذكاء الاصطناعي لتفسير ومعالجة البيانات من أجهزة الاستشعار ثنائية الأبعاد التي لم يكن من الممكن تحقيقها حتى منذ وقت قصير.
مع هذا الاعتماد المتزايد على البرامج ، يأتي تحول مثير للاهتمام بعيدًا عن المستشعرات عالية التخصص مثل LiDAR ، والتي تعتبر لفترة طويلة عنصرًا أساسيًا للروبوتات التي تعمل في بيئات شبه منظمة وغير منظمة. يكتشف خبراء الروبوتات الذين يتزوجون العلاقة بين البشر وبرامج الذكاء الاصطناعي أن LiDAR ليس ضروريًا في الواقع. بدلاً من ذلك ، توفر رؤية الماكينة خرائط عالية الجودة بتكلفة معقولة ، لا سيما عندما يتعلق الأمر بالروبوتات الداخلية والأتمتة.
لمعرفة المزيد حول التحول الجاري ، تواصلت مع Rand Voorhies ، كبير التكنولوجيا والمؤسس المشارك في inVia Robotics ، حول رؤية الماكينة ، ومستقبل الأتمتة ، وما إذا كان LiDAR لا يزال مستشعرًا أساسيًا للروبوتات في السنوات القادمة.
GN: من أين جاءت التطورات في رؤية الآلة أو المستشعرات أو البرامج؟
راند فورهيس: في حين أن مستشعرات التصوير ثنائية الأبعاد قد شهدت بالفعل تحسنًا مستمرًا ، إلا أن الدقة / الضوضاء / الجودة نادرًا ما كانت عاملاً مقيدًا للتبني الواسع النطاق لرؤية الآلة. على الرغم من وجود العديد من التحسينات المثيرة للاهتمام على المستشعرات في العقد الماضي (مثل مصفوفات مستشعرات الاستقطاب وكاميرات المجال الضوئي / الكاميرات ذات المجال الضوئي) ، لم يكتسب أي منها قوة الجر حقًا ، لأن نقاط القوة الرئيسية لأجهزة استشعار الرؤية الآلية هي تكلفتها ووجودها في كل مكان. لقد كان التقدم الرائد حقًا على طول واجهة البرنامج من خلال ظهور التعلم العميق. تبدو نماذج رؤية آلة التعلم العميق الحديثة مثل السحر مقارنة بالتكنولوجيا منذ عشر سنوات. يمكن لأي مراهق لديه وحدة معالجة الرسومات (GPU) الآن تنزيل وتشغيل مكتبات التعرف على الكائنات التي كانت ستفجر أفضل مختبرات البحث قبل عشر سنوات.
بينما تتحسن رؤية الماكينة المتطورة على قدم وساق ، ساهمت عوامل أخرى أيضًا في تبني تقنيات رؤية الماكينة أبسط. أدى التطور المستمر لتقنية البطارية والمحرك إلى خفض تكاليف المكونات إلى النقطة التي يمكن فيها إنتاج أنظمة روبوتية توفر عائد استثمار قويًا جدًا للمستخدم النهائي. بالنظر إلى عائد استثمار جيد ، يسعد العملاء (في حالتنا ، مشغلو المستودعات) بتعليق بيئتهم بملصقات "إيمانية". تشبه هذه الملصقات تقريبًا رمز الغش للروبوتات ، حيث يمكن لحلول رؤية الماكينة الرخيصة جدًا اكتشاف موضع واتجاه الملصق الإيماني بدقة فائقة. من خلال لصق هذه المعلومات الائتمانية في جميع أنحاء المستودع ، يمكن للروبوتات بسهولة إنشاء خريطة تسمح لها بتحديد مواقعها.
GN: هل يمكنك إعطاء سياق صغير عن اعتماد LiDAR؟ لماذا أصبحت أداة استشعار موحدة في تطبيقات التنقل المستقل؟ ما هي العقبات المبكرة أمام رؤية الآلة التي قادت المطورين إلى استخدام LiDAR؟
راند فورهيس: تم استخدام الرؤية الآلية لتوجيه الروبوتات منذ ما قبل وجود LiDAR. بدأ LiDAR في اكتساب شعبية كبيرة في أوائل العقد الأول من القرن الحادي والعشرين بسبب بعض الأبحاث الأكاديمية الرائدة من سيباستيان ثرون ودافني كولر ومايكل مونتيميرلو وبن ويجبرايت وآخرين جعل معالجة البيانات من هذه المستشعرات أمرًا ممكنًا. أدى هذا البحث والخبرة إلى هيمنة مركبة ستانلي المستقلة التي تتخذ من LiDAR مقراً لها في تحدي DARPA Grand Challenge (بقيادة Thrun) ، فضلاً عن تأسيس Velodyne (بواسطة David Hall ، أحد المشاركين في Grand Challenge) ، والذي ينتج الكثير. اعتبر الآن أنه جهاز استشعار السيارة المستقل بحكم الواقع. أظهر التحدي أن LiDAR كانت أخيرًا تقنية قابلة للتطبيق للروبوتات سريعة الحركة للتنقل عبر بيئات غير معروفة وفوضى بسرعات عالية. منذ ذلك الحين، كانت هناك زيادة كبيرة في الاهتمام الأكاديمي بتحسين الخوارزميات لمعالجة بيانات مستشعر LiDAR ، وقد تم نشر مئات الأوراق البحثية ودراسات الدكتوراه حول هذا الموضوع. نتيجة لذلك ، يتدفق الخريجون إلى الفضاء التجاري بأكوام من خبرة LiDAR الأكاديمية تحت حزامهم ، وعلى استعداد لوضع النظرية موضع التنفيذ.
في كثير من الحالات ، أثبت LiDAR أنه الأداة المناسبة جدًا للوظيفة. لطالما كانت السحابة النقطية ثلاثية الأبعاد الكثيفة حلم علماء الروبوتات ويمكن أن تجعل تجنب العوائق واكتشاف المسارات أسهل بشكل كبير ، لا سيما في البيئات الديناميكية غير المعروفة. ومع ذلك ، في بعض السياقات ، لا يعد LiDAR ببساطة الأداة المناسبة للوظيفة ويمكن أن يضيف تعقيدًا ونفقات غير ضرورية لحل بسيط بخلاف ذلك. تحديد متى يكون LiDAR على حق ومتى لا يكون هو المفتاح لبناء حلول آلية لا تعمل فقط - فهي توفر أيضًا عائد استثمار إيجابيًا للعميل.
في الوقت نفسه ، تقدمت رؤية الآلة أيضًا. يمكن فهم إحدى العقبات المبكرة في رؤية الآلة بسؤال بسيط: "هل أنظر إلى جسم كبير بعيد أو جسم صغير قريب"؟ مع الرؤية التقليدية ثنائية الأبعاد ، لم يكن هناك ببساطة طريقة للتمييز. حتى أدمغتنا يمكن أن تنخدع ، كما يظهر في أوهام منظور بيت المرح. تستخدم الأساليب الحديثة للرؤية الآلية مجموعة واسعة من الأساليب للتغلب على هذا ، بما في ذلك:
تقدير مسافة شيء ما من خلال فهم السياق الأكبر للمشهد ، على سبيل المثال ، أعلم أن كاميرتي تبعد 2 متر عن الأرض ، وأنا أفهم أن إطارات السيارة تبلغ 1000 بكسل على طول الشارع ، لذا يجب أن تكون على بعد 25 مترًا.
بناء فهم ثلاثي الأبعاد للمشهد باستخدام اثنين أو أكثر من الكاميرات المتداخلة (مثل الرؤية المجسمة).
بناء فهم ثلاثي الأبعاد للمشهد من خلال "الشعور" بكيفية تحرك الكاميرا ، على سبيل المثال ، باستخدام IMU (وحدة قياس بالقصور الذاتي - نوعًا ما مثل الأذن الداخلية للروبوت) وربط تلك الحركات بالصور المتغيرة من الكاميرا.
تستخدم أدمغتنا جميع هذه التقنيات الثلاثة في تناسق لمنحنا فهمًا ثريًا للعالم من حولنا يتجاوز مجرد بناء نموذج ثلاثي الأبعاد.
GN: لماذا توجد حالة تكنولوجية أفضل للرؤية الآلية على LiDAR للعديد من تطبيقات الروبوتات؟
Rand Voorhies: يعتبر LiDAR مناسبًا تمامًا للتطبيقات الخارجية حيث يوجد الكثير من الأشياء المجهولة والتضارب في التضاريس. لهذا السبب هي أفضل تقنية للسيارات ذاتية القيادة. في البيئات الداخلية ، تجعل رؤية الآلة الحالة التكنولوجية الأفضل. نظرًا لأن الفوتونات الضوئية ترتد عن الأشياء داخل المستودع ، يمكن بسهولة الخلط بين الروبوتات تحت توجيه LiDAR. لديهم صعوبة في التمييز ، على سبيل المثال ، صندوق المخزون من رف المخزون - كلاهما مجرد أشياء بالنسبة لهم. عندما تكون الروبوتات في أعماق ممرات المستودعات الكبيرة ، فإنها غالبًا ما تضيع لأنها لا تستطيع التمييز بين معالمها. ثم يجب إعادة تعيينهم.
من خلال استخدام الرؤية الآلية جنبًا إلى جنب مع العلامات الإيمانية ، تعرف روبوتات inVia Picker الخاصة بنا مكانها بالضبط في أي وقت. يمكنهم "رؤية" معالمهم والتمييز بينها. تتطلب جميع المستودعات / الروبوتات الصناعية القائمة على LiDAR تقريبًا بعض العلامات الإيمانية للعمل. تتطلب الروبوتات القائمة على الرؤية الآلية المزيد من العلامات. يتطلب هذا الأخير وقتًا إضافيًا وتكلفة إضافية لنشر لفات طويلة من الملصقات مقابل عدد أقل من الملصقات الفردية ، ولكن عندما تضع في الاعتبار الوقت والتكلفة لأداء رسم خرائط LiDAR المنتظم ، فإن التوازن يتأرجح كثيرًا لصالح الرؤية الصافية. في نهاية اليوم ، تكون رؤية الآلة ثنائية الأبعاد في إعدادات المستودعات أرخص وأسهل وأكثر موثوقية من LiDAR.
إذا كان استخدامك للروبوتات لا يتطلب دقة وموثوقية عالية جدًا ، فقد يكون LiDAR كافيًا. ومع ذلك ، بالنسبة للأنظمة التي لا يمكنها تحمل أي خسارة في الدقة أو الجهوزية ، يمكن لأنظمة رؤية الماكينة حقًا إظهار نقاط قوتها. تسمح أنظمة رؤية الماكينة المستندة إلى Fiducial للمشغلين بوضع العلامات بالضبط حيث تكون الدقة مطلوبة. مع نظام inVia الذي يقوم بانتقاء الحقائب ووضعها بعيدًا عن الأرفف ، فإن وضع تلك العلامات على الحقائب ويوفر الأرفف دقة على مستوى المليمتر لضمان وضع كل حقيبة في المكان الذي من المفترض أن تذهب إليه بالضبط دون أن تفشل. إن محاولة تحقيق ذلك باستخدام نظام LiDAR الخالص ستكون باهظة التكلفة والوقت للاستخدام التجاري.
GN: لماذا توجد دراسة جدوى أفضل؟
راند فورهيس: من ناحية الأعمال ، القضية بسيطة أيضًا. توفر رؤية الآلة المال والوقت. بينما انخفضت تكلفة تقنية LiDAR على مر السنين ، إلا أنها لا تزال باهظة الثمن. نحن ملتزمون بإيجاد أكثر التقنيات والمكونات فعالية من حيث التكلفة لروبوتاتنا من أجل جعل الأتمتة في متناول الشركات من أي حجم. في inVia ، نحن مدفوعون بروح جعل التكنولوجيا المعقدة بسيطة.
يعد الاختلاف في الوقت المستغرق للوفاء بالطلبات باستخدام رؤية الماكينة مقابل LiDAR وجميع متطلبات إعادة رسم الخرائط أمرًا بالغ الأهمية. يمكن أن يعني الاختلاف في الحصول على طلب للعميل في الوقت المحدد أو بعد يوم واحد. كل روبوت يتم فقده بسبب إعادة تعيين LiDAR يقلل من عائد الاستثمار لهذا النظام.
الأجهزة نفسها أرخص أيضًا عند استخدام رؤية الآلة. تعد الكاميرات أرخص من LiDAR ، وتحتاج معظم أنظمة LiDAR إلى كاميرات مزودة بوحدات مؤمنة على أي حال. مع رؤية الماكينة ، هناك تكلفة عمالة إضافية لمرة واحدة لتطبيق الإيمان. ومع ذلك ، فإن تطبيق fiducials مرة واحدة على الحقائب / الأرفف رخيص للغاية من ناحية العمالة وينتج عنه نظام أكثر قوة مع وقت تعطل وأخطاء أقل.
GN: كيف ستغير رؤية الآلة المشهد فيما يتعلق باعتماد الروبوتات في قطاعات مثل الخدمات اللوجستية والإنجاز؟
Rand Voorhies: تحقق Machine Vision بالفعل تأثيرًا في مراكز الخدمات اللوجستية والتنفيذ من خلال أتمتة المهام عن ظهر قلب لزيادة إنتاجية العمالة. يمكن للمستودعات التي تستخدم الروبوتات لتنفيذ الطلبات أن تكمل قوة عاملة نادرة وتسمح لموظفيها بإدارة المهام ذات الترتيب الأعلى التي تنطوي على اتخاذ القرار وحل المشكلات. تتيح رؤية الماكينة لأساطيل الروبوتات المتنقلة التنقل في المستودع وأداء المهام الرئيسية مثل الانتقاء والتجديد وتحركات المخزون وإدارة المخزون. يفعلون ذلك دون انقطاع وبدقة دقة الماكينة.
يؤدي استخدام أنظمة الروبوتات المدفوعة برؤية الآلة أيضًا إلى إزالة الحواجز التي تحول دون اعتمادها بسبب قدرتها على تحمل التكاليف. الشركات الصغيرة والمتوسطة الحجم التي كان يتم تسعيرها من السوق للأتمتة التقليدية قادرة على جني نفس الفوائد من أتمتة المهام المتكررة ، وبالتالي تنمية أعمالها.
GN: كيف يجب أن تقوم المستودعات بمسح مشهد تقنيات الروبوتات لأنها تتطلع إلى اعتماد أنظمة جديدة؟
راند فورهيس: هناك الكثير من الحلول الروبوتية في السوق الآن ، وكل منها يستخدم تقنية متقدمة جدًا لحل مشكلة معينة يواجهها مشغلو المستودعات. لذا ، فإن أهم خطوة هي تحديد التحدي الأكبر الذي تواجهه وإيجاد الحل الذي يحله.
على سبيل المثال ، في موقع inVia ، أنشأنا حلاً يعالج مشكلة فريدة من نوعها لتحقيق التجارة الإلكترونية على وجه التحديد. يتطلب استيفاء طلبات التجارة الإلكترونية وصولاً عشوائيًا إلى عدد كبير من رموز التخزين التعريفية المختلفة في الأعداد الفردية. هذا يختلف تمامًا عن تلبية التجزئة ، حيث تقوم باسترداد كميات كبيرة من SKU وشحنها في علب و / أو منصات نقالة. تتطلب العمليتان إعدادات وخطط تخزين واسترجاع مختلفة تمامًا. لقد أنشأنا خوارزميات خاصة تُنشئ على وجه التحديد مسارات وعمليات أسرع لاسترداد وحدات التخزين التي يتم الوصول إليها عشوائيًا.
التجارة الإلكترونية هي أيضًا أكثر اعتمادًا على العمالة وتستغرق وقتًا طويلاً ، وبالتالي فهي مكلفة. لذلك ، ترغب هذه المستودعات في اعتماد تقنيات الروبوتات التي يمكن أن تساعدها في تقليل تكلفة العمالة ، بالإضافة إلى الوقت الذي يستغرقه إخراج الطلبات إلى العملاء. لديهم اتفاقيات مستوى الخدمة SLAs (اتفاقيات مستوى الخدمة) التي تملي وقت الحاجة إلى انتقاء الطلبات وتعبئتها وشحنها. إنهم بحاجة إلى أن يسألوا البائعين كيف يمكن لتقنيتهم أن تساعدهم في التخلص من الكتل للوفاء باتفاقيات مستوى الخدمة هذه.