أقدمت شركة AheadForm الصينية المتخصصة في الروبوتات البشريّة على إطلاق منصّة «أوريجين إف 1»، بوصفها جيلاً جديداً من الوجوه الروبوتية المصمّمة للتجارب المتقدّمة في «الذكاء المتجسّد» والتفاعل الوجهي المباشر بين الإنسان والآلة. يُقدَّم «أوريجين إف 1» على أنه منصّة بحثية وهندسية مكرّسة لتطوير نماذج ذكاء اصطناعي قادرة على الوجود في هيئة فيزيائية، بدل البقاء محصورة في الشاشات والتطبيقات، مع تركيز واضح على ملامح الوجه والتعبير العاطفي الدقيق أكثر من المهام الحركية التقليدية كالتحرّك أو حمل الأغراض.
في الاستعراض الأخير للمنصّة، ظهر مؤسس الشركة يو هانغ هو، وهو يتفاعل مع «أوريجين إف 1» في محادثة حية، حيث بدا الروبوت قادراً على الحفاظ على تواصل بصري مستمر، مع حركة عينين تتبع المتحدث وتعيد تركيز النظر على وجهه، إضافة إلى رمش طبيعي متقطّع يقلّد الإيقاع البشري. الروبوت بدا كذلك قادراً على إمالة الرأس، وهزّه أحياناً في إيماءات تفهّم أو استجابة، في سياق حوار آني لا يعتمد على تسجيلات مسبقة، بل على معالجة مباشرة لما تلتقطه الكاميرات والميكروفونات المدمجة في النظام .
تستند تجربة «أوريجين إف 1» إلى نموذج «أومني» للذكاء الاصطناعي الذي تطوّره AheadForm، وهو نموذج متعدد الوسائط يدمج الرؤية والصوت واللغة في آن واحد، على خلاف أنظمة «الرؤية–النص» التقليدية. هذا الدمج يمكّن الروبوت من «رؤية» محاوره عبر العدسات، و«الاستماع» إلى نبرة صوته، و«فهم» محتوى الكلام النصّي في الوقت نفسه، ما يسمح له بتوليد ردود صوتية وتعبيرات وجهية متزامنة مع سياق الحديث، واتخاذ قرارات فورية بشأن اتجاه النظرة، وسرعة الرمش، ودرجة انقباض الحاجبين أو اتّساع الابتسامة.
على المستوى الميكانيكي، تعتمد رؤوس AheadForm على عدد كبير من المحركات الصغيرة عديمة الفُرش، يصل في بعض النماذج إلى نحو ثلاثين محرّكاً، لتوليد حركة جفون وعيون وملامح دقيقة، بما في ذلك الحركات الجانبية للعين، والاختلافات الطفيفة في شدّ عضلات الوجه التي تُنتج ما يُعرف بالـ«التعبيرات الدقيقة». هذا التركيب يُدار عبر نظام داخلي ينسّق بين البيانات البصرية والصوتية والزمنية لبناء نموذج فوري عن الحالة العاطفية للمحاوِر، ثم يختار نمط الاستجابة التعبيرية المناسبة، في محاولة لتقليل الانطباع بعدم الارتياح الذي تسبّبه عادة وجوه الروبوتات الموجودة في «المنطقة المريبة» بين الإنساني والاصطناعي.
المقاطع المتداولة عبر منصات اجتماعية متعددة تُظهر الروبوت وهو يمرّ عبر طيف واسع من الحالات الانفعالية في ثوانٍ معدودة، من شرود وتأمّل إلى غضب وفرح وارتباك وقلق ومفاجأة واحتقار وخوف، ثم تفكير وومضة إلهام وخمول واستسلام للنوم، في مشاهد تُستخدم لاختبار قدرة النظام على الانتقال السلس بين حالات وجدانية متباينة. هذه الاختبارات تهدف إلى التحقق من أن النموذج لا يكتفي بتبديل «أقنعة» جاهزة، بل ينتقل بين تعبيرات متتابعة بتموّج زمني قريب من السلوك البشري، مع بقاء التزامن بين ملامح الوجه والمحتوى الصوتي.
في السياق نفسه، تُقدَّم «أوريجين إف 1» باعتبارها حلقة جديدة ضمن مسار تعمل فيه AheadForm منذ تأسيسها في شنغهاي عام 2024 على ربط نماذج الذكاء الاصطناعي العاطفي بوجوه روبوتية عالية الواقعية، مع استثمار معلن لا يقل عن 14 مليون دولار تم تأمينه من جهات من بينها مجموعة Ant وشركة AgiBot، وفق منشورات استثمارية حديثة. الشركة تعرض «أوريجين إف ١» بوصفها منصّة مفتوحة لأبحاث «التجسيد» البشري للذكاء الاصطناعي ولنماذج التفاعل الوجداني بين الإنسان والآلة، مع مراهنة واضحة على أن القدرة على التقاط الانفعالات البشرية والردّ عليها بوجه آلي «مقنع» ستكون مفتاحاً لتوسّع سوق الروبوتات الاجتماعية والخدمية في الأعوام المقبل .
انطلاقاً من هذه العروض، يبدو أن «أوريجين إف 1» يمثّل محاولة متقدّمة لإخراج الذكاء الاصطناعي من حيّز الواجهة النصّية أو الصوتية إلى حضور وجهي ملموس، حيث تتحوّل نظرة الروبوت، ووميض العين، والتفصيل الصغير في حركة الفم أو الحاجب، إلى جزء من قناة تواصل كاملة مع الإنسان، تُختبر فيها حدود قبول المستخدمين لوجوه آلية تنافس التفاعل البشري في دقّته وشحنته العاطفية.