وصف
قام باحثو شركة أبل ببناء نموذج هائل للذكاء الاصطناعي متعدد الوسائط وهذا من خلال القيام بتقديم ورقة بحثية تمكنهم من تحقيق قدرات متقدمة لتعليم الأنظمة الاصطناعية اللغات وتمكينها من فهمها وتحليل الصور.
وهذا بعد تصريح تيم كوك الرئيس التنفيذي قال: ” إن ميزات الذكاء الاصطناعي يمكن أن تصل في وقت لاحق من هذا العام ” وذلك حسبما جاء في منصة Gadgets 360
وأكد فريق البحث أنه جاري العمل على MM1 وهي من النماذج متعددة الوسائط والتي تحتوي على 10 مليار معلم ويلقب بـاسم “LLM متعدد الوسائط (MLLM)” ولفهم النصوص والمدخلات على الصور تم إعداد أجهزة لتشفير الصور وموصل لغة الرؤية ومكونات الهندسة المعمارية واختيارات البيانات التي تم إنشاءها لنموذج الذكاء الاصطناعي وذلك لفهم كل نص وأيضًا المدخلات القائمة على الصور.
وقد أفاد التدريب أن استعمال التسميات التوضيحية للصور ونص الصورة المتداخل وبيانات النص من الأمور الهامة لنجاح فيما وصلت له التكنولوجيا (SOTA) حسب البيانات الصادرة ورغم أن الإنجاز كبير، ولكن الورقة البحثية ليست كافية للتأكد من تضمين روبوت دردشة متعدد الوسائط ومزود بالذكاء الاصطناعي، فرغم أن الطريق مازال طويل أمام عملاق التكنولوجيا للوصول نموذج أساسي أصلي للذكاء الاصطناعي إلا أنه اتخذ خطوة كبيرة بالفعل.