أعلن فريق “Qwen” التابع لشركة علي بابا الصينية يوم الاثنين عن إطلاق عائلة جديدة من نماذج الذكاء الاصطناعي تحت اسم “Qwen2.5-VL”، والتي تتمتع بقدرة على أداء مجموعة من المهام المتقدمة، مثل التحكم في الهواتف والحواسيب. وتضم هذه العائلة نماذج قادرة على تحليل النصوص والصور والملفات، وفهم مقاطع الفيديو، والرد على الأسئلة المتعلقة بها.
ووفقًا لفريق “Qwen”، فإن أفضل نموذج في هذه العائلة، وهو “Qwen2.5-VL”، يتفوق في مجموعة من التقييمات مقارنة بنماذج أخرى مثل “GPT-4o” من “OpenAI” و”Gemini 2.0 Flash” من “غوغل”، خاصة في مجالات مثل فهم الفيديو، الرياضيات، تحليل المستندات، والإجابة على الأسئلة.
النموذج “Qwen2.5-VL” متاح حاليًا للاختبار عبر تطبيق “Qwen Cha” التابع لشركة علي بابا، ويمكن أيضًا تنزيله من منصة “Hugging Face” لتطوير الذكاء الاصطناعي، وفقًا لتقرير نشره موقع “TechCrunch”. من بين الميزات المثيرة لهذا النموذج قدرته على تحليل الرسوم البيانية واستخراج البيانات من صور الفواتير، بالإضافة إلى “فهم” مقاطع الفيديو الطويلة التي تصل إلى عدة ساعات.
إحدى الميزات الفريدة لـ”Qwen2.5-VL” هي قدرته على التفاعل مع التطبيقات على الأجهزة المحمولة وأجهزة الكمبيوتر. على سبيل المثال، يمكن للنموذج فتح تطبيق “Booking” على هاتف أندرويد وحجز رحلة عبره. كما أظهر مقطع فيديو أن النموذج قادر على التحكم في التطبيقات على سطح مكتب الكمبيوتر، على الرغم من أنه لم يظهر إلا في مهام بسيطة مثل التبديل بين علامات التبويب.
تضم عائلة “Qwen2.5-VL” أيضًا نماذج أصغر وأقل تطورًا مثل “Qwen2.5-VL-3B” و”Qwen2.5-VL-7B”. ويعد فريق “Qwen” من أبرز المنافسين المحليين لمختبر الذكاء الاصطناعي الصيني “DeepSeek”، الذي جذب انتباه صناعة التكنولوجيا هذا الأسبوع.



