كشفت شركة Meta النقاب عن نموذج لغة الذكاء الإصطناعي الأكثر تقدمًا حتى الآن، Llama 3.1 405B، الذي يضم 405 مليار معلمة وقدرات تنافس النماذج الرائدة الخاصة.
يمثل هذا الإصدار علامة بارزة في تطوير الذكاء الإصطناعي مفتوح المصدر، حيث تدعي ميتا أن الأداء يضاهي أو يفوق نماذج OpenAI و Anthropic عبر معايير مختلفة.
نظرة على Llama 3.1 405B
تم الكشف عن نموذج Llama 3.1 405B باعتباره مشروع الذكاء الاصطناعي الأكثر طموحًا لشركة Meta حتى الآن، ويمثل قفزة كبيرة في قدرات نماذج اللغة مفتوحة المصدر.
يتميز هذا النموذج الضخم، الذي تم تدريبه على أكثر من 15 تريليون رمز باستخدام 16000 وحدة معالجة رسوميات NVIDIA H100، بنافذة سياق رمزية تبلغ 128 ألف رمز أي زيادة بمقدار 16 ضعفًا عن سابقه.
تم تصميمه لمنافسة النماذج الخاصة، وهو يتفوق في الدعم متعدد اللغات عبر ثماني لغات، بما في ذلك الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية.
يتضمن الإصدار أيضًا إصدارات محدثة من نماذج المعلمات 8B و70B، والتي تتميز جميعها بقدرات استدلال محسنة ودعم موسع متعدد اللغات.
مميزات Llama 3.1 405B
يتميز نموذج 405B بأحدث الإمكانيات، ويتفوق في المعرفة العامة، وإنشاء النصوص الطويلة، والترجمة متعددة اللغات، والترميز، والرياضيات، والتفكير المتقدم.
إقرأ أيضا:حقيقة تنبؤ مسلسل سمبسون بمرض جدري القرود FactCheckإنه يوضح الأداء المحسن في استخدام الأداة والفهم السياقي المعزز مقارنة بأسلافه.
تشير المعايير إلى أن Llama 3.1 405B يتفوق على GPT-4o في العديد من المجالات، بما في ذلك اختبارات GSM8K وHellaswag، بينما يتأخر قليلاً في HumanEval و MMLU-social.
تضع هذه التطورات النموذج كأداة قوية لتوليد البيانات الاصطناعية وتقطير النماذج، مما يفتح آفاقًا جديدة للبحث والتطوير في مجال الذكاء الاصطناعي.
التدريب والتوافر
يتطلب تدريب نموذج المعلمة 405B الضخم موارد حسابية كبيرة، وذلك باستخدام أكثر من 16000 وحدة معالجة رسومات NVIDIA H100 لمعالجة أكثر من 15 تريليون رمز مميز.
النموذج، إلى جانب متغيراته الأصغر 8B و70B، متاح الآن للتنزيل على Hugging Face ومن خلال شركاء السحابة بما في ذلك AWS وAzure و Google Cloud.
يمكن للمطورين أيضًا تجربة النماذج من خلال برنامج الدردشة الآلي الخاص بـ Meta’s AI أو عن طريق الوصول إليها مباشرةً من خلال الأنظمة الأساسية المتوفرة.
الترخيص والنقاش مفتوح المصدر
على الرغم من وصف ميتا لها بأنها “مفتوحة المصدر”، إلا أن شروط الترخيص لـ Llama 3.1 405B أثارت جدلاً داخل مجتمع الذكاء الاصطناعي. أشار ستيفانو مافولي، المدير التنفيذي لمبادرة المصدر المفتوح (OSI)، إلى أن ترخيص النموذج لا يزال يحتوي على قيود ويفتقر إلى الشفافية فيما يتعلق بمجموعات بيانات التدريب والتعليمات، مما يجعل استخدامه محفوفًا بالمخاطر بالنسبة للمطورين.
إقرأ أيضا:كيفية تحويل مدونات Tumblr إلى ووردبريس والغاية من ذلكوأشار محلل الصناعة ستيفن أوجرادي إلى أن الترخيص يحظر الاستخدام من قبل بعض الشركات الكبيرة، وهو ما يتعارض مع المبادئ الحقيقية للمصادر المفتوحة.
على الرغم من هذه المخاوف، أكد مارك زوكربيرغ، الرئيس التنفيذي لشركة Meta، على أهمية تطوير الذكاء الإصطناعي مفتوح المصدر، ووضعه كمسار للأمام للابتكار والمنافسة في مشهد الذكاء الاصطناعي.
ماذا يعني حظر Reddit من بينج ومحركات البحث التي لا تدفع؟
كيف تواجه آبل استراتيجية مايكروسوفت في الذكاء الإصطناعي؟
كل شيء عن نموذج Claude 3.5 Sonnet الأفضل من GPT-4o
مقارنة الذكاء الإصطناعي بين Galaxy AI و Apple Intelligence
لماذا تتسابق شركات الذكاء الإصطناعي مثل جوجل نحو ريديت؟
دمج الذكاء الاصطناعي في جوجل: هل يقلص زيارات المواقع الإلكترونية؟