ما هو نموذج اللغة؟

تعرف على نماذج اللغة وتعلم ما يجعل نماذج اللغة الكبيرة قابلة للتطبيق على تطبيقات واسعة النطاق.

سنغطي ما يلي...

ربما سمعت الكثير عن الذكاء الاصطناعي التوليدي (GenAI) ووكلاء الذكاء الاصطناعي مؤخرًا.

تستطيع هذه الأدوات الكتابة والترجمة، بل وحتى طرح الأفكار، تمامًا مثل البشر. ولكن ما الذي يجري تحت الغطاء؟ كيف يُمكن لآلة أن تقرأ هذا الكم الهائل من النصوص، ثم تُنتج استجابات تبدو، في الواقع، بشرية ؟ تخيّل آلة قرأت عددًا لا يُحصى من الكتب والمنتديات والمقالات، أي تقريبًا كل نص يُمكنك تخيّله.

ثم، باستخدام ما تعلمه، يستطيع الكتابة، والإجابة على الأسئلة، أو ترجمة المحتوى بناءً على طلبه. هذا ما يفعله نموذج اللغة الكبير (LLM): يأخذ الأنماط التي استوعبها من مجموعات بيانات ضخمة، ويُنتج استجابات شبيهة بالإنسان.

قد تتساءل: "لكن ميزة الإكمال التلقائي في هاتفي تتنبأ بالفعل بالكلمة التالية. أليس هذا هو الشيء نفسه؟" حسنًا، نعم ولا. ميزة الإكمال التلقائي هذه في الواقع مثال بسيط جدًا على نموذج اللغة (LM) قيد التطبيق.

في جوهره، نموذج اللغة هو نموذج إحصائي يتعلم احتمالية ظهور سلسلة من الكلمات في نص. يُدرَّب هذا النموذج على كمية كبيرة من بيانات النص، ويتعلم الأنماط والعلاقات داخلها. تتمثل المهمة الأساسية لنموذج اللغة في التنبؤ بما سيأتي لاحقًا، بناءً على النص السابق. قد يتنبأ بالكلمة التالية، أو الحرف التالي، أو حتى الجملة التالية.

بالإضافة إلى الإكمال التلقائي، تدعم أدوات التعلم العديد من الميزات التي قد تتفاعل معها بانتظام:

  • مدققو الإملاء: يقومون بتحديد الأخطاء الإملائية واقتراح التصحيحات لها.

  • مدقق القواعد النحوية: يقوم بتحديد الأخطاء النحوية في النص والإشارة إليها.

  • إنشاء النص: على الرغم من كونه أمرًا أساسيًا، إلا أن بعض برامج LM يمكنها إنشاء عبارات وجمل قصيرة.

  • برامج الدردشة الآلية: قد تستخدم برامج الدردشة الآلية البسيطة نموذجًا لغويًا لتوليد الجمل.

الآن، لننتقل إلى النماذج اللغوية الكبيرة (LLMs) الأكثر تطورًا. تُشبه هذه النماذج النسخة الأكبر حجمًا من نماذج اللغة الأساسية التي تحدثنا عنها. تُدرّب على مجموعات بيانات أكبر بكثير، مما يسمح لها بأداء مهام تتجاوز مجرد تخمين الكلمة التالية.

لماذا الجزء الأكبر مهم؟

إذًا، ما أهمية كلمة "كبير"؟ حسنًا، الحجم عادةً يعني شيئين:

  1. البيانات: يتم تدريب طلاب الماجستير في القانون على كمية هائلة من النصوص.

  2. المعلمات: يوجد داخل النموذج ملايين (أو مليارات) من "المقابض" القابلة للتعديل. كلما زاد عدد المقابض، زادت دقة ضبط النموذج لفهمه إخراج.

يتيح هذا لطلاب الماجستير في القانون تعلم السياق على مستوى أعمق، وفهم ليس فقط الكلمات الفردية، بل أيضًا كيفية تفاعلها نموذج المعنى. بخلاف نماذج اللغة القياسية، يمكن لطلاب الماجستير في القانون القيام بكل ما يلي وأكثر:

  • تلخيص مقالة من 10 صفحات في فقرة موجزة

  • ترجمة النص بين لغات متعددة (والقيام بذلك بشكل سياقي)

  • إنشاء محتوى جديد مثل منشورات المدونة أو القصص أو حتى مقتطفات التعليمات البرمجية

  • تحليل النص وتسليط الضوء على المشاعر أو النقاط المهمة

نماذج LLM هي النماذج التي تُشغّل معظم أنظمة الذكاء الاصطناعي الحديثة. حتى لو لم تُدرّب هذه النماذج بنفسك، يُمكنك الاستفادة من إمكانياتها من خلال:

  • واجهات برمجة التطبيقات: تتيح لك خدمات مثل OpenAI أو Groq أو غيرها إرسال المطالبات وتلقي الردود.

  • مجموعات الأدوات: تعمل الأطر (مثل LangChain) على دمج LLMs مع البيانات الخارجية أو المنطق متعدد الخطوات.

هذا إنجازٌ عظيم، إذ يعني أنه يمكنك بناء تطبيقاتٍ تفهم اللغة. يمكنك بناء أشياء مثل روبوتات الدردشة الذكية، ومساعدي الكتابة، وأدوات البحث الآلية دون الحاجة إلى إجراء حسابات الذكاء الاصطناعي المعقدة خلف الكواليس.

إذا كنت مهتمًا بمعرفة المزيد عن برامج الماجستير في القانون، فتفضل بالاطلاع على دورتنا التدريبية حول أساسيات برامج الماجستير في القانون . يمكنك حفظ الدورة لقراءتها لاحقًا!

لماذا نتحدث عن LLM أولاً؟

إذا كان حامل شهادة الماجستير في القانون أشبه بموسيقي بارع يعزف أي موسيقى، من الجاز إلى الروك، فإن لانغ تشين هو قائد الأوركسترا الذي يُنسّق العرض بأكمله. لماذا نحتاج إلى قائد أوركسترا؟ لأنه على الرغم من أن حاملي شهادة الماجستير في القانون هؤلاء مُبهرون حقًا، إلا أنهم:

  • لا يتوفر لديك الوصول تلقائيًا إلى الملفات المحلية أو بيانات الإنترنت المباشرة

  • لا تقم عادةً بتقسيم المهام المعقدة إلى خطوات أصغر دون توجيه

  • يمكنك "نسيان" ما قلته قبل بضع رسائل إذا كنت تقوم ببناء روبوت محادثة

على سبيل المثال، قد تطلب من برنامج ماجستير القانون " لخّص هذا النص " ، ثم في خطوة ثانية، "ترجم هذا الملخص إلى الفرنسية". لا يتعامل برنامج ماجستير القانون بمفرده مع هذه المهام المتسلسلة أو أي بيانات خارجية (مثل قاعدة بياناتك أو API بحث الويب للحصول على معلومات آنية). وهنا يأتي دور LangChain، حيث يُنسّق ويُحسّن قدرات برنامج ماجستير القانون ليتمكن من القيام بكل هذه المهام بسلاسة.

بعبارة أخرى، يحول LangChain موسيقاك العبقري إلى أوركسترا كاملة، مكتملة بالنوتة الموسيقية، وتنسيق الأقسام، والتناغمات، وكلها تعمل في مزامنة لخلق شيء أقوى مما يمكن لأي مؤدي منفرد إدارته بمفرده.

سنستكشف بالضبط كيف يقوم LangChain بإنجاز هذا الأمر طوال الدورة.

إلى أين نحن متجهون

الآن أنت تعرف ما هي نماذج LLM، ولماذا هي خاصة، وكيف تختلف عن نماذج اللغة الأكثر بساطة.

بعد ذلك، ستكتشف كيف يُنظّم LangChain إمكانات ماجستير إدارة الأعمال، مُتيحًا لك تقسيم المهام الكبيرة إلى أجزاء أصغر والتواصل مع البيانات الخارجية. بنهاية درسنا، ستفهم ماجستير إدارة الأعمال عمليًا وستعرف كيفية استخدامه (بمساعدة LangChain وLangGraph) بناء تطبيقات ذكية وقابلة للتطوير وممتعة قد تُذهل أصدقائك.

إليك كيفية البدء.