الذكاء الاصطناعي التوليدي
تعرف على الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة، وهي الأساس الذي تبدأ منه الهندسة السريعة.
سنغطي ما يلي...
ما هو الذكاء الاصطناعي التوليدي؟
كما ذكرنا سابقًا، الذكاء الاصطناعي التوليدي هو تقنية ذكاء اصطناعي تُولّد أنواعًا مختلفة من المحتوى الجديد، بما في ذلك النصوص والصور والمقاطع الصوتية والفيديوهات والبيانات التركيبية. وعلى عكس أنواع الذكاء الاصطناعي الأخرى التي تعتمد على البيانات الموجودة مسبقًا لاتخاذ القرارات، يتعلم الذكاء الاصطناعي التوليدي الأنماط والعلاقات في بيانات إدخال ، ويُولّد بيانات جديدة وفريدة.
يتطلب الذكاء الاصطناعي التوليدي مُحفِّزًا على نموذج نص، أو صورة، أو فيديو، أو نوتات موسيقية، من بين مُدخلات أخرى يُمكن لنظام الذكاء الاصطناعي تفسيرها. بعد ذلك، تُنتج خوارزميات ذكاء اصطناعي مُختلفة محتوى جديدًا استجابة للمُحفِّز. قد يشمل المحتوى الناتج مقالات، أو إجابات على أسئلة، أو صورًا ومقاطع فيديو وفقًا للمُحفِّز. يُنتج هذا محتوى مُعقَّدًا وواقعيًا يُحاكي الإبداع البشري. هذه الخاصية تجعله أداةً قيّمةً للعديد من القطاعات، بما في ذلك الألعاب والترفيه وتصميم المنتجات.
أنواع نماذج الذكاء الاصطناعي التوليدية
تؤدي أنواع مختلفة من نماذج الذكاء الاصطناعي التوليدي مهامًا محددة. أشهرها ما يلي:
المشفرات التلقائية المتغيرة (VAEs): هذا هو نوع من الشبكات العصبية التي تتعلم تمثيلًا مضغوطًا لبيانات إدخال ، وتسمى المساحة الكامنة، ويمكنها بعد ذلك إنشاء أمثلة جديدة عن طريق أخذ العينات من هذه المساحة الكامنة.
الشبكات التوليدية التنافسية (GANs): الشبكات التوليدية التنافسية هي نوع من الشبكات العصبية القادرة على توليد بيانات جديدة مشابهة لمجموعة بيانات معينة. تُدرّب هذه الشبكات بطريقة تنافسية، حيث تُولّد شبكة مُولّدة عينات بيانات، وتُقيّم شبكة مُميّزة العينات المُولّدة وتُحدّد ما إذا كانت حقيقية أم زائفة. تُدرّب شبكة المُولّدة لتحسين قدرتها على توليد بيانات واقعية من خلال محاولة خداع شبكة المُميّزة. كما تُدرّب على تمييز البيانات الفعلية من البيانات المُولّدة بشكل صحيح. وقد استُخدمت هذه الشبكات في تطبيقات مُختلفة، مثل توليد صور ومقاطع فيديو ومقاطع صوتية واقعية.
المحولات: شبكة عصبية تُستخدم على نطاق واسع في مهام معالجة اللغة الطبيعية، مثل ترجمة اللغة وتوليد النصوص. تعتمد المحولات على آليات التركيز الذاتي لتعلم العلاقات السياقية بين الكلمات في تسلسل نصي. وهي أسرع تدريبًا ويمكن مقارنتها بسهولة.
نماذج الانحدار الذاتي: نموذج توليدي يُولّد بيانات جديدة مشابهة في توزيعها لبيانات التدريب. تُعدّ نماذج الانحدار الذاتي مناسبةً بشكل خاص لتوليد بيانات متسلسلة، مثل السلاسل الزمنية أو النصوص، حيث تعتمد كل قيمة جديدة على القيم السابقة. وقد استُخدمت هذه النماذج في تطبيقات مُختلفة، بما في ذلك تركيب الكلام، ومعالجة اللغة الطبيعية، وتوليد الموسيقى.
نماذج اللغة الكبيرة
نماذج اللغة الكبيرة، أو LLMs ، هي نوع من نماذج التعلم الآلي القادرة على توليد نصوص بلغة طبيعية بجودة وسلاسة مذهلتين. تُدرّب هذه النماذج على مجموعات بيانات نصية ضخمة باستخدام بنى الشبكات العصبية العميقة، مثل المحولات، ويمكنها تعلم التنبؤ بتوزيع احتمالات الكلمات في تسلسل نصي.
صُممت نماذج معالجة اللغة الطبيعية (LLMs) لتكون مرنة للغاية، ويمكن ضبطها لأداء مهام مثل ترجمة اللغات، وتلخيص النصوص، والإجابة على الأسئلة، والتحليل، والاستنتاج، من خلال تعديل معلمات النموذج وتدريبه على بيانات خاصة بكل مهمة. هذه المرونة تجعل نماذج معالجة اللغة الطبيعية (LLMs) أداة متعددة الاستخدامات لمختلف تطبيقات معالجة اللغة الطبيعية.
هناك نوعان رئيسيان من برامج الماجستير في القانون - برامج الماجستير في القانون الأساسية وبرامج الماجستير في القانون المعدلة.
ماجستير القانون الأساسي
نماذج معالجة اللغة الطبيعية الأساسية (LLMs) هي نسخ أصغر وأبسط من نماذج معالجة اللغة الطبيعية. تحتوي هذه النماذج على معلمات أقل، مما يجعلها فعالة في التدريب والاستخدام. تُستخدم عادةً لمهام معالجة اللغة الطبيعية الأصغر، مثل تحليل المشاعر، والتنبؤ بالنصوص، وتصنيف النصوص.
على سبيل المثال، يمكن استخدام برنامج LLM الأساسي الذي تم تدريبه على مجموعة كبيرة من المقالات الإخبارية للتنبؤ باحتمالية ظهور كلمات أو عبارات معينة في مقال إخباري حول موضوع معين استنادًا إلى سياق النص المحيط.
هنا، يمكننا أن نرى مثالاً واحدًا لكيفية استخدام LLM الأساسي:
ماجستير في القانون مُحسّن
تشير نماذج اللغة المُحسّنة إلى نماذج لغوية كبيرة مبنية على نموذج لغة أساسي، ومُحسّنة أكثر بإضافة مُدخلات ومُخرجات تُمثّل تعليمات واستجابات مُفضّلة لها. تُحسّن هذه النماذج بشكل أكبر باستخدام عملية التعلم المُعزّز بالتغذية الراجعة البشرية (RLHF)، حيث يُختبر ويُصحّح البشر الاستجابات لضمان موثوقيتها.
فيما يلي مثال لكيفية قدرة طلاب الماجستير في القانون المتميزين على الرد على الأسئلة وتقديم الإجابات:
أمثلة على أدوات ونماذج الذكاء الاصطناعي التوليدية
ظهرت مؤخرًا العديد من نماذج الذكاء الاصطناعي، وتزداد شعبيتها. لنلقِ نظرة على بعض الأمثلة:
جي بي تي-3
GPT-3 (المحول التوليدي المُدرَّب مسبقًا 3) هو نموذج ذكاء اصطناعي لمعالجة اللغات، طورته OpenAI، قادر على توليد نصوص معقدة للغاية. يتطلب هذا النموذج كمية صغيرة من المدخلات لإنتاج استجابات مفيدة وذات صلة. يحتوي GPT-3 على 175 مليار مُعامل، مما يجعله أحد أكبر وأقوى نماذج اللغات التي تم إنشاؤها على الإطلاق. له تطبيقات واسعة، بما في ذلك إكمال النصوص، والتلخيص، والترجمة، والإجابة على الأسئلة، وغيرها.
تشات جي بي تي
ChatGPT هو برنامج ماجستير في القانون من تطوير OpenAI. يعتمد على بنية GPT، ويمكنه توليد استجابات معقدة لمجموعة واسعة من المطالبات، بما في ذلك المطالبات النصية والأسئلة والأوامر. صُمم ChatGPT ليكون ذكاءً اصطناعيًا حواريًا، قادراً على التفاعل مع المستخدمين حول مواضيع متنوعة، ويُستخدم عادةً في برامج الدردشة الآلية والمساعدين الافتراضيين وتطبيقات معالجة اللغة الطبيعية الأخرى.
دال⋅إي
نموذج ذكاء اصطناعي توليدي من تطوير OpenAI ، قادر على إنشاء صور من أوصاف نصية. يعتمد على بنية GPT-3. يعتمد DALL على المطالبات النصية. يستطيع برنامج E توليد مجموعة واسعة من الصور، بما في ذلك الأشياء والحيوانات والمشاهد والمفاهيم المجردة. وقد اكتسب هذا النموذج شهرةً لقدرته على توليد صورٍ عالية التفاصيل ومبتكرة، يمكن استخدامها لأغراضٍ متعددة، بما في ذلك المشاريع الإبداعية والتصميم والتسويق.
الذكاء الاصطناعي في منتصف الرحلة
ميدجورني هو نموذج ذكاء اصطناعي مُولِّد طوّره مختبر أبحاث مستقل. يهدف هذا النموذج إلى تحويل الخيال إلى فن. يتميز هذا النموذج بأسلوب فني حالم، ويجذب المستخدمين المهتمين بموضوعات الفانتازيا والقوطية والخيال العلمي.
الانتشار المستقر
الانتشار المستقر، من ابتكار الذكاء الاصطناعي، هو نموذج انتشار نصي إلى صورة. يُولّد صورًا واقعية بناءً على أوصاف نصية. يسمح بتعديل الصور الموجودة عن طريق إزالة أو إضافة تفاصيل جديدة.