كيف تتطور الهندسة السريعة
تعرف على كيفية تطور الهندسة السريعة من مجرد استكمال نص إلى تخصص رسمي وكيفية دمجها في سير عمل تطوير الذكاء الاصطناعي المهني.
في درسنا السابق، عرّفنا هندسة الاستجابة الفورية بأنها تخصص منهجي. ومع ذلك، فإن هذا التخصص ليس جامدًا، بل هو مجال في حركة دائمة، يتطور بسرعة تواكب سرعة تطور نماذج اللغة التي يسعى لتوجيهها. إن فهم كيفية تطور هندسة الاستجابة الفورية - واتجاهها - يساعد على وضع التقنيات المستخدمة اليوم في سياقها الصحيح.
لنبدأ بمقارنة عصرين مختلفين من تفاعل الذكاء الاصطناعي. لنتأمل نموذج ذكاء اصطناعي من بضع سنوات فقط. غالبًا ما كان الحصول على استجابة مفيدة أشبه بلعبة حظ، تتطلب مدخلات ذات صياغة غريبة وقليلًا من الحظ. الآن، لننظر إلى الذكاء الاصطناعي الحديث. يمكننا إعطاؤه أمرًا مباشرًا، وغالبًا ما يتبعه بدقة مذهلة.
ما الذي تغير؟ ما هي اللحظة المحورية التي حوّلت تفاعلنا مع الذكاء الاصطناعي من فنّ غريب يعتمد على الهمس الفوري إلى تخصص موثوق في هندسة الاستجابة الفورية؟ سنستكشف مفتاح التحوّلات التقنية والاستراتيجية التي شكّلت هذا المجال، ونرى كيف تتلاءم هندسة الاستجابة الفورية مع سير عمل التطوير المهني، ونستشرف الاتجاهات الناشئة التي تُحدّد مستقبلها.
ثورة ضبط التعليمات
نتج تحولٌ كبير في هندسة التوجيه عن تغييرات في كيفية تدريب النماذج، وليس عن إدخال تقنيات توجيه جديدة. وقد أدخل هذا التغيير مرحلتين في تصميم النماذج: التنبؤ بالكلمة التالية، ومن ثم ضبط التعليمات.
عصر التنبؤ بالكلمة التالية
كانت أولى نماذج اللغات الكبيرة القوية بحق، مثل GPT-2 وGPT-3 الأصلي، محركاتٍ رائعةً لإكمال النصوص. كان هدفها الرئيسي هو التنبؤ بالكلمة التالية الأكثر منطقيةً بناءً على تسلسل نصي. لم تفهم هذه النماذج الأوامر أو المقصد من كلمات المستخدم.
كان توجيه هذه النماذج فنًا لعرض نمط عليها لإكماله. ولجعل النموذج يُجري ترجمة، لم يكن بإمكان المهندس ببساطة طلب ترجمة. بل كان عليه تنسيق التوجيه كقائمة أمثلة، مع ترك المثال الأخير فارغًا ليكمله النموذج:
Prompt: English: sea otter French: loutre de mer English: platypus French: ornithorynque English: cheese French: |
النموذج، الذي يتعرف على نمط الكلمة الإنجليزية: [كلمة] متبوعة بالفرنسية: [ترجمة]، يتوقع أن يكون خيار "فروماج" هو الخيار الأكثر احتمالًا إحصائيًا. لم يكن الأمر اتباعًا لأمر، بل كان ببساطة إكمالًا لنمط مألوف. هذا هو جوهر التعلم في السياق.
التحول إلى ضبط التعليمات
وصلت الثورة مع تقنية تُسمى ضبط التعليمات . بدأ الباحثون والمهندسون في مختبرات مثل OpenAI وGoogle بضبط نماذجهم الأساسية بدقة على مجموعات بيانات ضخمة مُنسقة تتكون من(instruction, desired_output) على سبيل المثال، قد تحتوي مجموعة البيانات على ملايين الأمثلة مثل:
التعليمات: "ترجمة الجملة 'مرحبا بالعالم' إلى اللغة الفرنسية."
إخراج المطلوب: "مرحبًا، لوموند".
من خلال التدريب على هذه الأزواج، تعلمت نماذج مثل InstructGPT وFlan من جوجل المفهوم المجرد لاتباع أمر . تعلمت هذه النماذج تمييز التعليمات كنوع مُميز من إدخال يتطلب إخراج مُطابقًا مُحددًا، بدلاً من مُجرد سلسلة أخرى من الكلمات لإكمالها. وقد تم تحسينها بشكل أكبر باستخدام أساليب مُواءمة التغذية الراجعة البشرية، مثل التعلم المُعزز من التغذية الراجعة البشرية (RLHF)، والتي عززت السلوك الصحيح لاتباع التعليمات. كان هذا الابتكار نقطة تحول. فقد عنى أنه لم يعد على المهندسين خداع النموذج لإنتاج الإجابة الصحيحة. بل يُمكنهم ببساطة طلبها. باستخدام مثال الترجمة الخاص بنا، يتحول المُطالب من مهمة إكمال نمط إلى أمر مُباشر.
Prompt: Translate the word 'cheese' from English to French. |
هذا التحول هو سبب وجود أفضل الممارسات الحديثة التي نعتمد عليها اليوم. فاستراتيجية كتابة تعليمات واضحة ومحددة هي نتيجة مباشرة لتدريب النماذج على اتباعها.
الهندسة السريعة في سير عمل تطوير الذكاء الاصطناعي الحديث
مع ازدياد موثوقية التوجيه، أصبح الآن جزءًا لا يتجزأ من سير عمل تطوير البرمجيات القياسي. فهو ليس مجرد مهمة لمرة واحدة، بل عملية مستمرة ذات مراحل مميزة. يقدم سير العمل هذا إجابة على السؤال المحوري: كيف تنسجم هندسة التوجيه مع تطوير الذكاء الاصطناعي الأوسع؟
المرحلة 1: النمذجة السريعة
قبل كتابة سطر واحد من شيفرة الإنتاج، تتيح الهندسة السريعة إنشاء نماذج أولية بسرعة فائقة. باستخدام بيئة تفاعلية، يمكن للمطور اختبار جدوى ميزة جديدة مدعومة بالذكاء الاصطناعي في دقائق. هل يمكن للنموذج استخراج بيانات محددة من نص غير منظم؟ هل يمكنه توليد شيفرة بأسلوب معين؟ يمكن الإجابة على هذه الأسئلة بسرعة من خلال صياغة واختبار بعض المحفزات، مما يسمح للفرق بالتحقق من صحة الأفكار وتكرارها قبل تخصيص موارد كبيرة.
المرحلة الثانية: تكامل النظام
بمجرد إثبات فعالية الموجه، تكون الخطوة التالية دمجه في تطبيق أكبر. في الأنظمة العملية، نادرًا ما تكون الموجهات ثابتة. إنها قوالب ديناميكية مُدمجة في الشيفرة البرمجية، وهي تقنية سنوضحها بأمثلة عملية خلال تقدمنا في الدورة. تُملأ هذه القوالب برمجيًا بمدخلات المستخدم، والبيانات المسترجعة من قواعد البيانات أو واجهات برمجة التطبيقات، وسياقات آنية أخرى قبل إرسالها إلى نموذج الذكاء الاصطناعي. هنا، يتحول الموجه من مجرد سلسلة نصية بسيطة إلى مكون قوي في نظام برمجي.
المرحلة 3: التقييم المنهجي
لضمان الموثوقية، يجب اختبار نموذج أولي للموجه بدقة. ويتم ذلك من خلال تقييم منهجي. التقييم هو اختبار منظم يُشغّل موجهًا (أو مجموعة من الموجهات) على مجموعة بيانات مُختارة من المدخلات، ويُقارن مخرجات النموذج بمجموعة مُحددة مسبقًا من الإجابات الصحيحة أو معايير الجودة. تُوفر أطر عمل، مثل مشروع تقييمات OpenAI مفتوح المصدر، الأدوات اللازمة بناء هذه الاختبارات، مما يُمكّن الفرق من قياس الأداء بموضوعية بناءً على مقاييس مثل الدقة والملاءمة والأسلوب والسلامة قبل نشر أي ميزة.
المرحلة الرابعة: مراقبة الإنتاج والتكرار
لا يُنجز العمل بعد النشر. وكما هو الحال مع أي برنامج، يجب مراقبة المطالبات في بيئة الإنتاج. في بعض الأحيان، قد تختلف أنماط بيانات المستخدم الفعلية عن بيانات الاختبار، مما يؤدي إلى انخفاض أداء المطالبات، وهي ظاهرة تُعرف باسم "انحراف المطالبات" . تُعد تقنيات مثل اختبار A/B لإصدارات مختلفة من المطالبات ومراقبة مقاييس الأداء مفتاح أساسية لتحقيق النجاح على المدى الطويل. علاوة على ذلك، يجب إبقاء المطالبات تحت إدارة الإصدارات (مثلاً، في مستودع Git ) بحيث يمكن تتبع التغييرات واختبارها والتراجع عنها عند الحاجة.
قرار استراتيجي مفتاح : التحفيز مقابل الضبط الدقيق
مع بناء تطبيقات أكثر تعقيدًا، يُطرح سؤال استراتيجي حاسم: إذا لم يكن أداء أحد المحفزات جيدًا بما يكفي، فهل يجب علينا الاستمرار في هندسته، أم علينا تحسين النموذج نفسه؟ فهم الفرق مفتاح لاتخاذ قرارات تطوير فعّالة.
الضبط الدقيق هو عملية أخذ نموذج مُدرَّب مسبقًا وتدريبه بشكل إضافي على مجموعة بيانات كبيرة ومنتقاة من الأمثلة. تُحدِّث هذه العملية الأوزان الداخلية للنموذج، مما يُعلِّمه فعليًا مهارةً أو مفرداتٍ أو أسلوبًا جديدًا ومتخصصًا يُصبح جزءًا من قدراته الأساسية. تتضمن الهندسة الفورية، كما هو معلوم، توجيه سلوك النموذج المُدرَّب مسبقًا على أساس كل حالة على حدة من خلال التعليمات والسياق، دون تغيير النموذج نفسه.
ينبغي أن تكون الهندسة السريعة دائمًا هي الخطوة الأولى. فهي أسرع وأرخص، وغالبًا ما تكون كل ما يلزم لتحقيق الأداء المطلوب. يجب ألا نفكر في الضبط الدقيق إلا عندما تصل الهندسة السريعة إلى حدودها القصوى. الوقت المناسب للتفكير في الضبط الدقيق هو عندما:
تحتاج إلى النموذج لتعلم مهارة متخصصة للغاية أو اتباع أسلوب معقد يصعب التعبير عنه في موجه.
يتعين عليك تكرار تنسيق إخراج محدد ودقيق باستمرار عبر آلاف المدخلات المحتملة.
إنك تحاول توجيه النموذج على العديد من الأبعاد المختلفة في وقت واحد (على سبيل المثال، النبرة، والشخصية، والشكل، والأسلوب)، مما قد يجعل المطالبة نفسها طويلة وغير عملية.
بالنسبة لأغلب حالات الاستخدام الشائعة، فإن المطالبة المصممة جيدًا هي الحل الأكثر عملية ومرونة.
الاتجاهات الناشئة: الوكلاء والتعددية الوسائطية
تتطور هندسة الاستجابة السريعة بسرعة، إذ تتجاوز الآن مجرد توليد النصوص لتشمل تنسيق مهام أكثر تعقيدًا ومتعددة الوسائط. ويدفع هذا التحول تطوران رئيسيان: العوامل التي تستخدم الأدوات والنماذج متعددة الوسائط.
استخدام الوكلاء والأدوات
التطور الأحدث والأكثر أهمية هو التحول من نماذج لا تستطيع التواصل إلا مع نماذج قادرة على العمل . يمكن منح برامج ماجستير إدارة الأعمال الحديثة إمكانية الوصول إلى أدوات خارجية، مثل واجهات برمجة التطبيقات (APIs) والوظائف وقواعد البيانات. لم يعد الطلب مجرد طلب نصي؛ بل أصبح هدفًا عالي المستوى يجب على النموذج تحقيقه من خلال تخطيط وتنفيذ سلسلة من استدعاءات الأدوات.
هذا يُغيّر دور مهندس الاستجابة السريعة. نحن الآن مسؤولون عن:
تعريف الأدوات: كتابة مواصفات واضحة وقابلة للقراءة آليًا (غالبًا في مخطط JSON) تصف ما تفعله كل أداة، وما هي الوسائط التي تستخدمها، وما تعيده.
الإرشاد بشأن استخدام الأدوات: كتابة إرشادات تمنح النموذج السياق والإرشادات التي يحتاجها لتحديد الأداة التي يجب استخدامها، وبأي ترتيب، لحل مشكلة المستخدم.
معالجة مخرجات الأداة: معالجة البيانات التي تم إرجاعها بواسطة الأداة وإعادتها إلى النموذج حتى يتمكن من مواصلة عملية التفكير وإنشاء إجابة نهائية.
تُعد هذه القدرة، التي يُشار إليها غالبًا باسم استدعاء الوظيفة أو استخدام الأداة، ميزة أساسية للمنصات من Anthropic و OpenAI وGoogle، وهي تمثل قفزة كبيرة نحو بناء وكلاء الذكاء الاصطناعي صحيح .
صعود التعددية الوسائطية
الاتجاه الرئيسي الثاني هو التوسع في تعدد الوسائط . تتطور النماذج لتتجاوز النص، مُطوّرةً القدرة على معالجة أنواع متعددة من المعلومات والتفكير فيها في آنٍ واحد، بما في ذلك الصور والصوت وحتى الفيديو.
هذا يُغيّر جوهريًا مفهوم التحفيز. لم يعد التحفيز مجرد سلسلة من الكلمات، بل يُمكن أن يكون مزيجًا من صورة وسؤال نصي. يتطلب هذا مجموعة جديدة من مهارات التحفيز البصري والمكاني، حيث يُصبح ترتيب الصور ومحتواها بنفس أهمية النص نفسه.
اختلافات النماذج وأفضل الممارسات العالمية
نظرًا لتسارع وتيرة التطوير، يُطرح سؤال شائع: هل يُمكن لمُحفِّز مُناسب لنموذج مُعين أن يُناسب نموذجًا آخر؟ ورغم وجود بعض الفروق الدقيقة بين النماذج، إلا أن القطاع يتجه بسرعة نحو مجموعة من أفضل الممارسات العالمية.
فهم الفروق الدقيقة الخاصة بالنموذج
تختلف النماذج المختلفة، حتى وإن كانت مُعدّلةً بناءً على التعليمات، باختلاف بيانات التدريب المُستخدمة، وخياراتها المعمارية، وفلسفات الضبط الدقيق. لذلك، يُنصح دائمًا بالاطلاع على الوثائق الرسمية للنموذج الذي تستخدمه. على سبيل المثال، قد تتمتع بعض النماذج بتحمل أعلى للمطالبات الطويلة والمعقدة، بينما قد يُحسّن أداء نماذج أخرى مع سلسلة من المطالبات القصيرة والمتسلسلة.
التقارب حول المبادئ العالمية
على الرغم من هذه الاختلافات البسيطة، فقد ظهرت مجموعة قوية من المبادئ الأساسية، وهي فعّالة في جميع النماذج الحديثة المُعدّلة للتعليمات. نموذج هذه الممارسات مجموعة الأدوات المُوحّدة لأي مهندس توجيه محترف.
اكتب تعليمات واضحة ومحددة: هذا هو المبدأ الأهم. الغموض عدوّ الموثوقية.
توفير السياق المناسب: قم بتأسيس النموذج بالمعلومات الضرورية، سواء كان نصًا مرجعيًا أو بيانات مستخدم أو أمثلة.
استخدم الفواصل لفصل مكونات المطالبات: لمساعدة النموذج على التمييز بوضوح بين التعليمات والسياق إدخال المستخدم، يُعدّ استخدام التنسيق لتنظيم المطالبات من أفضل الممارسات العالمية. يُعدّ استخدام علامات الاقتباس العكسي الثلاثية، أو وسوم XML، أو رؤوس Markdown طرقًا فعّالة لإنشاء هذا الفصل.
اطلب من النموذج أن "يفكر خطوة بخطوة": بالنسبة للمهام المعقدة التي تتطلب التفكير، فإن توجيه النموذج بشكل صريح لتقسيم المشكلة وشرح عملية تفكيره قبل إعطاء الإجابة النهائية يمكن أن يحسن بشكل كبير من جودة ودقة النتيجة.
تطورت هندسة التوجيه من مهارة متخصصة إلى تخصص هندسي أساسي، مكتمل بسير عمل منظم، وأطر تقييم، ومجموعة من أفضل الممارسات العالمية. ويتطور دور مهندس التوجيه تبعًا لذلك. لم يعد الأمر يتعلق بإيجاد التسلسل الأمثل للكلمات لموجه واحد، بل أصبح يتعلق بالقدرة على... محترف يقوم بتصميم وبناء وتقييم أنظمة قوية من المطالبات والأدوات وحواجز الأمان لحل المشكلات في العالم الحقيقي.
بفضل هذا الفهم لمكانة هذا المجال في الماضي واتجاهه الحالي، أصبحنا الآن مستعدين للتعمق في التقنيات الأساسية التي تشكل مجموعة أدوات المهندس الحديث.