Search⌘ K
AI Features

كيف تتطور الهندسة السريعة

تعرف على كيفية تطور هندسة الاستجابة السريعة من مجرد إكمال النصوص إلى تخصص رسمي، وكيف تندمج في سير عمل تطوير الذكاء الاصطناعي الاحترافي.

في درسنا السابق، عرّفنا هندسة الموجهات بأنها منهجية منهجية. مع ذلك، فإن هذه المنهجية ليست ثابتة؛ بل هي مجال متطور باستمرار، يتطور بوتيرة سريعة تضاهي سرعة نماذج اللغة التي تسعى إلى توجيهها. إن فهم كيفية تطور هندسة الموجهات - وإلى أين تتجه - يساعد في وضع التقنيات المستخدمة اليوم في سياقها الصحيح.

لنبدأ بمقارنة حقبتين متميزتين من تفاعل الذكاء الاصطناعي. لنتأمل نموذج ذكاء اصطناعي من بضع سنوات مضت. كان الحصول على استجابة مفيدة أشبه بلعبة حظ، يتطلب مدخلات غير مألوفة وقليلًا من الحظ. أما الآن، فلننظر إلى ذكاء اصطناعي حديث. يمكننا إعطاؤه أمرًا مباشرًا، وغالبًا ما ينفذه بدقة مذهلة.

ما الذي تغيّر؟ ما هي اللحظة المحورية التي حوّلت تفاعلنا مع الذكاء الاصطناعي من فنّ غريب من الهمس الفوري إلى تخصص موثوق في هندسة الاستجابة الفورية؟ سنستكشف التحولات التقنية والاستراتيجية مفتاح التي شكّلت هذا المجال، ونرى كيف تتلاءم هندسة الاستجابة الفورية مع سير عمل التطوير المهني، ونتطلع إلى الاتجاهات الناشئة التي تُحدّد مستقبله.

ثورة ضبط التعليمات

نتج تحول كبير في هندسة التوجيه عن تغييرات في كيفية تدريب النماذج، وليس عن إدخال تقنيات توجيه جديدة. وقد أدى هذا التغيير إلى مرحلتين في تصميم النموذج: التنبؤ بالكلمة التالية، ثم ضبط التعليمات.

عصر التنبؤ بالكلمة التالية

كانت نماذج اللغة الكبيرة الأولى ذات القدرات الهائلة، مثل GPT-2 وGPT-3 الأصلي، محركات رائعة لإكمال النصوص. وكان هدفها الأساسي هو التنبؤ بالكلمة التالية الأكثر ترجيحًا بناءً على سلسلة من النصوص. ولم تكن تفهم الأوامر أو النية الكامنة وراء كلمات المستخدم.

كان توجيه هذه النماذج فنًا يتمثل في عرض نمط عليها لإكماله. ولجعل النموذج يقوم بالترجمة، لم يكن بإمكان المهندس ببساطة طلب ترجمة منه. بل كان عليه تنسيق التوجيه على شكل قائمة من الأمثلة، مع ترك الخانة الأخيرة فارغة ليكملها النموذج.

Prompt: English: sea otter

French: loutre de mer


English: platypus

French: ornithorynque


English: cheese

French:

يتعرف النموذج على نمط الكلمة الإنجليزية متبوعة بالترجمة الفرنسية، فيتوقع أن تكون كلمة "fromage" هي الكلمة الأكثر ترجيحًا من الناحية الإحصائية. لم يكن النموذج ينفذ أمرًا، بل كان ببساطة يُكمل نمطًا مألوفًا. هذا هو جوهر التعلم السياقي.

التحول إلى ضبط التعليمات

جاءت الثورة مع تقنية تُسمى ضبط التعليمات . بدأ الباحثون والمهندسون في مختبرات مثل OpenAI وجوجل في ضبط نماذجهم الأساسية بدقة على مجموعات بيانات ضخمة ومنتقاة بعناية تتكون من(instruction, desired_output) أزواج. على سبيل المثال، قد تحتوي مجموعة البيانات على ملايين الأمثلة مثل:

  • التعليمات: "ترجم الجملة 'Hello, world' إلى الفرنسية."

  • إخراج المطلوب: "مرحبًا، لوموند".

من خلال التدريب على هذه الأزواج، تعلمت نماذج مثل InstructGPT وFlan من جوجل المفهوم المجرد لاتباع الأوامر . فقد تعلمت تمييز التعليمات كنوع مميز من إدخال يتطلب إخراج محددة ومطابقة، بدلاً من مجرد سلسلة أخرى من الكلمات لإكمالها. وتم تحسينها لاحقًا باستخدام أساليب مواءمة تعتمد على التغذية الراجعة البشرية، مثل التعلم المعزز من التغذية الراجعة البشرية (RLHF)، مما عزز سلوك اتباع التعليمات بشكل صحيح. كان هذا الابتكار نقطة تحول، إذ لم يعد المهندسون مضطرين لخداع النموذج لإنتاج الإجابة الصحيحة، بل أصبح بإمكانهم ببساطة طلبها. باستخدام مثال الترجمة، يتحول التوجيه من مهمة إكمال نمط إلى أمر مباشر.

Prompt: Translate the word 'cheese' from English to French.

هذا التحول هو السبب وراء وجود أفضل الممارسات الحديثة التي نعتمد عليها اليوم. إن استراتيجية كتابة التعليمات الواضحة والمحددة هي نتيجة مباشرة لتدريب النماذج على اتباعها.

الهندسة السريعة في سير عمل تطوير الذكاء الاصطناعي الحديث

مع ازدياد موثوقية التوجيه، أصبح جزءًا لا يتجزأ من سير العمل القياسي لتطوير البرمجيات. لم يعد مجرد مهمة لمرة واحدة، بل عملية مستمرة ذات مراحل متميزة. يقدم سير العمل هذا إجابةً على السؤال المحوري: كيف يندمج هندسة التوجيه في تطوير الذكاء الاصطناعي بشكل عام؟

المرحلة الأولى: النماذج الأولية السريعة

قبل كتابة سطر واحد من كود الإنتاج، تتيح هندسة النماذج الأولية إمكانية إنشاء نماذج أولية بسرعة فائقة. فباستخدام بيئة تفاعلية، يستطيع المطور اختبار جدوى ميزة جديدة مدعومة بالذكاء الاصطناعي في دقائق معدودة. هل يستطيع النموذج استخراج بيانات محددة من نص غير منظم؟ هل يستطيع توليد كود بنمط معين؟ يمكن الإجابة عن هذه الأسئلة بسرعة من خلال صياغة واختبار بعض النماذج الأولية، مما يسمح للفرق بالتحقق من صحة الأفكار وتطويرها قبل تخصيص موارد كبيرة.

المرحلة الثانية: تكامل النظام

بمجرد إثبات فعالية التوجيه، تتمثل الخطوة التالية في دمجه ضمن تطبيق أوسع. في الأنظمة الواقعية، نادرًا ما تكون التوجيهات ثابتة، بل هي قوالب ديناميكية مُدمجة في الشيفرة البرمجية، وهي تقنية سنوضحها بأمثلة عملية لاحقًا. تُملأ هذه القوالب برمجيًا بمدخلات المستخدم، والبيانات المُسترجعة من قواعد البيانات أو واجهات برمجة التطبيقات، وغيرها من المعلومات السياقية الآنية، قبل إرسالها إلى نموذج الذكاء الاصطناعي. هنا يتحول التوجيه من مجرد نص بسيط إلى عنصر أساسي في نظام برمجي متكامل.

المرحلة الثالثة: التقييم المنهجي

لضمان الموثوقية، يجب اختبار نموذج أولي للمطالبات بدقة. ويتم ذلك من خلال تقييم منهجي. التقييم عبارة عن اختبار منظم يُشغّل مطالبة (أو مجموعة مطالبات) على مجموعة بيانات مُنسقة من المدخلات، ويقارن مخرجات النموذج بمجموعة محددة مسبقًا من الإجابات الصحيحة أو معايير الجودة. إن اتباع أفضل الممارسات لإدارة مطالبات الذكاء الاصطناعي وبيانات التقييم، مثل ترقيم إصدارات المطالبات جنبًا إلى جنب مع مجموعات بيانات الاختبار الخاصة بها، هو ما يميز نظام الإنتاج الموثوق عن النظام الهش. وهنا تبرز أهمية أدوات هندسة المطالبات المتخصصة. توفر أطر عمل مثل مشروع التقييمات مفتوح المصدر من OpenAI البنية التحتية اللازمة بناء هذه الاختبارات، مما يسمح للفرق بقياس الأداء بموضوعية بناءً على مقاييس مثل الدقة والملاءمة والأسلوب والسلامة قبل نشر أي ميزة.

المرحلة الرابعة: مراقبة الإنتاج والتكرار

لا ينتهي العمل بمجرد النشر. فكما هو الحال مع أي برنامج، يجب مراقبة التنبيهات في بيئة الإنتاج. أحيانًا، قد تختلف أنماط بيانات المستخدمين الفعلية عن بيانات الاختبار، مما يؤدي إلى تراجع أداء التنبيه، وهي ظاهرة تُعرف باسم انحراف التنبيه . تُعدّ تقنيات مثل اختبار A/B لإصدارات مختلفة من التنبيهات ومراقبة مؤشرات الأداء مفتاح بالغة الأهمية للنجاح على المدى الطويل. علاوة على ذلك، ينبغي حفظ التنبيهات تحت نظام تحكم في الإصدارات (مثل مستودع Git ) حتى يتسنى تتبع التغييرات واختبارها والتراجع عنها عند الضرورة.

قرار استراتيجي مفتاح : التحفيز مقابل الضبط الدقيق

مع ازدياد تعقيد التطبيقات بناء ، يبرز سؤال استراتيجي بالغ الأهمية: إذا لم يكن أداء أحد عناصر واجهة المستخدم جيدًا بما فيه الكفاية، فهل ينبغي لنا الاستمرار في تطويره، أم ينبغي لنا تحسين النموذج نفسه؟ إن فهم الفرق بينهما هو مفتاح اتخاذ قرارات تطوير فعالة وكفؤة.

الضبط الدقيق هو عملية تدريب نموذج مُدرَّب مسبقًا على مجموعة بيانات كبيرة ومنتقاة بعناية. تُحدِّث هذه العملية الأوزان الداخلية للنموذج، مما يُعلِّمه مهارةً أو مصطلحاتٍ أو أسلوبًا جديدًا مُتخصصًا يُصبح جزءًا من قدراته الأساسية. أما هندسة التوجيه، كما نعلم، فتتضمن توجيه سلوك النموذج المُدرَّب مسبقًا لكل حالة على حدة من خلال التعليمات والسياق، دون تغيير النموذج نفسه.

Fine-tuning vs. prompt engineering
Fine-tuning vs. prompt engineering

ينبغي أن تكون الهندسة السريعة هي الخطوة الأولى دائمًا. فهي أسرع وأقل تكلفة، وغالبًا ما تكون كافية لتحقيق الأداء المطلوب. ولا ينبغي التفكير في الضبط الدقيق إلا عندما تصل الهندسة السريعة إلى حدودها القصوى. والوقت المناسب للتفكير في الضبط الدقيق هو عندما:

  • أنت بحاجة إلى النموذج لتعلم مهارة متخصصة للغاية أو لاتباع أسلوب معقد يصعب التعبير عنه في سؤال محدد.

  • أنت بحاجة إلى تكرار تنسيق إخراج محدد ودقيق للغاية باستمرار عبر آلاف المدخلات المحتملة.

  • أنت تحاول توجيه النموذج على العديد من الأبعاد المختلفة في وقت واحد (مثل النبرة والشخصية والشكل والأسلوب)، مما قد يجعل الطلب نفسه طويلاً وغير عملي.

بالنسبة لمعظم حالات الاستخدام الشائعة، فإن المطالبات المصممة بشكل جيد هي الحل الأكثر عملية ومرونة.

الاتجاهات الناشئة: الوكلاء والوسائط المتعددة

يستمر التطور السريع في مجال هندسة الرسائل الفورية. وقد تجاوز الآن مجرد توليد النصوص ليشمل تنسيق مهام أكثر تعقيدًا ومتعددة الوسائط. ويقود هذا التحول تطوران رئيسيان: الوكلاء الذين يستخدمون الأدوات والنماذج متعددة الوسائط.

استخدام الوكلاء والأدوات

يُعدّ التحوّل من نماذج قادرة على التفاعل فقط إلى نماذج قادرة على التنفيذ أهمّ التطورات الحديثة. إذ يُمكن لنماذج التعلم الآلي الحديثة الوصول إلى أدوات خارجية، مثل واجهات برمجة التطبيقات (APIs) والوظائف وقواعد البيانات. ولم يعد الهدف مجرّد طلب نصّ، بل أصبح غايةً عليا يجب على النموذج تحقيقها من خلال تخطيط وتنفيذ سلسلة من استدعاءات الأدوات.

هذا يُغيّر دور مهندس الاستجابة السريعة. نحن الآن مسؤولون عن:

  • تحديد الأدوات: كتابة مواصفات واضحة وقابلة للقراءة آلياً (غالباً في مخطط JSON) تصف ما تفعله كل أداة، وما هي الوسائط التي تأخذها، وما الذي تعيده.

  • التوجيه بشأن استخدام الأدوات: كتابة تعليمات تمنح النموذج السياق والإرشادات التي يحتاجها لتحديد الأداة التي يجب استخدامها، وبالترتيب الذي يجب أن يستخدمها، لحل مشكلة المستخدم.

  • معالجة مخرجات الأداة: معالجة البيانات التي تُرجعها الأداة وإعادتها إلى النموذج حتى يتمكن من مواصلة عملية الاستدلال الخاصة به وتوليد إجابة نهائية.

تُعدّ هذه الإمكانية، التي يُشار إليها غالبًا باستدعاء الدوال أو استخدام الأدوات، سمةً أساسيةً في منصات Anthropic و OpenAI وGoogle، وهي تمثل نقلةً نوعيةً نحو بناء وكلاء ذكاء اصطناعي صحيح . هنا يتطور هندسة التوجيه التقليدية إلى هندسة سياق الوكيل: الإدارة الاستراتيجية للمعلومات التي يتلقاها الوكيل، وتسلسل استلامها، وكيفية دمج مخرجات الأدوات في حلقة استدلاله. في هذا النموذج الجديد، يُعدّ تنظيم تدفق البيانات بنفس أهمية التعليمات نفسها.

صعود الوسائط المتعددة

أما الاتجاه الرئيسي الثاني فهو التوسع في الوسائط المتعددة . تتطور النماذج لتتجاوز النصوص، وتكتسب القدرة على معالجة أنواع متعددة من المعلومات والتفكير فيها في وقت واحد، بما في ذلك الصور والصوت وحتى الفيديو.

يُغيّر هذا الأمر جوهريًا مفهوم التوجيه. فلم يعد التوجيه مجرد سلسلة من الكلمات، بل أصبح مزيجًا من صورة وسؤال نصي. ويتطلب هذا مجموعة جديدة من المهارات في التوجيه البصري والمكاني. وتُعد هندسة التوجيه لتوليد الصور باستخدام الذكاء الاصطناعي مثالًا مبكرًا على هذا التحول، حيث يُؤثر ترتيب التوجيه وخصائصه ومحتواه بشكل مباشر على إخراج البصري. ومع تطور النماذج، أصبحت مهارات التوجيه متعدد الوسائط هذه جزءًا لا يتجزأ من أدوات كل مهندس توجيه.

اختلافات النماذج وأفضل الممارسات الهندسية الفورية

نظراً لسرعة التطور، يبرز تساؤل شائع حول ما إذا كان أسلوب التوجيه الذي يناسب نموذجاً معيناً سيناسب نموذجاً آخر. ورغم وجود بعض الفروقات الدقيقة بين النماذج، إلا أن الصناعة تتجه بسرعة نحو مجموعة من أفضل الممارسات الهندسية للتوجيه التي يمكن تطبيقها على جميع النماذج الحديثة.

فهم الفروق الدقيقة الخاصة بكل نموذج

تختلف النماذج، حتى وإن كانت مُعدّلة وفقًا للتعليمات، في خصائصها الفريدة الناتجة عن بيانات التدريب الخاصة بها، وخياراتها المعمارية، وفلسفات ضبطها الدقيق. لذا، يُنصح دائمًا بالرجوع إلى الوثائق الرسمية للنموذج المُستخدم. على سبيل المثال، قد تتمتع بعض النماذج بقدرة تحمل أكبر للمطالبات الطويلة والمعقدة، بينما قد يكون أداء نماذج أخرى أفضل مع سلسلة من المطالبات القصيرة والمتسلسلة.

التقارب على المبادئ العالمية

على الرغم من هذه الاختلافات الطفيفة، فقد برزت مجموعة قوية من المبادئ الأساسية التي تُطبّق بفعالية على جميع النماذج الحديثة المُصممة خصيصاً للتعليمات. نموذج هذه الممارسات مجموعة الأدوات القياسية لأي مهندس صوت محترف.

  • اكتب تعليمات واضحة ومحددة: هذا هو المبدأ الأهم. الغموض عدو الموثوقية.

  • توفير سياق ذي صلة: قم بتأسيس النموذج بالمعلومات الضرورية، سواء كانت نصًا مرجعيًا أو بيانات المستخدم أو أمثلة.

  • استخدم الفواصل لفصل مكونات التوجيه: لمساعدة النموذج على التمييز بوضوح بين التعليمات والسياق إدخال المستخدم، يُعد استخدام التنسيق لهيكلة التوجيه من أفضل الممارسات الشائعة. يُعد استخدام علامات التنصيص الثلاثية، أو وسوم XML، أو عناوين Markdown من الطرق الفعالة لتحقيق هذا الفصل.

  • اطلب من النموذج "التفكير خطوة بخطوة": بالنسبة للمهام المعقدة التي تتطلب التفكير المنطقي، فإن توجيه النموذج بشكل صريح لتقسيم المشكلة وشرح عملية التفكير قبل إعطاء إجابة نهائية يمكن أن يحسن بشكل كبير من جودة ودقة النتيجة.

لقد تطورت هندسة الرسائل النصية من مهارة متخصصة إلى تخصص هندسي أساسي، يشمل سير عمل منظم، وأطر تقييم، ومجموعة من أفضل الممارسات العالمية. ويتطور دور مهندس الرسائل النصية تبعًا لذلك، إذ لم يعد يقتصر على إيجاد التسلسل الأمثل للكلمات لرسالة نصية واحدة، بل أصبح أكثر تركيزًا على... محترف يقوم بتصميم وبناء وتقييم أنظمة قوية من التوجيهات والأدوات وحواجز السلامة لحل مشاكل العالم الحقيقي.

مع هذا الفهم لما كان عليه المجال وإلى أين يتجه، أصبحنا الآن مستعدين للغوص بعمق في التقنيات الأساسية التي تشكل مجموعة أدوات المهندس الحديث.