Search⌘ K
AI Features

أفضل الممارسات الهندسية الفورية

تعلم أفضل الممارسات الهندسية السريعة التي تنتج باستمرار مخرجات دقيقة وموثوقة ومنظمة بشكل جيد من نماذج التعلم الآلي عبر مجموعة واسعة من المهام.

لنفترض أن مهندسين يعملان على نفس المهمة: استخراج البيانات المنظمة من تذاكر دعم العملاء وإعادتها بصيغة JSON. يستخدم كلاهما نفس النموذج. يكتب المهندس الأول تعليمات سريعة وينفذها. يُعيد النموذج بيانات مفيدة بشكل عام، ولكن بتنسيق غير متناسق، حيث تنقصه بعض الحقول أحيانًا، وقد يتحول أحيانًا إلى نص توضيحي بدلًا من JSON واضح. أما المهندس الثاني، فيقضي خمس عشرة دقيقة إضافية في تطبيق بعض التقنيات المدروسة. يُنتج نموذجه بيانات JSON واضحة ومنظمة بشكل صحيح في كل مرة.

لا علاقة للاختلاف بين هاتين النتيجتين بالنموذج نفسه، بل بجودة التوجيه. يطبق المهندس الثاني أفضل ممارسات هندسة التوجيه، وهي مجموعة من التقنيات الموثقة والمثبتة التي تُحدث الفرق بين ميزة الذكاء الاصطناعي التي تُعرض بشكل جيد في العرض التوضيحي وتلك التي تُثبت جدارتها في بيئة الإنتاج.

يشرح هذا الدرس تلك الممارسات بشكل منهجي، موضحاً ماهية كل منها، ولماذا تنجح، وكيفية تطبيقها.

ابدأ بالوضوح والتحديد

إن أهم ممارسة هندسية فورية هي أيضاً الأكثر وضوحاً: كن واضحاً ومحدداً بشأن احتياجاتنا.

نماذج اللغة أنظمة احتمالية. فهي لا تملك نية، ولا تستنتج ما قصدناه. إنما تستجيب لما كتبناه فعلاً. لا يُحلّ الغموض في النصّ باستخدام المنطق السليم، بل يُحلّ بتخمين، وقد يكون هذا التخمين منطقياً تماماً، ولكنه خاطئ في حالتك الخاصة.

ضع في اعتبارك هذا السؤال:

Prompt: Summarize this article.

لا يملك النموذج أي فكرة عن طول الملخص المطلوب، أو من هي الفئة المستهدفة، أو ما هو الشكل الأمثل له، أو ما هي أهم جوانب المقال. سينتج شيئًا معقولًا وعامًا. قارن ذلك بما يلي:

Prompt: Summarize the following article in three bullet points for a non-technical executive

يُزيل التوجيه الثاني التخمين تمامًا. ويُعزى هذا التحسين إلى التحديد الدقيق عبر أربعة أبعاد:

  1. المهمة (تلخيص)

  2. الجمهور (مدير تنفيذي غير متخصص في المجال التقني)

  3. التنسيق (ثلاث نقاط رئيسية)

  4. القيد (25 كلمة لكل منها، مع التركيز على الأعمال)

عندما لا يعمل أحد المطالبات كما هو متوقع، فإن السؤال الأول الذي يجب طرحه هو: هل كنت محددًا بما فيه الكفاية بشأن جميع هذه الأبعاد الأربعة؟

استخدم نموذجًا هندسيًا سريعًا

من أكثر أساليب هندسة الرسائل العملية لبناء رسائل متسقة وقابلة لإعادة الاستخدام، العمل انطلاقاً من قالب منظم. فبدلاً من كتابة كل رسالة من الصفر، يحدد القالب المكونات القياسية التي يجب أن تتضمنها الرسالة عالية الأداء، ويخصص لكل مكون مكاناً محدداً.

يتكون نموذج الهندسة السريعة الموثوق به من خمسة مكونات:

  • الدور: يُحدد الدور شخصية أو سياقًا مهنيًا للنموذج، مما يُحدد نبرته وأسلوبه. مثال: " أنت كاتب تقني ذو خبرة في توثيق المطورين."

  • المهمة: تُحدد هذه المهمة الإجراء الأساسي الذي يجب على النموذج تنفيذه. يجب أن تكون هذه المهمة عبارة عن تعليمات واحدة واضحة. مثال: " مهمتك هي إعادة كتابة قسم مرجع واجهة API التالي ليكون أكثر وضوحًا وإيجازًا."

  • السياق: يوفر المعلومات الأساسية التي يحتاجها النموذج لأداء المهمة بدقة. هنا تُوضع البيانات المُسترجعة، والتفاصيل التي يُدخلها المستخدم، أو المعلومات الأساسية. مثال: " الجمهور المستهدف هم مهندسو برمجيات متوسطو الخبرة، على دراية بواجهات برمجة تطبيقات REST، ولكنهم حديثو العهد بهذه المنصة تحديدًا."

  • أمثلة: توضح إخراج المطلوبة من خلال زوج واحد أو أكثر من أزواج المدخلات والمخرجات. حتى مثال واحد مختار بعناية يقلل بشكل كبير من نطاق الاستجابات المقبولة.

  • تنسيق الإخراج: يحدد بنية استجابة المتوقع وطوله ونبرته وتنسيقه. مثال: " أجب بأسلوب بسيط وواضح. بحد أقصى 150 كلمة. تجنب المصطلحات التقنية."

لا يتطلب كل طلب تنفيذ جميع المكونات الخمسة. قد تحتاج مهمة بسيطة ذات دورة واحدة إلى مهمة وتنسيق إخراج فقط. تكمن قيمة التفكير باستخدام القوالب في أنه يُلزم باتخاذ قرارات مدروسة بشأن كل مكون بدلاً من تركها للصدفة. في أنظمة الإنتاج، تتحول هذه القوالب إلى هياكل ديناميكية حيث تبقى المهمة والدور ثابتين بينما يتم ملء خانة السياق برمجيًا ببيانات في الوقت الفعلي في كل استدعاء.

قدّم أمثلة

إذا كانت الدقة هي المبدأ الأهم، فإن الأمثلة هي الأسلوب الأقوى. فتقديم مثال أو أكثر للسلوك المطلوب للمدخلات والمخرجات للنموذج أكثر فعالية باستمرار من كتابة تعليمات أطول وأكثر تفصيلاً.

تُسمى هذه التقنية "التوجيه المحدود" عند تقديم أمثلة متعددة، و "التوجيه الأحادي" عند استخدام مثال واحد. يكمن سر نجاحها في أن الأمثلة تُوصل الغرض بدقةٍ قلّما تُحققها التعليمات وحدها. فالمثال لا يُخبر النموذج بما يجب فعله فحسب، بل يُظهر له الشكل والأسلوب ومستوى التفصيل وطريقة التفكير اللازمة استجابة الصحيحة.

تصف إرشادات أنثروبيك الهندسية الأمثلة بأنها "صور تساوي ألف كلمة" في الهندسة السريعة. فبدلاً من سرد كل حالة استثنائية في قائمة من القواعد، فإن مجموعة صغيرة من الأمثلة المختارة بعناية والمتنوعة تنقل نفس المعلومات بكفاءة وموثوقية أكبر بكثير.

عند اختيار الأمثلة لتدريب قصير، تُطبق ثلاثة مبادئ:

  • التنوع أهم من الكمية: مثالان أو ثلاثة أمثلة تغطي حالات مختلفة بشكل هادف تتفوق على عشرة أمثلة جميعها اختلافات لنفس السيناريو.

  • طابق التنسيق المطلوب: إذا كان إخراج المطلوب هو كائن JSON، فيجب أن تُظهر الأمثلة كائنات JSON، وليس أوصافًا نثرية لما يجب أن يحتويه كائن JSON.

  • اجعل الأمثلة نموذجية: يجب أن تمثل الأمثلة السلوك المتوقع والصحيح في الحالات النموذجية، وليس قائمة شاملة للحالات الشاذة. من الأفضل معالجة الحالات الشاذة من خلال قيود صريحة في التعليمات.

استخدم الفواصل والبنية

مع ازدياد تعقيد التعليمات، واحتوائها على تعليمات النظام، وسياق الخلفية، إدخال المستخدم، والأمثلة، جميعها في نفس كتلة النص، قد يواجه النموذج صعوبة في التمييز بين نهاية كل مكون وبداية الآخر. يؤدي هذا الغموض إلى سوء فهم النموذج لأي جزء من التعليمات يجب اتباعه، وأي جزء منها بيانات يجب معالجتها.

يكمن الحل في استخدام الفواصل لإنشاء حدود هيكلية واضحة داخل النص. وفيما يلي ثلاثة أساليب شائعة:

  • علامات XML: تغليف المكونات بعلامات وصفية مثل<instructions> ،<context> ،<example> ، و<user_input> يخلق فصلاً واضحاً لا لبس فيه تتعامل معه النماذج بشكل موثوق.

  • علامات التنصيص الثلاثية: الاستخدام``` إن عزل كتل البيانات أو المحتوى المقدم من المستخدم يشير إلى النموذج بأن النص المرفق يجب التعامل معه إدخال للمعالجة، وليس كتعليمات يجب اتباعها.

  • عناوين Markdown: استخدام## تُسهّل العناوين تنظيم أقسام موجه النظام الطويل، مما يجعل البنية واضحة ويحافظ على تجميع التعليمات ذات الصلة معًا.

إليكم نفس النص، أولاً بدون فواصل ثم معها:

Without delimiters

With delimiters

You are a helpful assistant. Summarize the text below in one sentence.

The quarterly results exceeded expectations with revenue up 18%.

You are a helpful assistant. Summarize the text in <document> tags in one sentence.


<document>

The quarterly results exceeded expectations with revenue up 18%.

</document>

يزيل الإصدار المنظم أي لبس حول ماهية التعليمات وماهية البيانات. وهذا أمر بالغ الأهمية، لا سيما في أنظمة الإنتاج حيث يتم إدخال المحتوى الذي يقدمه المستخدم في نافذة الأوامر بشكل ديناميكي، إذ يمكن للمستخدم، في حال عدم وجود هذا اللبس، صياغة إدخال تُفسَّر على أنها تعليمات، وهو أساس هجمات حقن نافذة الأوامر.

اطلب من النموذج التفكير خطوة بخطوة

بالنسبة للمهام التي تتطلب التفكير متعدد الخطوات، أو الحساب الرياضي، أو التحليل المنطقي، أو أي مشكلة يعتمد فيها الوصول إلى الإجابة الصحيحة على التسلسل الصحيح للخطوات الوسيطة، فإن توجيه النموذج للتفكير بشكل صريح قبل إنتاج إجابة نهائية يحسن الدقة بشكل كبير.

تُعرف هذه التقنية باسم "التوجيه بسلسلة الأفكار" . وهي تُحسّن الأداء في مجموعة واسعة من مهام الحساب، والمنطق السليم، والاستدلال الرمزي، مع مكاسب تجريبية قد تكون لافتة للنظر. فعندما يُجبر النموذج على إظهار خطوات حله، تُخصص آليات الانتباه في المُحوِّل المزيد من الرموز لكل مسألة فرعية، مما يُقلل من التخمينات المختصرة ويكشف عن الأخطاء الخفية.

عملياً، يمكن تطبيق أسلوب تحفيز سلسلة الأفكار بطريقتين:

  • طريقة CoT بدون أمثلة: إضافة عبارة مثل "فكّر خطوة بخطوة قبل تقديم إجابتك النهائية" إلى السؤال، دون تقديم أي أمثلة على الاستدلال. هذه هي أسرع طريقة، وهي فعّالة لمعظم مهام الاستدلال على النماذج ذات القدرات العالية.

  • اختبار التفكير المنطقي المختصر: يتضمن أمثلة توضح إدخال وسلسلة الاستدلال والإجابة النهائية. يُعد هذا الأسلوب أكثر فعالية في المجالات المتخصصة التي يكون فيها هيكل الاستدلال الصحيح غير واضح.

تجدر الإشارة إلى أن استخدام تقنية "سلسلة الأفكار" (CoT) يُحسّن الأداء بشكل ملحوظ، خاصةً مع النماذج الأكبر حجمًا. أما النماذج الأصغر، فقد تُنتج سلاسل تفكير غير منطقية، مما قد يؤدي إلى دقة أقل من استخدام تقنية "سلسلة الأفكار" التقليدية. بالنسبة للمهام البسيطة التي لا تتطلب استدلالًا متعدد الخطوات، فإن إضافة تعليمات "سلسلة الأفكار" غير ضرورية، بل وتزيد من استخدام رمز دون تحسين جودة إخراج .

التوجيه التكراري والتحكم في الإصدار

نادراً ما يكون النص المُوجَّه صحيحاً من المحاولة الأولى. ومن أهم التحولات الفكرية في هندسة النصوص المُوجَّهة المتقدمة هو التعامل مع تطوير النصوص المُوجَّهة كعملية هندسية تكرارية، وليس كمهمة كتابة لمرة واحدة.

التلقين التكراري هو ممارسة منهجية لاختبار مُوجِّه ما مقابل مجموعة تمثيلية من المدخلات، وتحليل مواطن الخلل، ووضع فرضية حول السبب، وإجراء تغيير مُستهدف، ثم إعادة الاختبار. تُحاكي هذه الدورة كيفية تصحيح أخطاء البرمجيات. يجب أن تُغيِّر كل تكرار متغير واحدًا في كل مرة، تمامًا كما هو الحال في التجارب المُحكمة، حتى يُمكن قياس تأثير كل تغيير بوضوح.

يرتبط هذا النهج التكراري ارتباطًا مباشرًا بأفضل الممارسات لإدارة مطالبات الذكاء الاصطناعي وبيانات التقييم في أنظمة الإنتاج. تحديدًا:

  • التحكم في إصدارات المطالبات: يجب تخزين المطالبات المستخدمة في بيئة الإنتاج في نظام تحكم في الإصدارات، مثل مستودع Git ، إلى جانب حالات الاختبار المستخدمة لتقييمها. يتيح ذلك تتبع التغييرات بين الإصدارات، وإعادة إنتاج السلوك السابق، والتراجع عن أي تغيير أدى إلى تدهور الأداء.

  • الحفاظ على مجموعة بيانات تقييمية: تُعدّ مجموعة مُنتقاة من المدخلات التمثيلية مع المخرجات المتوقعة ضرورية لقياس ما إذا كان التغيير الفوري يُمثّل تحسّنًا أم تراجعًا. فبدون مجموعة بيانات اختبارية، يصبح التكرار الفوري مجرد تخمين.

  • توثيق الأسباب الكامنة وراء التغييرات: إن تدوين سبب اختيار صياغة معينة، أو نمط الفشل الذي تمت إضافة قيد معين لمعالجته، يجعل الموجه قابلاً للصيانة من قبل مهندسين آخرين ويسهل إعادة النظر فيه لاحقًا.

هذا الانضباط هو ما يميز نموذجًا أوليًا هشًا عن نموذج جاهز للإنتاج. فالنموذج نفسه ليس سوى جزء من الأصل، أما حالات الاختبار وسجل الإصدارات ونتائج التقييم المحيطة به فهي لا تقل أهمية.

قم بمعايرة تنسيق إخراج بدقة

إنّ توجيهًا يحدد المهمة بوضوح دون غير معرّف تنسيق إخراج سيؤدي إلى استجابات تختلف في بنيتها وطولها وأسلوبها من استدعاء لآخر. بالنسبة للتطبيقات التي يتعامل معها المستخدمون، يُعدّ هذا التباين غير ملائم. أما في حالات الاستخدام البرمجي حيث يتم تحليل إخراج بواسطة التعليمات البرمجية اللاحقة، فهو يُعتبر عيبًا.

يجب اعتبار تحديد تنسيق الإخراج عنصرًا أساسيًا في أي عملية إنتاج. مفتاح الأبعاد التي يجب تحديدها هي:

Dimension

What to Specify

Example

Structure

Prose, list, table, JSON, XML

Return a JSON object with keys: name, date, amount

Length

Word count, sentence count, or token guidance

No more than 100 words

Tone

Formal, conversational, technical, accessible

Write in plain, accessible language for a general audience

Constraints

What to exclude or avoid

Do not include introductory or closing sentences

بالنسبة للتطبيقات التي تستخدم إخراج النموذج برمجيًا، فإن تحديد إخراج JSON بمخطط مُعرّف يُزيل أي غموض في التحليل تمامًا. ويُعدّ تضمين مثال عملي لتنسيق إخراج المتوقع في موجه الأوامر، كعرض توضيحي قصير، الطريقة الأمثل لضمان الاتساق الهيكلي.

استخدم أدوات الهندسة السريعة بفعالية

إن كتابة وصقل المطالبات يدويًا أمر ممكن للاستخدام على نطاق صغير، ولكن مع ازدياد عدد المطالبات والنماذج وحالات التقييم، تصبح أدوات هندسة المطالبات المخصصة ضرورية للحفاظ على الجودة والاتساق.

تدعم عدة فئات من الأدوات سير العمل الهندسي السريع:

  • توفر بيئات الاختبار التفاعلية، مثل منصة Anthropic Console ومنصة OpenAI Playground ومنصة Google AI Studio، بيئات تفاعلية لاختبار التوجيهات على النماذج، ومقارنة النتائج جنبًا إلى جنب، وتعديل معايير مثل درجة الحرارة في الوقت الفعلي. وتُعد هذه البيئات أساسيةً لإنشاء النماذج الأولية بسرعة.

  • تتيح منصات إدارة المطالبات مثل PromptLayer و LangSmith للفرق تخزين المطالبات وإصدارها وتنظيمها مركزياً، وتتبع مقاييس الأداء عبر الإصدارات، والتعاون في تطوير المطالبات عبر فرق الهندسة.

  • توفر أطر التقييم مثل أدوات التقييم المدمجة في Anthropic ومشروع التقييمات مفتوحة المصدر من OpenAI البنية التحتية لتشغيل اختبارات منظمة على نطاق واسع، وقياس أداء التنبيهات مقابل الدقة والملاءمة والامتثال للتنسيق ومعايير السلامة قبل وصول التنبيه إلى مرحلة الإنتاج.

إن استخدام هذه الأدوات مجتمعة يدعم سير عمل تطوير احترافي قابل للتكرار: إنشاء نموذج أولي في بيئة تجريبية، وتحسينه بشكل متكرر بناءً على مجموعة بيانات تقييمية، وإدارة الإصدارات في مكتبة موجهة، وقياس أداء الإنتاج من خلال المراقبة المستمرة.

خاتمة

نموذج أفضل ممارسات هندسة البرمجيات الفورية الأساس التقني للحصول على مخرجات متسقة وعالية الجودة من نماذج اللغة الكبيرة عبر نطاق واسع من حالات الاستخدام. إن تطبيق القوالب المنظمة، وتقديم أمثلة ملموسة، واستخدام المحددات، وتمكين الاستدلال التدريجي، والتكرار المنهجي بناءً على بيانات التقييم، ليست تحسينات متقدمة مقتصرة على الأنظمة المعقدة، بل هي المبادئ الأساسية التي تميز تطبيقات الذكاء الاصطناعي الموثوقة عن تلك غير المتوقعة. ومع استمرار تطور النماذج، تظل هذه المبادئ ثابتة لأنها تُعالج الطبيعة الأساسية لكيفية تفسير نماذج اللغة إدخال والاستجابة لها. إن الاستثمار في هذه الممارسات مبكرًا يُؤتي ثماره في كل مرحلة من مراحل التطوير.