تقنيات التفكير المتقدمة

تعلم كيفية استخدام تقنيات الاستدلال المتقدمة لتوجيه الذكاء الاصطناعي خلال حل المشكلات المعقدة.

سنغطي ما يلي...

التحفيز من خلال سلسلة الأفكار (CoT)
- صفر إطلاق CoT
- عدد قليل من الطلقات
الاتساق الذاتي
التحفيز ببرنامج الأفكار (PoT)
التحفيز باستخدام شجرة الأفكار (ToT)
مخطط الأفكار (صراع العروش)
المخاطر واختيار التقنية المناسبة
- دليل اتخاذ القرار

تُدرَّب نماذج التعلم الآلي على التنبؤ رمز التالي، وهي عملية تُمكّنها من توليد النصوص بكفاءة وسلاسة. يُعدّ هذا السلوك ميزةً في العديد من المهام، ولكنه قد يُصبح عائقًا في المشكلات التي تتطلب استدلالًا متعدد الخطوات، لأن النموذج قد يُنتج استنتاجًا معقولًا ولكنه خاطئ. لنأخذ على سبيل المثال اللغز الكلاسيكي التالي:

عادةً ما استجابة السريعة والبديهية من النموذج هي 0.10 دولار. قد يبدو هذا صحيحًا للوهلة الأولى، ولكنه غير صحيح. فإذا كان سعر الكرة 0.10 دولار، فسيكون سعر المضرب 1.10 دولار، وسيكون المجموع 1.20 دولار. تُبرز هذه المسألة البسيطة نقطةً مهمة: لإجراء عمليات استدلال معقدة، نحتاج إلى توجيه النموذج لتنفيذ الخطوات بشكلٍ صريح. سنتناول لاحقًا كيفية القيام بذلك عمليًا.

التحفيز من خلال سلسلة الأفكار (CoT)

يُعدّ أسلوب "سلسلة الأفكار" (CoT) أهمّ إنجاز في مجال التفكير المنطقي في برامج الماجستير في القانون. وهو أسلوب أساسي تُطوّره أو تُكمّله العديد من الأساليب المتقدمة.

تُعدّ تقنية تسلسل الأفكار أسلوبًا تحفيزيًا يشجع نموذج التعلم الآلي على توليد سلسلة من خطوات الاستدلال المترابطة التي تقود إلى الإجابة النهائية لمشكلة متعددة الخطوات. فبدلًا من تقديم إجابة نهائية مباشرة، يُظهر النموذج أولًا عملية تفكيره. وهذا يُحاكي النهج البشري في تقسيم المشكلة المعقدة إلى أجزاء أصغر وأسهل في التعامل، مما يقلل بشكل كبير من احتمالية حدوث أخطاء في الاستدلال.

تُعدّ هذه التقنية فعّالة للغاية لأنها تُواءم عملية توليد النموذج مع مسار استدلال منطقي. تُوفّر كل خطوة في هذه السلسلة سياقًا للخطوة التالية، مما يُوجّه النموذج نحو استنتاج صحيح. هناك طريقتان أساسيتان لاستخلاص هذا السلوك من النموذج:

صفر إطلاق CoT
عدد قليل من الطلقات

صفر إطلاق CoT

أبسط طريقة لتطبيق نظرية التعلم الآلي هي من خلال نهج التدريب الصفري . تعتمد هذه الطريقة على حقيقة أن النماذج الحديثة واسعة النطاق قد تم تدريبها على كميات هائلة من النصوص التي تتضمن حلولًا تفصيلية للمشكلات. ونتيجة لذلك، تمتلك هذه النماذج قدرة كامنة مدمجة على الاستدلال يمكن تفعيلها بعبارة بسيطة.

الأسلوب بسيط: بعد تحديد المشكلة، نضيف عبارة تحث النموذج على إظهار منطقه، مثل "دعونا نفكر خطوة بخطوة".

لنطبق هذا مباشرة على مشكلتنا التمهيدية.

Output:

1. Let B be the cost of the bat and C be the cost of the ball.

2. The problem gives us two pieces of information that we can turn into equations:

a) The total cost is $1.10, so: B + C = 1.10

b) The bat costs $1.00 more than the ball, so: B = C + 1.00

3. Now I can solve this system of equations. I will substitute the second equation into the first one.

4. This gives me: (C + 1.00) + C = 1.10

5. Combining the terms with C, I get: 2C + 1.00 = 1.10

6. Subtracting 1.00 from both sides gives: 2C = 0.10

7. Finally, dividing by 2 gives: C = 0.05

Therefore, the ball costs $0.05.

بإضافة تلك العبارة البسيطة، حولنا الموجه من سؤال بسيط إلى طلب لعملية منطقية، مما أدى إلى توجيه النموذج بعيدًا عن تخمينه البديهي الخاطئ ونحو الإجابة الصحيحة.

عدد قليل من الطلقات

على الرغم من فعالية التدريب بدون استخدام بيانات تدريبية محددة مسبقًا، إلا أنه يعتمد على قدرة النموذج على تعلم كيفية تحليل هذا النوع من المشكلات أثناء التدريب. أما بالنسبة للمهام الجديدة أو الأكثر تعقيدًا، فإن التدريب باستخدام بيانات تدريبية محددة مسبقًا يوفر طريقة أكثر موثوقية لتوجيه تفكير النموذج.

في هذه التقنية، نقدم مثالاً واحداً أو أكثر ضمن السؤال المطروح لتوضيح نمط الاستدلال المطلوب. وهذا يمنح النموذج مخططاً واضحاً ليتبعه. فهو يرى مثالاً على السؤال، والاستدلال خطوة بخطوة اللازم لحله، ...

1.ابدء

2.مقدمة

3.أساسيات الهندسة الفورية

4.تصميم التعليمات

5.السياق والأساس

6.التلقين متعدد الوسائط

7.الأدوات والإجراءات المنظمة

8.الإنتاج والعمليات

9.الخلاصة

تقنيات التفكير المتقدمة

التحفيز من خلال سلسلة الأفكار (CoT)

صفر إطلاق CoT

عدد قليل من الطلقات