إنشاء تضمينات لملفات الصوت والبيانات الوصفية للأغاني
تعرف على كيفية إنشاء تضمينات لبيانات الأغاني والمقاطع الصوتية.
تضمينات البيانات الوصفية باستخدام نموذج تضمين BERT
لاستخدام BERT لتوليد تضمين البيانات الوصفية، نحتاج إلى تحويل معلومات البيانات الوصفية الجدولية (السمات والقيم) لأغنية إلى سلسلة، والتي نسميهاtextual_description من الأغنية. على سبيل المثال:
"أغنية Infinity Edge لها قابلية رقص تبلغ 0.528، وطاقة تبلغ 0.847، ومستوى صوت -4.741، ووضوح 0.0307، وصوتية تبلغ 0.00674، وآلات موسيقية تبلغ 0.814، وحيوية تبلغ 0.12، وتكافؤ 0.389، وإيقاع يبلغ 143.997."
للقيام بذلك، نقرأ ملف CSV الذي يحتوي على بيانات وصفية للأغاني، وننشئ نصًا وصفيًا لكل أغنية باستخدام سماتها وقيمها. نضيف هذا النص إلى إطار البيانات، ثم نحفظ إطار البيانات المُحدّث في ملف CSV.
الtextual_description تمت إضافة العمود إلى metadata_song.csv يظهر الملف في الصورة التوضيحية أدناه:
في الكود التالي، نقوم بتعريفSPECIAL_TOKENS لكي يُعامل BERT السمات الرقمية للأغاني كسمات خاصة، وليست نصًا عاديًا. ثم نستبدل هذه السمات في الأوصاف النصية بالرموز الخاصة المقابلة. هذا يُساعد النموذج على التمييز بين أسماء السمات والنصوص الأخرى، مما يُحسّن فهمه ومعالجته.