...

/

طرق قياس التشابه بين التضمينات

طرق قياس التشابه بين التضمينات

تعرف على الأساليب الرياضية المختلفة للعثور على أوجه التشابه بين التضمينات.

سنغطي ما يلي...

غالبًا ما تُقارن تضمينات المتجهات باستخدام مقاييس المسافة، التي تُحدد الفرق أو التشابه بين متجهين. فيما يلي ثلاثة مقاييس مفتاح للتشابه:

  • المسافة الإقليدية

  • تشابه جيب التمام

  • حاصل الضرب النقطي

المسافة الإقليدية

المسافة الإقليدية هي مقياس للمسافة المستقيمة بين نقطتين في الفضاء الإقليدي. في سياق تضمينات المتجهات، تُقاس المسافة الهندسية بين متجهين في فضاء متعدد الأبعاد. تُحسب على أنها الجذر التربيعي لمجموع مربعات الفروق بين العناصر المتناظرة في المتجهين.

Press + to interact
Straight line distance between two points (u1, u2) and (v1, v2)
Straight line distance between two points (u1, u2) and (v1, v2)

لمتجهين u u و v v من البعد n n يتم حساب المسافة الإقليدية على النحو التالي:

دعونا نرى بناء الجملة للعثور على المسافة الإقليدية بين تضمينين باستخدام وظيفة مدمجة في مكتبة scikit-learn في Python.

Press + to interact
Python 3.8
from sklearn.metrics.pairwise import euclidean_distances
import numpy as np
# Define two vectors
embedding1 = np.array([1.5, 2.0, 3.5])
embedding2 = np.array([4.0, 1.0, 2.5])
# Calculate Euclidean distance
euclidean_dist = euclidean_distances([embedding1], [embedding2])[0][0]
print("Euclidean distance:", euclidean_dist)
  • السطر 1: نقوم ...