Search⌘ K
AI Features

طرق قياس التشابه بين التمثيلات المضمنة

تعرف على الطرق الرياضية المختلفة لإيجاد أوجه التشابه بين التمثيلات المضمنة.

تُقارن تمثيلات المتجهات عادةً باستخدام مقاييس المسافة، التي تُحدد الفرق أو التشابه بين متجهين. فيما يلي ثلاثة مقاييس مفتاح للتشابه:

  • المسافة الإقليدية

  • تشابه جيب التمام

  • منتج نقطي

المسافة الإقليدية

المسافة الإقليدية هي مقياس للمسافة المستقيمة بين نقطتين في الفضاء الإقليدي. وفي سياق تمثيل المتجهات، تُحدد المسافة الهندسية بين متجهين في فضاء متعدد الأبعاد. ويتم حسابها كالجذر التربيعي لمجموع مربعات الفروق بين العناصر المتناظرة في المتجهين.

Straight line distance between two points (u1, u2) and (v1, v2)
Straight line distance between two points (u1, u2) and (v1, v2)

For two vectors uu and vv of dimension nn, the Euclidean distance is calculated as follows:

دعونا نرى الصيغة لإيجاد المسافة الإقليدية بين تمثيلين باستخدام دالة مدمجة في مكتبة scikit-learn في Python.

Python 3.8
from sklearn.metrics.pairwise import euclidean_distances
import numpy as np
# Define two vectors
embedding1 = np.array([1.5, 2.0, 3.5])
embedding2 = np.array([4.0, 1.0, 2.5])
# Calculate Euclidean distance
euclidean_dist = euclidean_distances([embedding1], [embedding2])[0][0]
print("Euclidean distance:", euclidean_dist)
  • السطر 1: نستورد ...