Важность дистанционных метрик в моделировании машинного обучения

3 ответов

давайте разделим косинусное сходство на части и посмотрим как и почему это работает.

косинус угла между 2 векторами — a и b — определяется как:

здесь .* является умножением по элементам. Знаменатель здесь только для нормализации, поэтому давайте просто назовем его L . С ним наши функции превращаются в:

, который, в свою очередь, может быть переписан как:

давайте немного абстрактнее и заменим x * y / L С функцией g(x, y) ( L здесь константа, поэтому мы не ставим ее в качестве аргумента функции). Таким образом, наша косинусная функция становится:

то есть, каждая пара элементов (a, b) is отдельно, и результат просто sum всех процедур. И это хорошо для вашего случая, потому что вы не хотите, чтобы разные пары (разные вершины) возились с каждым другое: если user1 посетил только vertex2 и user2 — только vertex1, то у них нет ничего общего, и сходство между ними должно быть нулевым. Что вам на самом деле не нравится, так это то, как сходство между отдельными парами — т. е. функция g() — рассчитывается.

С косинусной функцией сходство между отдельными парами выглядит так:

здесь x и y представляют время, затраченное пользователями на вершину. И вот главный вопрос:—44—>тут умножение представляет сходство между отдельными парами хорошо? Я так не думаю. Пользователь, который провел 90 секунд на какой-то вершине, должен быть близок к пользователю, который провел там, скажем, 70 или 110 секунд, но гораздо дальше от пользователей, которые проводят там 1000 или 0 секунд. Умножение (даже нормализованное на L ) здесь полностью вводит в заблуждение. Что значит умножить 2 периода времени?

хорошая новость заключается в том, что это вы, кто проектирует функцию подобия. Мы уже решили, что удовлетворены независимой обработкой пар (вершин), и нам нужна только индивидуальная функция подобия g(x, y) чтобы сделать что-то разумное с ее доводами. И что такое разумная функция для сравнения периодов времени? Я бы сказал, что вычитание-хороший кандидат:

это не функция подобия, а функция расстояния-чем ближе значения друг к другу, тем меньше результат g() — но в конечном итоге идея одна и та же, поэтому мы можем обмениваться ими когда понадобится.

мы также можем захотеть увеличить влияние больших несоответствий путем возведения разницы в квадрат:

Эй! Мы только что изобрели (среднее) квадратов ошибок! Теперь мы можем придерживаться MSE для расчета расстояния, или мы можем продолжить поиск хорошего

косинусное сходство предназначено для случая, когда вы делаете не хотите взять длину в accoun,но только угол. Если вы хотите также включить длину, выберите другую функцию расстояния.

Косинус расстояние is тесно связано с квадратным евклидовым расстоянием (единственное расстояние, для которого действительно определено k-среднее); поэтому сферическое k-среднее работает.

связь довольно проста:

квадрат евклидова расстояния sum_i (x_i-y_i)^2 можно учесть в sum_i x_i^2 + sum_i y_i^2 — 2 * sum_i x_i*y_i . Если оба вектора нормализованы, т. е. длина не имеет значения, то первые два условия 1. В этом случае, квадрат евклидова расстояния равен 2 — 2 * cos(x,y) !

другими словами: расстояние Косинуса в квадрате евклидово расстояние с данными, нормализованными к единичной длине.

Если вы не хотите нормализовать свои данные, не используйте Косинус.

Q1. Why is this assumption wrong?

как мы видим из определения, косинусное сходство измеряет угол между 2 векторами.

в вашем случае, вектор v1 лежит плашмя на первом измерении, в то время как c1 и c2 оба одинаково выровнены по осям, и, таким образом, косинусное сходство и чтобы быть таким же.

обратите внимание, что проблема заключается в c1 и c2 указывая в том же направлении. любой v1 будет иметь тот же Косинус сходство с ними обоими

Для примера :

Q2. Is the cosine distance a correct distance function for this case?

как мы видим из примера в руке, наверное, нет.

Q3. What would be a better one given the nature of the problem?

Примеры задач на вычисление угла между векторами

Примеры вычисления угла между векторами для плоских задачи

Решение: Найдем скалярное произведение векторов:

a · b = 3 · 4 + 4 · 3 = 12 + 12 = 24.

Найдем модули векторов:

| a | = √ 3 2 + 4 2 = √ 9 + 16 = √ 25 = 5 | b | = √ 4 2 + 3 2 = √ 16 + 9 = √ 25 = 5

Найдем угол между векторами:

cos α = a · b = 24 = 24 = 0.96
| a | · | b | 5 · 5 25

Решение: Найдем скалярное произведение векторов:

a · b = 5 · 7 + 1 · 5 = 35 + 5 = 40.

Найдем модули векторов:

| a | = √ 7 2 + 1 2 = √ 49 + 1 = √ 50 = 5√ 2 | b | = √ 5 2 + 5 2 = √ 25 + 25 = √ 50 = 5√ 2

Найдем угол между векторами:

cos α = a · b = 40 = 40 = 4 = 0.8
| a | · | b | 5√ 2 · 5√ 2 50 5

Примеры вычисления угла между векторами для пространственных задач

Решение: Найдем скалярное произведение векторов:

a · b = 3 · 4 + 4 · 4 + 0 · 2 = 12 + 16 + 0 = 28.

Найдем модули векторов:

| a | = √ 3 2 + 4 2 + 0 2 = √ 9 + 16 = √ 25 = 5 | b | = √ 4 2 + 4 2 + 2 2 = √ 16 + 16 + 4 = √ 36 = 6

Найдем угол между векторами:

cos α = a · b = 28 = 14
| a | · | b | 5 · 6 15

Решение: Найдем скалярное произведение векторов:

a · b = 1 · 5 + 0 · 5 + 3 · 0 = 5.

Найдем модули векторов:

| a | = √ 1 2 + 0 2 + 3 2 = √ 1 + 9 = √ 10 | b | = √ 5 2 + 5 2 + 0 2 = √ 25 + 25 = √ 50 = 5√ 2

Найдем угол между векторами:

cos α = a · b | a | · | b | = 5 √ 10 · 5√ 2 = 1 2√ 5 = √ 5 10 = 0.1√ 5

Любые нецензурные комментарии будут удалены, а их авторы занесены в черный список!

Добро пожаловать на OnlineMSchool. Меня зовут Довжик Михаил Викторович. Я владелец и автор этого сайта, мною написан весь теоретический материал, а также разработаны онлайн упражнения и калькуляторы, которыми Вы можете воспользоваться для изучения математики.

Махаланобис Расстояние:

Расстояние Махаланобиса используется для расчета расстояния между двумя точками данных в многомерном пространстве.

Согласно определению Википедии,

Преимущество использования расстояния по махаланобису заключается в том, что учитывается ковариация, которая помогает измерять силу / сходство между двумя различными объектами данных. Расстояние между наблюдением и средним может быть рассчитано, как показано ниже:

Здесь S — ковариационные метрики. Мы используем обратную метрику ковариации, чтобы получить нормализованное по дисперсии уравнение расстояния.

Теперь, когда у нас есть базовое представление о различных метриках расстояния, мы можем перейти к следующему шагу, а именно к методам / моделированию машинного обучения, в которых используются эти метрики различий.

Что нужно знать о векторных величинах (векторах)

Векторы характеризуются модулем и направлением в пространстве

Модулем вектора называется его числовое значение.

Вектор изображают в виде направленного отрезка (стрелки). Стрелка указывает, куда направлен вектор (рис. 14, 15). Длина стрелки характеризует модуль вектора (рис. 16). Над буквенным обозначением вектора ставят стрелку, например:  

Модуль вектора обозначают той же буквой, но без стрелки над ней или символом  Например, модуль вектора на рисунке 16 равен

Модуль любого (не равного нулю) вектора — число положительное.

Векторы равны между собой, если равны их модули и одинаковы направления

Равные векторы лежат на одной и той же прямой или на параллельных прямых и направлены в одну и ту же сторону. На рисунке 17   Однако, несмотря на равенство модулей, так как у векторов различные направления.  

Угол между векторами

Чтобы найти угол между векторами (рис. 18, а), нужно совместить их начала (рис. 18, б). Если направления векторов одинаковы, то (рис. 18, в), если противоположны, то (рис. 18, г).

Умножение вектора на число

Произведение вектора на число есть вектор Чему в равен его модуль? Куда направлен вектор

Модуль вектора равен

Если то вектор направлен так же, как вектор а если то противоположно ему.

На рисунке 19 показаны результаты умножения вектора на 2, на 0,5, на (-3) и на (-1) соответственно. 

Противоположные векторы

Вектор называется противоположным вектору если У векторов одинаковые модули, но противоположные направления (рис. 19, а, г).

Сложение векторов

В 7-м классе вы складывали силы, направленные или одинаково, или в противоположные стороны. Результатом сложения в первом случае была сила, модуль которой равен а во втором

То же самое получается и при сложении векторов  (рис. 20). Если они направлены одинаково (рис. 20, а), то их сумма имеет модуль Если же направления векторов противоположны (рис

20, б), то модуль их суммы Обратите внимание: в последнем случае вектор направлен так, как вектор с большим модулем (т. е

как вектор ).  

А как сложить векторы, направленные под любым углом друг к другу? Для этого можно использовать любое из двух следующих далее правил. 

Правило параллелограмма

Совместим начала векторов (рис. 21, а), сохраняя их направления (рис. 21, б). Построим параллелограмм ABCD, принимая векторы за его стороны. Сумма векторов есть вектор совпадающий с диагональю АС параллелограмма: (см. рис. 21, б).

Правило треугольника

Совместим конец вектора с началом вектора сохраняя их направления (рис. 21, в). Вектор проведенный из начала вектора в конец вектора  равен сумме (см. рис. 21, в).

Из рисунков 21, б и 21, в ясно, что правило треугольника и правило параллелограмма дают одинаковые результаты. А как найти разность векторов?

Вычитание векторов

Пусть начала векторов совмещены (рис. 22). Проведем вектор из конца вычитаемого вектора в конец уменьшаемого вектора Вектор есть искомая разность:  Докажите с помощью построения, что Такой способ вычитания векторов очень удобен.

Правило многоугольника

Чтобы найти сумму нескольких векторов (например, ), каждый следующий вектор нужно проводить из конца предыдущего (рис. 23). Замыкающий вектор проведенный из начала первого вектора в конец последнего есть сумма данных векторов: 

Правило многоугольника следует из правила треугольника.

Модуль суммы векторов

Не путайте модуль суммы векторов, т. е. и сумму их модулей  Равенство  выполняется только для одинаково направленных векторов (см. рис. 20, а на с. 13). Во всех остальных случаях т. е. модуль суммы векторов меньше суммы их модулей. Так получается потому, что в любом треугольнике (см. рис. 21, в) длина одной стороны меньше суммы длин двух других сторон. Проверьте это на примерах.

Нуль-вектор

Пусть вектор равен вектору Тогда их разность т. е. нуль-вектору.

Главные выводы:

  1. Векторные величины характеризуются модулем и направлением, скалярные — только числовым значением.
  2. Сумму двух векторов находят по правилу параллелограмма или треугольника.
  3. Разность двух векторов находят, проводя вектор из конца вычитаемого вектора в конец уменьшаемого (при совмещенных началах векторов).
  4. Разность векторов можно найти как сумму
  5. Произведение вектора на число есть вектор При направления векторов совпадают, а при — противоположны. Модуль вектора равен

Норма алгебры

Определение

Норма на алгебреНЕТ{\ Displaystyle {\ mathcal {N}}} В{\ displaystyle A}

называется нормой алгебры, если существует вещественная константа такая, что
ПРОТИВ{\ displaystyle C}

∀(Икс,y)∈В2НЕТ(Икс×y)≤ПРОТИВНЕТ(Икс)НЕТ(y){\ displaystyle \ forall (x, y) \ in A ^ {2} \ quad {\ mathcal {N}} (x \ times y) \ leq C \, {\ mathcal {N}} (x) {\ mathcal {N}} (y)}

другими словами, такая, что норма является субмультипликативной ( ).
НЕТ′знак равноПРОТИВНЕТ{\ displaystyle {\ mathcal {N}} ‘: = C {\ mathcal {N}}}НЕТ′(Икс×y)≤НЕТ′(Икс)НЕТ′(y){\ Displaystyle {\ mathcal {N}} ‘(x \ times y) \ leq {\ mathcal {N}}’ (x) {\ mathcal {N}} ‘(y)}

В случае вещественной или комплексной алгебры это условие эквивалентно непрерывности произведения как билинейного отображения.

Если алгебра унитарна, мы можем потребовать, чтобы норма также удовлетворяла:

НЕТ(1В)знак равно1{\ Displaystyle {\ mathcal {N}} (1_ {A}) = 1},

в этом случае умножение на константу больше не может использоваться для «перенормировки» нормы.

Примеры

  • Применение модуля является алгеброй над нормой ℂ рассматривается как ℝ-алгебры.
  • Операторная норма на является нормой алгебры.L(E){\ Displaystyle {\ mathcal {L}} (E)}
  • «Бесконечная» норма на ℂ n индуцирует операторную норму, на которой записывается:Mнет(ПРОТИВ){\ Displaystyle {\ mathcal {M}} _ {п} (\ mathbb {C})}
∀(вя,j)∈Mнет(ПРОТИВ), ‖(вяj)‖знак равноМаксимумя∑j|вяj|.{\ displaystyle \ forall (a_ {i, j}) \ in {\ mathcal {M}} _ {n} (\ mathbb {C}), \ \ | (a_ {ij}) \ | = \ max _ { i} \ sum _ {j} | a_ {ij} |.}

Функция расстояния

Вы помните изучение теоремы Пифагора? Если вы это сделаете, то вы можете вспомнить вычисление расстояния между двумя точками данных, используя теорему.

Чтобы вычислить расстояние между точками данных A и B, в теореме Пифагора рассматривается длина осей x и y.

Многим из вас должно быть интересно, используем ли мы эту теорему в алгоритме машинного обучения, чтобы найти расстояние? Чтобы ответить на ваш вопрос, да, мы используем его. Во многих алгоритмах машинного обучения мы используем приведенную выше формулу в качестве функции расстояния. Мы поговорим об алгоритмах, где он используется.

Теперь вы, наверное, поняли, что такое функция расстояния? Вот упрощенное определение.

Основное определение от Math.net,

Функция расстояния — это не что иное, как математическая формула, используемая метриками расстояния. Функция расстояния может отличаться в зависимости от метрики расстояния. Давайте поговорим о различных дистанционных метриках и поймем их роль в моделировании машинного обучения.

Обработка естественного языка

Поиск информации

Давайте возьмем пример и поймем использование косинусного сходства.

  1. Создать векторную форму для Корпуса и Query-
import mathimport numpy as npimport pandas as pdimport matplotlib.pyplot as pyplotfrom sklearn.metrics.pairwise import cosine_similarityfrom sklearn.feature_extraction.text import TfidfVectorizervectorizer = TfidfVectorizer()corpus = query = X = vectorizer.fit_transform(corpus)Y = vectorizer.transform(query)

2. Проверьте сходства, т.е. найдите, какой документ в корпусе имеет отношение к нашему запросу.

cosine_similarity(Y, X.toarray())Results:array(])

Как видно из приведенного выше примера, мы запросили слово«Коричневый»и в корпусе есть только три документа, которые содержат слово«Коричневый».При проверке с помощью косинусной метрики сходства он дал те же результаты, имея> 0 значений для трех документов, кроме четвертого

Вывод

В этой статье мы узнали о нескольких популярных метриках расстояния / сходства и о том, как их можно использовать для решения сложных задач машинного обучения. Надеюсь, что это будет полезно для людей, которые только начинают изучать машинное обучение и науку о данных.

Вектор Макс Норм

Длина вектора может быть рассчитана с использованием максимальной нормы, также называемой максимальной нормой.

Максимальная норма вектора называется L ^ inf, где inf — верхний индекс и может быть представлен символом бесконечности. Обозначения для максимальной нормы: || x || inf, где inf — индекс.

Максимальная норма вычисляется как возвращающая максимальное значение вектора, отсюда и название.

Максимальная норма вектора может быть вычислена в NumPy с помощью функции norm () с параметром порядка, установленным в inf.

Сначала определяется вектор 1 × 3, затем вычисляется максимальная норма вектора.

При запуске примера сначала печатается определенный вектор, а затем максимальная норма вектора

Максимальная норма также используется в качестве регуляризации в машинном обучении, например, в весах нейронных сетей, называемой максимальной нормализацией.

Вектор L1 Норма

Длина вектора может быть вычислена с использованием нормы L1, где 1 — верхний индекс L, например, L ^ 1.

Обозначения для нормы L1 вектора: || v || 1, где 1 — индекс. Таким образом, эту длину иногда называют нормой такси или нормой Манхэттена.

Норма L1 рассчитывается как сумма абсолютных значений вектора, где абсолютное значение скаляра использует обозначение | a1 |. По сути, норма — это вычисление манхэттенского расстояния от начала векторного пространства.

Норма L1 вектора может быть вычислена в NumPy с помощью функции norm () с параметром для указания порядка нормы, в данном случае 1.

Сначала определяется вектор 1 × 3, затем вычисляется норма вектора L1.

При выполнении примера сначала печатается определенный вектор, а затем норма L1 вектора.

Норма L1 часто используется при подборе алгоритмов машинного обучения в качестве метода регуляризации, например метод, позволяющий сохранять коэффициенты модели малыми, и, в свою очередь, модель менее сложной.

Системы линейных уравнений

Напоминание теории. Системой линейных алгебраических уравнений
называется система вида , где
.
В случае квадратной невырожденной матрицы решение системы
единственно.

В NumPy решение такой системы можно найти с помощью функции
numpy.linalg.solve(a, b), где первый аргумент — матрица
, второй — столбец .

a = np.array(, 1, 2]])
b = np.array()
x = np.linalg.solve(a, b)
print (a.dot(x))

Бывают случаи, когда решение системы не существует. Но хотелось бы все
равно “решить” такую систему. Логичным кажется искать такой вектор
, который минимизирует выражение
— так мы приблизим выражение
к .

В NumPy такое псевдорешение можно искать с помощью функции
numpy.linalg.lstsq(a, b, …), где первые два аргумента такие
же, как и для функции numpy.linalg.solve(). Помимо решения
функция возвращает еще три значения, которые нам сейчас не понадобятся.

a = np.array(, 1, 1], 2, 1], 3, 1]])
b = np.array()
x, res, r, s = np.linalg.lstsq(a, b, rcond=None)

Обобщения

Если вы рассматриваете матрицу с действительными или комплексными элементами как соответственно длинный вектор, евклидова норма также может быть определена для матриц и тогда называется нормой Фробениуса . Евклидова норма также может быть обобщена на бесконечномерные векторные пространства над действительными или комплексными числами, а затем частично имеет свои собственные имена. Наиболее важные обобщения заключаются в следующем.

ℓ 2 стандартных

является обобщением евклидовой нормы в пространстве последовательностей квадратично суммируемых последовательностей . Вот только конечная сумма заменяется на Бесконечного и 2 норма затем дается как
ℓ2{\ displaystyle \ ell ^ {2}} (ап)п∈KN{\ displaystyle (a_ {n}) _ {n} \ in {\ mathbb {K}} ^ {\ mathbb {N}}}

‖(ап)‖ℓ2знак равно(∑пзнак равно1∞|ап|2)12{\ displaystyle \ | (a_ {n}) \ | _ {\ ell ^ {2}} = \ left (\ sum _ {n = 1} ^ {\ infty} | a_ {n} | ^ {2} \ справа) ^ {1/2}}.

Пространство является гильбертово пространство со скалярным произведением двух последовательностей
ℓ2{\ displaystyle \ ell ^ {2}}

⟨(ап),(бп)⟩ℓ2знак равно∑пзнак равно1∞ап¯⋅бп{\ displaystyle \ left \ langle \, (a_ {n}), (b_ {n}) \, \ right \ rangle _ {\ ell ^ {2}} = \ sum _ {n = 1} ^ {\ infty } {\ overline {a_ {n}}} \ cdot b_ {n}}.

L 2 стандарт

Кроме того, евклидова норма может быть обобщена на функциональное пространство функций, интегрируемых на множестве квадратично , что происходит в два этапа. Во-первых, -норма является квадратичной интегрируемой по Лебегу функцией при
Л.2(Ω){\ Displaystyle L ^ {2} (\ Omega)} Ω{\ displaystyle \ Omega}Л.2{\ Displaystyle {\ mathcal {L}} ^ {2}}жΩ→K{\ Displaystyle f \ двоеточие \ Omega \ rightarrow {\ mathbb {K}}}

‖ж‖Л.2(Ω)знак равно(∫Ω|ж(Икс)|2dИкс)12{\ Displaystyle \ | е \ | _ {{\ mathcal {L}} ^ {2} (\ Omega)} = \ left (\ int _ {\ Omega} | е (х) | ^ {2} \, dx \ right) ^ {1/2}},

определяется, в результате чего по сравнению с ℓ 2 нормы только сумма была заменена интегралом. Изначально это только полунорма , поскольку не только нулевая функция, но и все функции, которые отличаются от нулевой функции только в терминах набора с нулевой мерой Лебега, интегрируются в ноль

Поэтому, принимая во внимание количество классов эквивалентности функций , которые почти везде одинаковы, и получает на этом L -пространстве L нормы по
ж∈Л.2(Ω){\ Displaystyle \ в L ^ {2} (\ Omega)}

‖ж‖Л.2(Ω)знак равно‖ж‖Л.2(Ω){\ Displaystyle \ | \, \, \ | _ {L ^ {2} (\ Omega)} = \ | е \ | _ {{\ mathcal {L}} ^ {2} (\ Omega)} }.

Пространство представляет собой гильбертово пространство со скалярным произведением двух функций
Л.2(Ω){\ Displaystyle L ^ {2} (\ Omega)}

⟨ж,г⟩Л.2(Ω)знак равно∫Ωж(Икс)¯⋅г(Икс)dИкс{\ displaystyle \ langle f, g \ rangle _ {L_ {2} (\ Omega)} = \ int _ {\ Omega} {\ overline {f (x)}} \ cdot g (x) \, dx}.

Его также можно обобщить с меры Лебега на общие меры .

Общие векторные пространства

В более общем смысле евклидова норма может быть определена в любых бесконечномерных векторных пространствах через связанный базис Гамеля . Если такая Хамель основа имеет , где множество индексов , то каждый вектор может быть представлен в виде линейной комбинации с коэффициентами (здесь лишь конечное число коэффициентов могут отличаться от 0). Евклидова норма вектора тогда определяется какV{\ displaystyle V}{Икся}я∈Я.{\ displaystyle \ {x_ {i} \} _ {я \ in I}}V{\ displaystyle V}Я.{\ displaystyle I}v∈V{\ displaystyle v \ in V} vзнак равно∑я∈Я.аяИкся{\ displaystyle \ textstyle v = \ sum _ {я \ in I} a_ {i} x_ {i}}ая∈K{\ displaystyle a_ {i} \ in {\ mathbb {K}}}ая{\ displaystyle a_ {i}}

‖v‖2знак равно(∑я∈Я.|ая|2)12{\ displaystyle \ | v \ | _ {2} = \ left (\ sum _ {i \ in I} | a_ {i} | ^ {2} \ right) ^ {1/2}}

и тем самым из скалярного произведения

⟨v,ш⟩знак равно⟨∑я∈Я.аяИкся,∑я∈Я.бяИкся⟩знак равно∑я∈Я.а¯ябя{\ displaystyle \ langle v, w \ rangle = \ left \ langle \ sum _ {i \ in I} a_ {i} x_ {i}, \ sum _ {i \ in I} b_ {i} x_ {i} \ right \ rangle: = \ sum _ {i \ in I} {\ bar {a}} _ {i} b_ {i}}

индуцированный для векторов .
v,ш∈V{\ displaystyle v, w \ in V}

Иногда норма, индуцированная произвольным скалярным произведением на вещественном пространстве скалярных произведений, также называется евклидовой нормой.

Ранг матрицы

Напоминание теории. Рангом матрицы называется
максимальное число линейно независимых строк (столбцов) этой матрицы.

В NumPy ранг матрицы вычисляется с помощью функции
numpy.linalg.matrix_rank(M, tol=None), где M — матрица,
tol — параметр, отвечающий за некоторую точность вычисления. В
простом случае можно его не задавать, и функция сама определит
подходящее значение этого параметра.

a = np.array(, 1, 1, 1], 2, 2, 2]])
r = np.linalg.matrix_rank(a)
print ("Матрица:\n", a)
print ("Ранг матрицы:", r)
Матрица:
 
 
 ]
Ранг матрицы: 2

С помощью вычисления ранга матрицы можно проверять линейную
независимость системы векторов.

Допустим, у нас есть несколько векторов. Составим из них матрицу, где
наши векторы будут являться строками. Понятно, что векторы линейно
независимы тогда и только тогда, когда ранг полученной матрицы совпадает
с числом векторов. Приведем пример:

a = np.array()
b = np.array()
c = np.array()
m = np.array()
print (np.linalg.matrix_rank(m) == m.shape])

Определение евклидова пространства

Вещественное линейное пространство \mathbb называется евклидовым, если каждой паре элементов \mathbf,\,\mathbf этого пространства поставлено в соответствие действительное число \langle\mathbf,\mathbf \rangle , называемое скалярным произведением, причем это соответствие удовлетворяет следующим условиям:

0\quad \forall \mathbf\ne \mathbf

\forall \lambda\in \mathbb\,;\\ &\bold\quad \langle\mathbf,\mathbf\rangle>0\quad \forall \mathbf\ne \mathbf

В скалярном произведении \langle\mathbf, \mathbf\rangle вектор \mathbf — первый, а вектор \mathbf — второй сомножители. Скалярное произведение \langle\mathbf,\mathbf\rangle вектора \mathbf на себя называется скалярным квадратом. Условия 1–4 называются аксиомами скалярного произведения. Аксиома 1 определяет симметричность скалярного произведения, аксиомы 2 и 3 — аддитивность и однородность по первому сомножителю, аксиома 4 — неотрицательность скалярного квадрата \langle\mathbf, \mathbf\rangle .

Линейные операции над векторами евклидова пространства удовлетворяют аксиомам 1–8 линейного пространства, а операция скалярного умножения векторов удовлетворяет аксиомам 1–4 скалярного произведения. Можно сказать, что евклидово пространство — это вещественное линейное пространство со скалярным произведением. Поскольку евклидово пространство является линейным пространством, на него переносятся все понятия, определенные для линейного пространства, в частности, понятия размерности и базиса.

Евклидово расстояние

Евклидово расстояние — это самый простой метод измерения расстояния для интуитивного понимания.Расстояние в пространстве между двумя точками, которые наша начальная школа, средняя школа и средняя школа, в общем, относится к евклидову расстоянию.

Евклидово расстояние между точками a (x1, y1) и b (x2, y2) на двумерной плоскости:

Евклидово расстояние между точками a (x1, y1, z1) и b (x2, y2, z2) в трехмерном пространстве:

Евклидово расстояние (два n-мерных вектора) между n-мерными точками пространства a (x11, x12, …, x1n) и b (x21, x22, …, x2n):

Matlab рассчитывает евклидово расстояние:

Matlab рассчитывает расстояние, используя функцию pdist. Если X является матрицей m × n, то pdist (X) принимает каждую строку матрицы X как n-мерный вектор строк, а затем вычисляет расстояние между этими m векторами.

Неравенство Коши-Буняковского

Для любых векторов \mathbf и \mathbf евклидова пространства \mathbb выполняется неравенство Коши-Буняковского :

В самом деле, для любого действительного числа \lambda и любых векторов \mathbf и \mathbf справедливо неравенство:

Следовательно, дискриминант квадратного трехчлена (переменной \lambda ) не больше нуля, т.е. 4 \langle \mathbf,\mathbf\rangle^2-4 \langle \mathbf,\mathbf\rangle \cdot \langle \mathbf,\mathbf\rangle \leqslant0 . Отсюда следует (8.25). Заметим, что равенство нулю дискриминанта возможно только в случае существования такого корня \lambda , для которого \langle \mathbf-\lambda \mathbf, \mathbf-\lambda \mathbf\rangle=0 . Это условие равносильно коллинеарности векторов \mathbf и \mathbf\colon \mathbf=\lambda\cdot \mathbf . Напомним, что ненулевые векторы \mathbf и \mathbf называются коллинеарными, если существует такое число \lambda , что \mathbf=\lambda\cdot \mathbf . Нулевой вектор считается коллинеарным любому вектору. Неравенство Коши-Буняковского выполняется как равенство только для коллинеарных векторов и как строгое неравенство для неколлинеарных.

Примеры вычислений скалярного произведения

Пример 1.

Вычислите скалярное произведение двух векторов →a и →b, если их длины равны 3 и 7 единиц соответственно, а угол между ними равен 60 градусам.

У нас есть все данные, чтобы вычислить скалярное произведение по определению:

(→a,→b) = →|a| * →|b| * cos(→a,→b) = 3 * 7 cos60° = 3 * 7 * 1/2 = 21/2 = 10,5.

Ответ: (→a,→b) = 21/2 = 10,5.

Пример 2.

Найти скалярное произведение векторов →a и →b, если →|a| = 2, →|b| = 5, ∠(→a,→b) = π/6.

Используем формулу →a * →b = →|a| * →|b| * cosα.

В данном случае:

→a * →b = →|a| * →|b| * cosα = 2 * 5 * cosπ/6 = 10 * √3/2 = 5√3

Пример 3.

Как найти скалярное произведение векторов →a = 7*→m + 3*→n и →b = 5*→m + 8*→n, если векторы →m и →n перпендикулярны и их длины равны 3 и 2 единицы соответственно.

По свойству дистрибутивности скалярного произведения имеем

Сочетательное свойство позволяет нам вынести коэффициенты за знак скалярного произведения:

В силу свойства коммутативности последнее выражение примет вид

Итак, после применения свойств скалярного произведения имеем

Осталось применить формулу для вычисления скалярного произведения через длины векторов и косинус угла между ними:

Пример 4.

В правильной треугольной призме ABCA1B1C1, все ребра которой равны 1, найти косинус угла между прямыми AB1 и BC1.

  1. Введем систему координат.

Если сделать выносной рисунок основания призмы, получим понятный плоскостной рисунок с помощью которого можно легко найти координаты всех интересующих точек.

Точка А имеет координаты (0;0;0). Точка С — (1;0;0). Точка В — (1/2;√3/2;0). Тогда точка В1 имеет координаты (1/2;√3/2;1), а точка С1 – (1;0;1).
Найдем координаты векторов →AB1 и →BC1:

Найдем длины векторов →AB1 и →BC1:

Найдем скалярное произведение векторов →AB1 и →BC1:

Найдем косинус угла между прямыми AB1 и BC1:

Пример 5.

а) Проверить ортогональность векторов: →a(1; 2; -4) и →b(6; -1; 1) .

б) Выяснить, будут ли перпендикулярными отрезки KL и MN, если K(3;5), L(-2;0), M(8;-1), N(1;4).

а) Выясним, будут ли ортогональны пространственные векторы. Вычислим их скалярное произведение: →ab = 1*6 + 2*(-1) + (-4)*1 = 0, следовательно

б) Здесь речь идёт об обычных отрезках плоскости, а задача всё равно решается через векторы. Найдем их: →KL(-2-3; 0-5) = →KL(-5; -5), →MN(1-8; 4-(-1)) = →MN(-7;5)

Вычислим их скалярное произведение: →KL*→MN = -5*(-7) + (-5)*5 = 10 ≠ 0, значит, отрезки KL и MN не перпендикулярны.

Обратите внимание на два существенных момента:

В данном случае нас не интересует конкретное значение скалярного произведения, важно, что оно не равно нулю.
В окончательном выводе подразумевается, что если векторы не ортогональны, значит, соответствующие отрезки тоже не будут перпендикулярными. Геометрически это очевидно, поэтому можно сразу записывать вывод об отрезках, что они не перпендикулярны.. Ответ: а) →a перпендикулярно →b, б) отрезки KL, MN не перпендикулярны

Ответ: а) →a перпендикулярно →b, б) отрезки KL, MN не перпендикулярны.

Пример 6.

Даны три вершины треугольника A(-1; 0), B(3; 2), C(5; -4). Найти угол при вершине B — ∠ABC.

По условию чертеж выполнять не требуется, но для удобства можно сделать:

Требуемый угол ∠ABC помечен зеленой дугой

Сразу вспоминаем школьное обозначение угла: ∠ABC — особое внимание на среднюю букву B — это и есть нужная нам вершина угла. Для краткости можно также записать просто ∠B

Из чертежа видно, что угол ∠ABC треугольника совпадает с углом между векторами →BA и →BC, иными словами: ∠ABC = ∠(→BA; →BC).

Вычислим скалярное произведение:

Вычислим длины векторов:

Найдем косинус угла:

Когда такие примеры не будут вызывать трудностей, можно начать записывать вычисления в одну строчку:

Полученное значение не является окончательным, поэтому нет особого смысла избавляться от иррациональности в знаменателе.

Найдём сам угол:

Если посмотреть на чертеж, то результат действительно похож на правду. Для проверки угол также можно измерить и транспортиром.

Ответ: ∠ABC = arccos(1/5√2) ≈1,43 рад. ≈ 82°

Важно не перепутать, что в задаче спрашивалось про угол треугольника, а не про угол между векторами. Поэтому указываем точный ответ: arccos(1/5√2) и приближенное значение угла: ≈1,43 рад

≈ 82°, которое легко найти с помощью калькулятора.

А те, кому мало и хочется еще порешать, могут вычислить углы ∠A, ∠C, и убедиться в справедливости канонического равенства ∠A + ∠B + ∠C = 180°.

Понравилась статья? Поделиться с друзьями:
Карта знаний
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: