Пусть в результате
эксперимента (наблюдения) мы регистрируем (при точном знании величины «сопутствующей» переменной
значение
функции
) со случайной ошибкой
(см. также (3.9)):

Требуется по наблюдениям
как можно точнее оценить параметры
. В отличие от предыдущих схем оценивания (см. п. 8.6.1, 8.6.2) в данном случае мы не обязаны задаваться общим видом закона распределения ошибок
(а следовательно, и случайных величин
).
Метод наименьших квадратов определяет оценку
неизвестного параметра
из условия

При весьма общих предположениях о природе случайных ошибок
и структуре функций
оценки, удовлетворяющие соотношению (8.27), являются состоятельными, асимптотически-несмещенными, асимптотически-нормальными и асимптотически-эффективными (см., например, [71, гл. 4]). Укажем здесь лишь некоторые основные требования к
, соблюдение которых обеспечивает хорошие свойства оценок по методу наименьших квадратов:
а) случайные остатки
имеют нулевые средние значения
и одинаковые конечные дисперсии
не зависящие ни от номера наблюдения i, ни от параметра 
б) функция
непрерывна и дифференцируема по всем параметрам 
Способ вычисления оценок наименьших квадратов
опирается на тот факт, что если
является точкой минимума критерия

то оценки
должны удовлетворять системе так называемых нормальных уравнений:

Или, что то же, оценки наименьших квадратов
неизвестных параметров
определяются как решение системы уравнений:

Представим описанные результаты в частном случае, когда функция является линейной и по сопутствующим переменным X, и по параметрам 0. Вновь «возвращаясь к матричным обозначениям гл. 3, а именно вводя в рассмотрение матрицу наблюдений (или «матрицу плана»)

и вектор-столбцы наблюдений исследуемой зависимой переменной
и остаточных случайных компонент
имеем (см. также (3.5))
. Соответственно

а система нормальных уравнений имеет вид

Матричная запись решения этой системы дает

Геометрическая интерпретация мнк-оценок в линейном случае.
Рассмотрим
-мерное пространство векторов
введем в нем расстояние
между двумя векторами
положив

В пространстве
выделим линейное подпространство Т, натянутое на вектор-столбцы матрицы X, или, что то же самое, подпространство, образованное всеми векторами вида
, где
. Очевидно, что размерность Т совпадает с
— рангом X, а потому не превосходит
и равна
только тогда, когда
. Обозначим через S совокупность векторов в
каждый из которых перпендикулярен подпространству Т. Размерность S равна
Любой вектор U в
однозначно разлагается на два взаимно перпендикулярных слагаемых:

таких, что
. При этом
является проекцией U на
— проекцией U на 
Оценка по методу наименьших квадратов (мнк-оценка)
дает такое значение вектору
, при котором длина вектора остатков
минимальна, а это означает, что поиск мнк-оценки соответствует проектированию Y на Т и что
. Поскольку разложение любого вектора в виде суммы вида (8.30) единственно, величина критерия
имеет одно и то же значение для всех мнк-оценок, о чем уже сказано выше.
Рассмотрим теперь более подробно проекции Y на Т и S. Согласно базовому предположению (3.6) вектор ошибок имеет нормальное распределение в
с нулевым средним и дисперсией по любому направлению, равной
Представим его в виде
Тогда

Из (8.32) с учетом размерности S и определения
(см. п. 6.2.1) сразу же следует, что
имеет
-распределение. Отсюда для
может быть предложена несмещенная оценка

Оптимальное свойство мнк-оценок.
В случае, когда
единственная мнк-оценка определяется формулой (8.29), из которой с учетом предположений (3.6) следует, что

т. е. что единственная мнк-оценка является несмещенной (см. § 8.1). Покажем теперь, что среди всех линейных несмещенных оценок векторного параметра
вида
(таких, что
)
имеет наименьшую обобщенную дисперсию (см. п. 5.6.7), равную

Для этого каждую вектор-строку матрицы А спроектируем на подпространства Т и S и из проекций соберем соответственно матрицы
Поскольку
то

Вектор-строки матрицы
принадлежат S, т. е. перпендикулярны вектор-столбцам X, и, следовательно, второе слагаемое в (8.37) равно нулю. С учетом несмещенности
отсюда следует, что векторы
и
должны совпадать при всех значениях
. Это, принимая во внимание ранг X и принадлежность вектор-строк матриц
к подпространству Т, возможно лишь когда

С другой стороны, учитывая разложение (8.3
) для F, получаем, что

так как вектор-строки
принадлежат взаимно перпендикулярным пространствам. Из (8.36), (8.38) и (8.39) следует, что произвольная линейная несмещенная оценка
представима в виде

причем оба слагаемых в правой части (8.4
) лежат в перпендикулярных подпространствах, а потому независимы.
Утверждение об оптимальности мнк-оценки следует сразу же из представления (8.40).
самом деле, ковариационная матрица компонент оценки
равна

где
— некоторая неотрицательно-определенная матрица. Рассмотрим некоторые частные примеры.
1. В частном случае условия проведения наших наблюдений могут оставаться неизменными, тогда анализируемая функция
не будет зависеть от сопутствующей переменной X. Пусть, в частности,
так что
т. е. задача сводится к оценке наблюдаемого со случайной ошибкой параметра
и, быть может, дисперсии этой ошибки
Критерий метода наименьших квадратов в данном примере имеет вид 
Система нормальных уравнений (8.28) (состоящая в данном случае из одного уравнения) имеет вид

откуда

Если дополнительно предположить нормальность ошибки
, то оценка по методу наименьших квадратов
совпадает с оценкой
полученной ранее методом максимального правдоподобия, неизвестного среднего значения нормальной случайной величины.
2. Пусть
причем (т. е. не меняется в ходе наблюдений), а
В качестве наблюдений мы имеем

Требуется оценить по этим наблюдениям параметры
(задачу оценивания параметров в линейной модели парной регрессии, см., например, [6]).
Критерий метода наименьших квадратов в данном примере

Система нормальных уравнений (8.28) запишется:

откуда получаем:

где
как обычно, средние арифметические величин соответственно
.
Подробные сведения о методе наименьших квадратов можно найти, например, в [48], [71].
История развития метода, по-видимому, начинается с работы Лежандра 1805 г. «Новые методы определения орбит комет», в которой был впервые предложен функционал вида (8.27) как критерий качества оценивания.
Первое теоретико-вероятностное обоснование метода наименьших квадратов дано в работах Гаусса в 1809 и 1821 гг. В более общем виде теорема Гаусса о свойствах оценок наименьших квадратов сформулирована и доказана А. Марковым в 1912 г.
Метод наименьших квадратов получил самое широкое распространение в практике статистических исследований в первую очередь благодаря двум главным своим преимуществам: во-первых, он не требует знания закона распределения обрабатываемых наблюдений, во-вторых, он достаточно хорошо разработан в плане вычислительной реализации.