Линейная регрессия (функции ЛИНЕЙН, НАКЛОН, ОТРЕЗОК, ПРЕДСКАЗ, ТЕНДЕНЦИЯ)

Так как задача отыскания функциональной зависимости очень важна, в Excel введен набор функций, которые позволяют решать эту задачу. Эти функции основаны на методе наименьших квадратов. В качестве результата выдаются не только коэффициенты аппроксимирующей функции, но и статистические характеристики полученных результатов.

Функция ЛИНЕЙН

Функция ЛИНЕЙН вычисляет коэффициенты m и b прямой линии y=mx+b, которая наилучшим образом аппроксимирует имеющиеся данные, а также дополнительную регрессионную статистику. Функция возвращает массив данных, который описывает полученную прямую. Синтаксис функции:

ЛИНЕЙН(известные_y, [известные_x], [константа], [статистика])

Известные_y. Обязательный аргумент. Множество значений y, которые уже известны для соотношения y=mx+b.
Известные_x. Необязательный аргумент. Множество значений x, которые уже известны для соотношения y=mx+b.
Константа.    Необязательный аргумент. Логическое значение. Если
аргумент Константа = 0, то b принудительно полагается равным нулю, т.е. y=mx.
Статистика.  Необязательный аргумент. Логическое значение.
Если аргумент Статистика = 0 или опущен, то вычисляются только коэффициенты m и b, а если = 1, то выдаются дополнительные статистические характеристики.

Пример 1

Даны x и y: (0, 3), (1, 1), (2, 6), (3, 3), (4, 7). Найти коэффициенты m и b прямой линии y=mx+b, наилучшим образом аппроксимирующей эти данные по критерию наименьших квадратов.

Решение

Подготовим таблицу как показано ниже. Ячейки E2:F6 не заполняйте, они будут заполнены автоматически.

  1. В A2:A6 введены значения x, блоку присвоено имя х.
  2. В В2:В6 введены значения y, блоку присвоено имя y.
  3. В E2:F6 введена табличная формула {=ЛИНЕЙН(y;x;1;1)}. Для того чтобы ввести табличную формулу, надо выделить блок ячеек E2:F6, ввести формулу и нажать комбинацию клавиш Ctrl Shift Enter. Фигурные скобки вводить вручную не надо.

Пояснение к блоку статистических результатов функции Линейн.

  1. В E2 записан коэффициент m, в F2 — коэффициент b.
  2. В E3:F3 стандартные отклонения для этих коэффициентов.
  3. В E4 записан так называемый коэффициент детерминации R2. Этот коэффициент лежит на отрезке [0; 1]. Считается, что чем ближе этот коэффициент к 1, тем лучше регрессионное уравнение описывает зависимость. Иногда к такой интерпретации надо относиться с осторожностью.
  4. В F4 находится стандартная ошибка для оценки у.
  5. В E5 записано значение F-статистики, а в F5 — количество степеней свободы.
  6. В E6:F6 записана регрессионная сумма квадратов (10) и остаточная сумма квадратов (14).

Функция НАКЛОН

Функция НАКЛОН вычисляет коэффициент m — тангенс угла наклона прямой регрессии. Например:   =НАКЛОН(y;x)

Функция ОТРЕЗОК

Функция ОТРЕЗОК вычисляет коэффициент b — отрезок, отсекаемый прямой на оси ординат. Например: =ОТРЕЗОК(y;x)

Функция ПРЕДСКАЗ

Вычисляет или предсказывает будущее значение по существующим значениям. Предсказываемое значение — это y-значение, соответствующее заданному x-значению. x- и y-значения — известны; новое значение предсказывается с использованием линейной регрессии. Этой функцией можно воспользоваться для прогнозирования.

ПРЕДСКАЗ(x;известные_y;известные_x)

x — точка данных, для которой предсказывается значение.

Функция ТЕНДЕНЦИЯ

Возвращает значения в соответствии с линейным трендом. Аппроксимирует прямой линией (по методу наименьших квадратов) массивы «известные_y» и «известные_x». Возвращает значения y, соответствующие этой прямой для заданного массива «новые_x».

ТЕНДЕНЦИЯ(известные_y;[известные_x];[новые_x];[константа])

Новые_x — новые значения x, для которых функция ТЕНДЕНЦИЯ возвращает соответствующие значения y.

Не забывайте, что функция ТЕНДЕНЦИЯ может возвращать массив результатов, поэтому для неё надо указывать блок ячеек и вводить как табличную формулу.

Пример 2.

Постройте таблицу по образцу. В примечаниях показаны имена ячеек или формулы. В A5:A9 известныеX, в B5:B9 известныеY. Блоку A5:A12 присвоено имя Х. Рассчитайте Предсказ, Тенденцию и  прямую mx+b.

Постройте диаграмму по образцу. На диаграмме видно, что прямая пересекает ось ординат в точке 2 (b=2), а наклон прямой равен 45° (m=1). Прямые Предсказ, Тенденция и mx+b слились в одну линию.