Итерационные методы решения систем нелинейных уравнений
Следовательно,
Таким образом, имеет место неравенство
(3.3)
По предположению индукции . Поскольку в силу условия 4)
, то
Это значит, что для , и шаг индукции реализован. Превое утверждение теоремы доказано.
Продолжим доказательство. Положим перепишем оценку (3.3) после умножения на в виде . Покажем, что
(3.4)
Будем рассуждать по индукции. При неравенство (3.4.) очевидно. Допустим, что оно справедливо для некоторого . Тогда
Переход завершен, т.е. неравенство (3.4) справедливо для всех . Перепишем его в исходных обозначениях
Получили утверждение 3). При этом
, т.е. .
Это значит, что имеет место сходимость:
Замечание 1. Неравенство (3.3) при условии означает, что последовательность сходится к решению с квадратичной скоростью.
Замечание 2. Поскольку , то из утверждения 3) следует оценка погрешности метода Ньютона
Теорема. Если fi(x) непрерывны, вместе с первыми производными в выпуклой области G, содержащей решение системы и при матрица Fx не вырождена, то существует такая окрестность что при любом метод Ньютона сходится к .
Доказательство. Рассмотрим
Введем и матрицу и матрицу. Очевидно, что F(x,x)= F(x), то есть имеем
(12)
Есть тождества
Тогда.
Вблизи окрестности для любого найдется такое x0, что если,. то
Тогда
На начальное приближение x0 наложено труднопроверяемое условие.
Теорема Канторовича. Если функции fi(x) непрерывны вместе со своими 1 -ми и 2 -ми производными в некоторой выпуклой области G, содержащей точку x0 вместе с ее окрестностью и выполнены следующие условия:
в точке x0 существует матрица F-1 такая
то последовательность xk+1=xk-f-1x(xk)F(xk) сходится к .является единственным решением системы f(x)=0 в области и имеет место оценка
Докажем 3 неравенства
а)
б)
в)
б)
в)
т.е. матрица F-1x(x0)Fx(x1) невырождена, и
и
Fx(x0)(x1-x0)+f(x0)=0
Покажем, что при всех k имеют место неравенства:
(А)
Пусть имеет место m=k-1
Повторим неравенства
Неравенство (А) показывает, что в круге R последовательность xk является фундаментальной, т.е. имеется предел.
Оценим сходимость
т.е.,
устремляя правая часть не меняется,, т.е. при очень хорошая сходимость.
2.3.1 Модификации метода ньютона
1. Вычисления в методе Ньютона гораздо сложнее, чем при простых итерациях, т.к. на каждой итерации требуется находить матрицу производных и решать систему линейных уравнений. Поэтому рекомендуется такой приём: матрица Якоби вычисляется только на начальном приближении. Однако сходимость при этом видоизменении становится линейной, причём обычно не с малой константой, ибо матрица производных на начальной итерации может заметно отличаться от окончательной. Поэтому скорость сходимости заметно уменьшается и требуемое сисло итераций возрастает.
2. В ещё одной модификации итерационную формулу метода Ньютона вводится параметр следующим образом
На каждой итерации находится так, чтобы уменьшить невязку уравнения (3.1), т.е. выполнить неравенство
(3.5)
Проведём обоснование такой процедуры в евклидовой норме.
Ведём в рассмотрение функцию-невязку для уравнения (3.1)
Найдём градиент , используя представление
С этой целью выделим главный член приращения
Следовательно, по определению
Обозначим и найдём производную функции в точке по направлению :
если .
Таким образом, – есть направление спуска для функции в точке для малых . Это значит, что выбор шага согласно условию (3.5) возможен.
2.3.2 Квазиньютоновкие методы
Одним из недостатков метода Ньютона является необходимость вычислять матрицу Якоби и решать систему линейных алгебраических уравнений. Это требует значительных расходов машинных действий, объём которых резко возрастает с увеличением размерности системы. Поэтому были разработаны модификации метода Ньютона, в которых на протяжении итерационного процесса вместо построения самой матрицы Якоби или её обратной строится их аппроксимация. Это позволяет существенно сократить количество арифметических действий на итерации. Такие методы решения систем нелинейных уравнений получили название квазиньютоновских. Большинство известных квазиньютоновских методов сходится локально с надлинейной скоростью сходимости при тех самых предположениях о свойствах функции , которые были сделаны при использовании метода Ньютона, который имеет квадратичную скорость сходимости. Квазиньютоновские методы можно разделить на два тесно связанных между собой класса методов в зависимости от того, что аппроксимируется - матрица Якоби или ей обратные.
Рассмотрим первый из классов, где матрица Вк с размерами п х п аппроксимирует матрицу . Перед началом итераций задают начальную точку а матрицу Во обычно получают, или допуская, что она является единичной, или аппроксимируя конечно-разностными формулами. Потом для k = 0, 1.... вычисляют
Где — n- мерный вектор, который является параметром рассматриваемого класса методовв. Если взять таким, что равняется ,то будем иметь первый метод Бройдена. Выбор соответствует методу Пирсона, а — симметрическому методу первого ранга.
Во втором из рассматриваемых здесь классов квазиньютоновских методов матрица с размерами п х п аппроксимирует матрицу . Перед началом итерации задают начальную точку х{0) и матрицу , которая обычно или равна единичной, или является обратной к конечно-разностной аппроксимации . Потом вычисляют
где — n-мерный вектор, который является параметром рассматриваемого класса методов. Конкретный вид вектора отвечает соответствующему методу: например, — второму методу Бройдена, — методу Мак-Кормика.
Заметим, что если задать то можно вести перерасчет не Вк, а матриц по формуле
(3.30)
эквивалентной (3.27). Это требует порядка 0(п2) арифметических действий вместо 0(п3), необходимых для решения системы линейных уравнений .
Как видно из (3.30), между формулами (3.27) и (3.29) имеет место определенная связь. Так.если , то при . Таким образом, один и тот же метод может реализоваться двумя разными формулами (3.27) и (3.29), которые эквивалентные теоретически, но их численная реализация может отличаться по эффективности.
Рассмотрим, например, первый метод Бройдена. Его можно реализовать по формуле (3.27) так, что это потребует в общем 0(n3) арифметических действий. Это оказывается возможным, если подать матрицу Вк в виде произведения , где — ортогональная, а — верхняя треугольная матрица. Действительно, в этом случае решение системы нуждается в только 0(n3) арифметических действий. Имея, на представление матрицы Вк+1, которая удовлетворяет (3.27) в виде , необходимо 0(п2) арифметических действий. Важное преимущество формулы (3.27) перед (3.39) заключается в том, что в (3.27) нет необходимости умножения матрицы на вектор, поскольку
Существуют квазиньютоновские методы, которые учитывают симметричность матрицы Якоби и вырабатывают последовательность симметричных матриц Вк, (или). Эти методы также можно разделить на два класса. В первом из них матрица Вк аппроксимирует F(х). В отличие от описанного выше класса, который задается формулами (3.26) и (3.27), здесь нужна симметричность матрицы Во, и вместо (3.27) используется формула
где значение параметра отвечает симметричному варианту Пауелла методу Бройдена, а — методу Давидона - Флечера - Пауелла.
Во втором из рассматриваемых классов квазиньютоновских методов матрица Нк аппроксимирует матрицу . Здесь матрица Но должна быть симметричной, а вместо (3.29) используется формула
Где соответствует методу Бройдена-Флечера-Голвдфарба-Шенно, что является одним из наилучших (с вычислительной точки зрения), который учитывает симметричность матрицы Якоби.
Описанные выше квазиньютоновские методы сходятся лишь при достаточно хорошом начальном приближении х(0). Для расширения области их сходимости можно использовать прием, который имеет название одномерного поиска.
Пусть имеем квазиньютоновское направление (или ). Используем длину шага = 1 и проверим неравенство
(3.34)
где - евклидовая норма. Если оно выполняется, то заканчиваем одномерный поиск и считаем
(3.35)
т.е. уменьшаем длину шага (устанавливая, например, ), пока не выполнится (3.34). На этом заканчиваем одномерный поиск и переходим к формуле (3.35).
Как видим, одномерный поиск (в случае успеха) обеспечивает монотонное уменьшение нормы отклонения с ростом к. Если квазиньютоновское направление сильно отличается от ньютоновского, то одномерный поиск может оказаться неудачным, и тогда необходимо возобновить матрицу Вк, (или)., приравняв ее, например, конечно-разносной аппроксимации матрицы Якоби (или ). Критерием окончания итераций для квазиньютоновских методов есть неровность
3. Другие итерационные методы решения систем нелинейных уравнений
3.1 Метод Пикара
Существуют также итерационные методы решения систем нелинейных уравнений, которые учитывают вид конкретной системы.
Так, если в уравнениях системы можно выделить линейную l(X) и нелинейную g(X)части функций fi(X) = li(X) + gi(x), то удобней применить к ней метод Пикара.
В таком случае систему уравнений можно записать в виде
li(X) = - gi(X), i=1,2,3...n;
или в векторной форме A X= - G(X);
где A- матрица коэффициентов