Теорема о существовании корня у непрерывной функции

Если функция f(x) непрерывна на отрезке [a,b] и принимает на его концах значения разных знаков, то на этом отрезке существует по крайне мере корень уравнения (2).

В качестве примера обратимся к уравнению (1), которое предварительно перепишем в виде

f(x)=x-cos(x)=0.

Функция f(x=x-cos(x) непрерывна на отрезке [0,1], а ее значения на концах отрезка имеют разные знаки:

f(0)=-1 <0, f(1)=1-cos(1) >0.

Отсюда сразу следует существование на отрезке [0,1] по крайней мере одного корня уравнения (1). Ранее к этому выводу пришли с помощью наглядных, но математически нестрогих геометрических соображений. Теперь этот вывод – прямое следствие сформулированной теоремы. Она не позволяет определить общего числа коней. Однако в данном случае это легко сделать с помощью дополнительных исследований.

Вычислим производную функцию f(x):

f(x)’=1+sin(x).

В интересующей нас области измерения переменной x: xÎ[0,1] она положительна. Следовательно, функция f(x) на отрезке [0,1] монотонно возрастает и может иметь только один корень.

Метод вилки

В основе метода лежит одно из самых простых и эффективных алгоритмов решения уравнения. Его основу составляет процесс построения по методу «артиллерийской вилки» последовательности вложенных друг в друга отрезков [a_n, b_n]. Их концы образуют две монотонные последовательности, одна из которых { a_n, } («недолеты») сходятся к некоторой точке x =cснизу (a_n<с), вторая { b_n, }(«перелеты») – сверху (b_n>с).При выполнении условий теоремы, сформулированной выше, доказывается, что предельная точка x=c является корнем уравнения. Тем самым оказывается установленным факт существования решения этого уравнения на отрезке [a, b]. Сам процесс построения последовательности вложенных отрезков [a_n, b_n], содержащих искомый корень x=c, позволяет найти его приближенное значение с любой точностью ε.

Описание метода

Предположим для определенности, что функция f(x) принимает на левом конце отрезка [a, b]отрицательное значение, на правом – положительное:

f(a)<0, f(b)>0.

Возьмем среднюю точку отрезка [a, b] ξ= (a+b)/2 и вычислим в ней значение функции f(x). Если f(x)=0, то утверждение теоремы доказано: мы нашли на отрезке [a, b] точку с= ξ, в которой наша функция обращается в нуль. В противном случае, когда f(x)≠0, поступим следующим образом: рассмотрим два отрезка [a, ξ] и [b, ξ] и выберем один из них, исходя из условия, чтобы функция f(x) принимала на его концах значения разных знаков. Выбранный отрезок обозначим [a₁, b₁]. По построению

f(a₁) < 0, f(b₁) >0.

Возьмем среднюю точку отрезка [a₁, b₁] ξ₁= (a₁+b₁)/2 и опять вычислим в ней значение функции f( ξ₁ ). Если f( ξ₁)=0, то доказательство теоремы закончено. В противном случае f(x)≠0, снова рассмотрим два отрезка [a₁, ξ], [b₁, ξ] и выберем тот из них, на концах которого функция f(x) принимает значение разных знаков. Выбранный отрезок обозначим [a₂, b₂].По построению

f(a₂) < 0, f(b₂) >0.

Будем продолжать этот процесс. В результате либо он оборвется на некотором шаге n благодаря тому, что f( ξ_n)=0,либо будет продолжатьсянеограниченно. В первом случае вопрос о существовании корня уравнения решен. Рассмотрим второй случай.

Неограниченное продолжение процесса дает последовательность отрезков [a, b], [a₁, b₁], [a₂, b₂],...Эти отрезки вложены друг в друга: каждый последующий отрезок принадлежит всем предыдущим:

a_n ≤ a_n+1 <b_n+1 ≤b_n (3)

причем

f(a_n) < 0, f(b_n) >0.

Длины отрезков с возрастанием номера n стремятся к нулю:

lim(b_n-a_n)= lim(b-a)/2ⁿ =0

Рассмотрим левые концы отрезков {a_n}. Они образуют монотонную неубывающую ограниченную последовательность. Такая последовательность имеет предел, который мы обозначим через с₁:

lim a_n = c₁

Согласно лемме о переходе к пределу в неравенствах имеем

C₁ ≤ b_n (4)

Теперь рассмотрим правые концы отрезков {b_n}. Они образуют монотонную не возрастающую ограниченную последовательность, которая тоже имеет предел. Обозначим этот предел через с₂:

lim b_n =c₂

Согласно неравенству (4) и лемме эти пределы удовлетворяют неравенству c₁ ≤ c₂.

Итак, a_n ≤ c₁ ≤ c₂ ≤ b_n

и, следовательно, c₂ –c₁ ≤ b_n – a_n =(b-a)/2ⁿ

Таким образом, разность с₂ – с₁ меньше любого наперед заданного положительного числа. Это означает, что с₂ – с₁=0, т.е. с₂ = с₁=с

Найденная точка интересна тем, что она является единственной общей точкой для всех отрезков построенной последовательности. Используя непрерывность функции f(x), докажем, что она является корнем уравнения.

Мы знаем, что f(a_n) ≤ 0. Согласно определению непрерывности и возможности предельного перехода в неравенствах имеем

f(c)= lim f(a_n) ≤ 0 (5)

Аналогично, учитывая, что f(b_n) ≥ 0.,получаем

f(c)= lim f(b_n) ≥ 0.,. (6)

Из (5) и (6) следует, что

f(c)= 0,

т.е. с – корень уравнения. Теорема доказана.

Процесс построения последовательности вложенных стягивающих отрезков методом вилки является эффективным вычислительным алгоритмом решения уравнения. На n -м шаге процесса получаем

a_n ≤ c.

Это двойное неравенство показывает, что число a_n определяет искомый корень с с недостатком, а число b_n – с избытком, с ошибкой, не превышающей длину отрезка ∆_n = b_n – a_n = (b-a)/2ⁿ.При увеличении n ошибка стремится к нулю по закону геометрической прогрессии со знаменателем q=1/2. Если задана необходимая точность ε (ε>0), то чтобы ее достигнуть, достаточно сделать число шагов N, удовлетворяющее условию:

N>log₂ ((b-a)/ ε).

Пример. Рассмотрим отапливаемое помещение, которое имеет наружные ограждения площадью F = 50 м², сопротивление теплопередачи составляет R=2,5 м² ^оС/Вт. В помещении установлен отопительный прибор, поверхность которого составляет А=1,5 м², температура подающей воды t_г =95 ^оС, а обратной t_об =70 ^оС.

Требуется определить температуру внутреннего воздуха t_в, при температуре наружного воздуха t_н = –20 ^оС?

Для решения поставленной задачи составим уравнение характеризующее баланс тепловой энергии в помещении.

Потери теплоты через ограждающие конструкции могут быть определены по следующей формуле:

q_т.п. =(t_в – t_н)F/R (п1)

Поступление теплоты от нагревательных приборов может быть определено по следующей формуле:

q_пр = А q_ном (Δt_ср. /70)¹⁺ⁿ (п2)

где q_ном – номинальный тепловой поток от отопительного прибора, Вт/м² (q_ном=600 Вт/м²);

Δt_ср.= 0,5(t_г + t_об) –t_в;

n – коэффициент характеризующий теплоотдачу отопительного прибора (n=0,4).

Приравниваем формулу п1 и п2

(t_в – t_н)F/R= А q_ном (Δt_ср. /70)¹⁺ⁿ. (п3)

После подстановки известных величин формула приобретет вид

(t_в +20)50/2,5 =1,5*600*((82,5- t_в)/70)^1,4 (п4)

Решение данного уравнения для определения температуры внутреннего воздуха (t_в) в общим виде представляет определенные затруднения, поэтому воспользуемся методом «вилки». Для этого выполним преобразования. Перенесем все члены уравнения в левую часть

(t_в +20)50/2,5 – 1,5^.600((82,5- t_в)/70)^1,4=0.

Предварительный анализ свидетельствует, что данная функция неразрывна и может приобретать положительные и отрицательные значения.

Определим диапазон, на котором будем искать значение корня. При значении t_в =10 ^oC, значение функции f(10)=-345,3191649. При значении t_в =25 ^oC, значение функции f(25)=216,6546618. Можно утверждать, что на концах отрезка [10, 25] функция будет приобретать противоположные знаки, т.е. корень уравнения будет находиться на данном отрезке. Вычисление выполним в табличной форме.

Таблица 1

N a_n b_n ξ= (a+b)/2 f( ξ_n)

17,5 -61,30462678

17,5 21,25 78,45879455

17,5 21,5 19,5 13,42747243

17,5 19,5 18,5 -23,88430668

18,5 19,5 -5,214785699

19,5 19,25 4,109759286

19,25 19,125 -0,551660239

19,125 19,25 19,1875 1,779262892

19,125 19,1875 19,15625 0,613854653

19,125 19,15625 19,140625 0,031110536

Результаты расчетов, связанных с девяти кратным делением исходного отрезка [10, 25] пополам даны в табл.1. Они определяют корень с с точностью ε < (25-10)/2⁹ < 0,029297.

Мы можем утверждать, что искомый корень уравнения принадлежит отрезку [19,125, 19,15625].

Метод итераций

(метод последовательных приближений)

Предположим, что уравнение можно записать в виде

x=φ(x).

Возьмем произвольное значение x_o из области определения функции φ(x) и будем строить последовательность чисел {x_n}, определенных с помощью рекуррентной формулы:

x_n₊₁ = φ(x_n), n= 0, 1, 2, 3,...

Последовательность {x_n} называется итерационной последо-вательностью. При ее изучении встают два вопроса:

1. Можно ли процесс вычисления чисел x_n продолжать неограниченно, т.е. будут ли числа x_n принадлежать области определения функции φ(x)?

2. Если итерационный процесс бесконечен, то как ведут себя числа x_n при n→ ∞?

При определенных ограничениях на функцию φ(x ) итерационная последовательность является бесконечной и сходится к корню уравнения:

x_n =c, c= φ(c).

Функция φ(x) удовлетворяет на отрезке [a, b] условию Липшица, если существует такая постоянная α, что для любых x₁ и x₂, принадлежащих отрезку [a, b], имеет место неравенство

| φ(x₁)- φ(x₂)| ≤ α | x₁ – x₁ |.

Величину α в этом случае называют постоянной Липшица.

Если функция φ(x) удовлетворяет на отрезке [a, b]условию Липшица, то она непрерывна на этом отрезке.

Пусть x_o - произвольная точка отрезка. Рассмотрим приращение функции φ(x) в этой точке

Δf =f(x_o+ Δx) – f(x_o).

Оценим его с помощью неравенства

| Δf| | ≤ α |Δ x|_.

Таким образом, lim Δf =0, что означает непрерывность функции.

Условие Липшица имеет простой геометрический смысл. Возьмем на графике функции y= f(x) две произвольные точки: М₁ с координатами (x₁, f(x₁)) и М₂ с координатами (x₂, f(x₂)) (рис.3). Напишем уравнение прямой линии, проходящей через эти точки. Оно имеет вид

y=f(x₁)+k(x-x₁),

где k – тангенс угла наклона прямой к оси x –определяется по формуле

k = (f(x₁)- f(x₂))/(x₁ –x₂).

Если функция f(x) удовлетворяет на отрезке [a, b] условию Липшица, то при произвольном выборе точек М₁ и М₂ будем иметь: |k|≤α. Таким образом, с геометрической точки зрения условие Липшица означает ограниченность тангенса угла наклона секущих, проведенных через всевозможные пары точек графика функции y= f(x).

Рис.3. Геометрическая иллюстрация условий Липшица

Сделаем следующий шаг – предположим, что функция f(x) имеет на отрезке [a, b] ограниченную производную: |f’(x)|≤m при xÎ[a, b]. Можно доказать, что в этом случае она удовлетворяет условию Липшица с постоянной α=m. Данное уравнение также имеет простой геометрический смысл- каждой секущей графика функции y= f(x) можно сопоставить параллельную ей касательную (рис.4). Поэтому наибольший тангенс угла наклона секущих не превосходит наибольшего тангенса угла наклона касательных, и его можно оценить той же константой m: |k|≤m. Таким образом, любая функция f(x) с ограниченной производной обязательно удовлетворяет условию Липшица.

Рис. 4. Геометрическая иллюстрация связи условия Липшица с предположением о дифференцируемости функции f(x)

Сходимость итерационной последовательности к корню уравнения может быть использована для приближенного определения этого корня с любой степенью точности. Для этого нужно только провести достаточное число итераций.

Рассмотрим в качестве примера, иллюстрирующего данный метод, уравнение, представленное в примере предыдущего раздела (п4).

(t_в +20)50/2,5 =1,5^.600^.((82,5- t_в)/70)^1,4

Данное уравнение можно представить в следующем виде

t_в =45^.((82,5- t_в)/70)^1,4-20

Роль функции φ(x) в нем играет 45^.((82,5- t_в)/70)^1,4-20. Это – дифференцируемая функция, которая имеет производную на отрезке [10, 25]. / φ’(x) / =0,9((82,5-t_в)/70)^0,4 ≤ 0,9((82,5-10)/70)^0,4

Таким образом, функция удовлетворяет на отрезке [10, 25] условию Липшица с постоянной α=0,9((82,5-10)/70)^0,4 <0,912722.

Результаты вычислений по рекуррентной формуле, которая в нашем случае принимает вид x_n₊₁ =45^.((82,5-x_n)/70)^1,4 -20, даны в табл.2. За нулевое приближение была выбрана средняя точка отрезка x_o =17,5.

Для удобства анализа итерационной последовательности ее члены расположены по два в строке. В результате образовались столбцы членов с четными и нечетными номерами. Сравнивая их между собой, видим, что четные члены меньше нечетных: итерационная последовательность скачет то вверх, то вниз. С возрастанием номера четные члены возрастают, а нечетные – убывают, приближаясь друг к другу. Такое поведение последовательности означает, что корень уравнения лежит между четными и нечетными итерациями, первые дают его значение с недостатком, вторые - с избытком. Это позволяет легко контролировать точность, достигнутую после любого числа итераций: погрешность не превышает разности между последними вычислениями нечетным и четным членами.

Таблица 2

n X_2n X_2n+1

17,5 20,56523134

17,91260145 20,20519447

18,22150871 19,93624264

18,45273279 19,73526403

18,62577857 19,58504337

18,75526581 19,47274218

18,85214805 19,38877819

18,92462892 19,3259953

18,97885068 19,27904717

19,01941101 19,24393831

19,04975081 19,21768218

19,0724448 19,19804602

19,08941941 19,18336044

19,10211583 19,17237717

19,11161219 19,16416274

Мы остановили процесс вычисления на 29-й итерации и можем написать для корня с двойное неравенство:

x₂₈ =19,11161219<c< x₂₉ =19,16416274,

т.е. члены итерационной последовательности x₂₈ и x₂₉ определяют с с недостатком и избытком с погрешностью которая не превышает разность x₂₈ - x₂₉:

ε<Δ₂₉ = x₂₈ - x₂₉ <0,05.

Точность, которой мы достигли после 29 итераций оказалась несколько ниже, чем после 9 шагов в методе вилки. Причина такого различия ясна. В обоих методах погрешность убывает по закону геометрической прогрессии. Для метода вилки знаменатель прогрессии равен ½, он не зависит от вида функции f(x). Для метода итераций знаменатель равен α – постоянная Липшица функции φ(x). В рассматриваемом примере α>1/2, поэтому сходимость итераций медленнее сходимости метода вилки. Это означает, что метод итераций имеет преимущество перед методом вилки с точке зрения скорости сходимости только в том случае, когда α<1/2.

Метод касательных

(метод Ньютона)

Метод касательных связанный с именем Ньютона, является одним из наиболее эффективных численных методов решения уравнений. Идея метода очень проста. Предположим, что функция f(x), имеющая корень с на отрезке [a, b], дифференцируема на этом отрезке и ее производная f`(x) не обращается на нем в нуль. Возьмем произвольную точку x_o и напишем в ней уравнение касательной к графику функции f(x):

y = f(x_o)+f`(x_o)(x-x_o).

График функции f(x) и ее касательной близки около точки касания, поэтому естественно ожидать, что точка x₁ пересечения касательной с осью x будет расположена недалеко от корня с (рис. 5).

Рис. 5. Построение последовательности по методу касательных

Для определения точки x₁ имеем уравнение

f(x _o ) + f `(x _o )(x ₁ -x _o )=0

Таким образом,

x ₁ = x _o - f(x _o )/f `(x _o )

Повторим проделанную процедуру: напишем уравнение касательной к графику функции f(x) при x = x ₁ и найдем для нее точку пересечения x₂ с осью x (рис. 5):

x ₂ = x ₁ - f( x₁ )/f `(x ₁ ).

Продолжая этот процесс, получим последовательность {x_n}, определенную с помощью рекуррентной формулы:

x_n₊ ₁ =x_n - f(x_n)/f `(x_n), n= 0, 1, 2 ,...

При исследовании этой последовательности, как и последовательности метода итераций, встают два вопроса:

1. Можно ли процесс вычисления чисел x_n продолжать неограниченно, т.е. будут ли числа x_n принадлежать отрезку [a, b]?

2. Если итерационный процесс бесконечен, то как ведет себя последовательность {x_n} при n→ ∞?

Теорема о существовании корня у непрерывной функции

Поиск по сайту