Nierówność między średnimi potęgowymi

Nierówność między średnimi potęgowymi (nierówność między średnimi uogólnionymi) – jedna z klasycznych nierówności mówiąca o własnościach średniej potęgowej. Jest ona uogólnieniem nierówności Cauchy’ego między średnimi, sama zaś jest uogólniana przez nierówność Muirheada.

Definicja i twierdzenie

Sprzątanie Wikipedii
Tę sekcję należy dopracować:
Dokładne sprawdzenie przypadku x i = 0. {\displaystyle xi=0.} Może rozszerzenie twierdzenia i dowodu na x i 0 {\displaystyle xi\geqslant 0} przez przyjęcie p 0 , x i = 0 , μ p = 0 {\displaystyle p\leqslant 0,xi=0,\mu p=0} (z granicy x→0)?.
Dokładniejsze informacje o tym, co należy poprawić, być może znajdują się w dyskusji tej sekcji.
Po wyeliminowaniu niedoskonałości należy usunąć szablon {{Dopracować}} z tej sekcji.

Średnią potęgową rzędu p {\displaystyle p} liczb x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} definiuje się jako:

  • μ p ( x 1 , x 2 , , x n ) = ( x 1 p + x 2 p + + x n p n ) 1 / p {\displaystyle \mu _{p}(x_{1},x_{2},\dots ,x_{n})=\left({\frac {x_{1}^{p}+x_{2}^{p}+\ldots +x_{n}^{p}}{n}}\right)^{1/p}} dla p R { 0 } , {\displaystyle p\in \mathbb {R} \setminus \{0\},}
  • μ 0 ( x 1 , x 2 , , x n ) = x 1 x 2 x n n , {\displaystyle \mu _{0}(x_{1},x_{2},\dots ,x_{n})={\sqrt[{n}]{x_{1}\cdot x_{2}\cdot \ldots \cdot x_{n}}},}
  • μ ( x 1 , x 2 , , x n ) = min ( x 1 , x 2 , , x n ) , {\displaystyle \mu _{-\infty }(x_{1},x_{2},\dots ,x_{n})=\min(x_{1},x_{2},\dots ,x_{n}),}
  • μ + ( x 1 , x 2 , , x n ) = max ( x 1 , x 2 , , x n ) . {\displaystyle \mu _{+\infty }(x_{1},x_{2},\dots ,x_{n})=\max(x_{1},x_{2},\dots ,x_{n}).}

Przykładowo, dla p = 1 {\displaystyle p=1} otrzymujemy średnią arytmetyczną, dla p = 0 {\displaystyle p=0} średnią geometryczną, dla p = 1 {\displaystyle p=-1} średnią harmoniczną, dla p = 2 {\displaystyle p=2} średnią kwadratową.

Twierdzenie

Niech p < q + {\displaystyle -\infty \leqslant p<q\leqslant +\infty } i niech dane będzie n {\displaystyle n} liczb x 1 , x 2 , , x n > 0 {\displaystyle x_{1},x_{2},\dots ,x_{n}>0} (jeśli ograniczamy się do rzędów p , q > 0 , {\displaystyle p,q>0,} można przyjąć x 1 , x 2 , , x n 0 {\displaystyle x_{1},x_{2},\dots ,x_{n}\geqslant 0} ).

Wówczas średnia potęgowa rzędu p {\displaystyle p} liczb x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} jest nie większa od ich średniej potęgowej rzędu q , {\displaystyle q,} czyli

μ p ( x 1 , , x n ) μ q ( x 1 , , x n ) . {\displaystyle \mu _{p}(x_{1},\dots ,x_{n})\leqslant \mu _{q}(x_{1},\dots ,x_{n}).}

Ponadto równość w powyższym wyrażeniu zachodzi wtedy i tylko wtedy, gdy liczby x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} są wszystkie równe.

Wniosek

Dla dowolnych liczb dodatnich x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} funkcja

R t μ t ( x 1 , x 2 , , x n ) R {\displaystyle \mathbb {R} \ni t\mapsto \mu _{t}(x_{1},x_{2},\dots ,x_{n})\in \mathbb {R} }

jest funkcją niemalejącą. Więcej: można pokazać, że jest stała lub ściśle rosnąca.

Przykład

Udowodnimy korzystając z powyższej nierówności, że

jeśli a , b , c > 0 {\displaystyle a,b,c>0} oraz a 3 + b 3 + c 3 = 81 , {\displaystyle a^{3}+b^{3}+c^{3}=81,} to a + b + c 9. {\displaystyle a+b+c\leqslant 9.}

W tym celu zauważmy, że na mocy nierówności między średnimi potęgowymi rzędów 1 oraz 3 mamy

a + b + c 3 ( a 3 + b 3 + c 3 3 ) 1 3 = 27 3 = 3 , {\displaystyle {\frac {a+b+c}{3}}\leqslant \left({\frac {a^{3}+b^{3}+c^{3}}{3}}\right)^{\frac {1}{3}}={\sqrt[{3}]{27}}=3,}

co jest równoważne nierówności, którą mieliśmy udowodnić.

Dowód

Na potrzeby wszystkich dowodów dla uproszczenia zakładamy, że wagi w i {\displaystyle w_{i}} spełniają warunki:

w i ( 0 ; 1 ] {\displaystyle w_{i}\in (0;1]}
i = 1 n w i = 1 {\displaystyle \sum _{i=1}^{n}w_{i}=1}

Średnia geometryczna

Dla dowolnego q {\displaystyle q} nierówność między średnią rzędu q {\displaystyle q} i średnią geometryczną możemy przekształcić w następujący sposób:

i = 1 n x i w i i = 1 n w i x i q q {\displaystyle \prod _{i=1}^{n}x_{i}^{w_{i}}\leqslant {\sqrt[{q}]{\sum _{i=1}^{n}w_{i}x_{i}^{q}}}}
i = 1 n w i x i q q i = 1 n x i w i {\displaystyle {\sqrt[{q}]{\sum _{i=1}^{n}w_{i}x_{i}^{q}}}\leqslant \prod _{i=1}^{n}x_{i}^{w_{i}}}

(pierwsza nierówność jest prawdziwa dla q > 0 , {\displaystyle q>0,} druga w przeciwnym wypadku)

podnosimy obustronnie do potęgi q : {\displaystyle q{:}}

i = 1 n x i w i q i = 1 n w i x i q {\displaystyle \prod _{i=1}^{n}x_{i}^{w_{i}\cdot q}\leqslant \sum _{i=1}^{n}w_{i}x_{i}^{q}}

i w obu przypadkach otrzymujemy nierówność między ważoną średnią arytmetyczną i geometryczną dla ciągu x i q , {\displaystyle x_{i}^{q},} którą możemy udowodnić przy użyciu nierówności Jensena, korzystając z wklęsłości funkcji logarytmicznej:

i = 1 n w i log ( x i ) log i = 1 n w i x i {\displaystyle \sum _{i=1}^{n}w_{i}\log(x_{i})\leqslant \log \sum _{i=1}^{n}w_{i}x_{i}}
log i = 1 n x i w i log i = 1 n w i x i {\displaystyle \log \prod _{i=1}^{n}x_{i}^{w_{i}}\leqslant \log \sum _{i=1}^{n}w_{i}x_{i}}

Po złożeniu obu stron nierówności z (rosnącą) funkcją wykładniczą x e x {\displaystyle x\to e^{x}} uzyskuje się żądaną nierówność:

i = 1 n x i w i i = 1 n w i x i . {\displaystyle \prod _{i=1}^{n}x_{i}^{w_{i}}\leqslant \sum _{i=1}^{n}w_{i}x_{i}.}

Stąd dla dowolnego dodatniego q {\displaystyle q} zachodzi:

i = 1 n w i x i q q i = 1 n x i w i i = 1 n w i x i q q {\displaystyle {\sqrt[{-q}]{\sum _{i=1}^{n}w_{i}x_{i}^{-q}}}\leqslant \prod _{i=1}^{n}x_{i}^{w_{i}}\leqslant {\sqrt[{q}]{\sum _{i=1}^{n}w_{i}x_{i}^{q}}}}

tym samym udowodniliśmy nierówność między dowolną średnią potęgową a średnią geometryczną.

Średnia geometryczna jako granica

Możemy ponadto udowodnić, że średnia geometryczna jest granicą średnich potęgowych dla rzędu dążącego do zera. W pierwszej kolejności udowodnimy granicę:

lim p 0 log ( i = 1 n w i x i p ) p = i = 1 n w i log ( x i ) {\displaystyle \lim _{p\to 0}{\frac {\log \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)}{p}}=\sum _{i=1}^{n}w_{i}\log(x_{i})}

Granice licznika i mianownika są, odpowiednio, równe 0, więc z reguły de l’Hospitala wynika, iż:

lim p 0 log ( i = 1 n w i x i p ) p = lim p 0 1 i = 1 n w i x i p ( i = 1 n w i x i p ) = {\displaystyle \lim _{p\to 0}{\frac {\log \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)}{p}}=\lim _{p\to 0}{\frac {1}{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}\cdot \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)'=}
= 1 i = 1 n w i lim p 0 i = 1 n ( w i log ( x i ) x i p ) = i = 1 n w i log ( x i ) {\displaystyle ={\frac {1}{\sum _{i=1}^{n}w_{i}}}\cdot \lim _{p\to 0}\sum _{i=1}^{n}(w_{i}\cdot \log(x_{i})\cdot x_{i}^{p})=\sum _{i=1}^{n}w_{i}\log(x_{i})}

Następnie korzystając z ciągłości funkcji wykładniczej:

lim p 0 i = 1 n w i x i p p = lim p 0 exp ( log ( i = 1 n w i x i p ) p ) = exp ( lim p 0 log ( i = 1 n w i x i p ) p ) = exp ( i = 1 n w i log ( x i ) ) = i = 1 n x i w i {\displaystyle \lim _{p\to 0}{\sqrt[{p}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}=\lim _{p\to 0}\exp \left({\frac {\log \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)}{p}}\right)=\exp \left(\lim _{p\to 0}{\frac {\log \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)}{p}}\right)=\exp \left(\sum _{i=1}^{n}w_{i}\log(x_{i})\right)=\prod _{i=1}^{n}x_{i}^{w_{i}}}

co kończy dowód.

Nierówność między dowolnymi średnimi potęgowymi

Chcemy udowodnić, że dla dowolnych p < q {\displaystyle p<q} zachodzi:

i = 1 n w i x i p p i = 1 n w i x i q q {\displaystyle {\sqrt[{p}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}\leqslant {\sqrt[{q}]{\sum _{i=1}^{n}w_{i}x_{i}^{q}}}}

w przypadku kiedy p {\displaystyle p} jest ujemne, a q {\displaystyle q} dodatnie, nierówność jest równoważna nierówności udowodnionej wcześniej:

i = 1 n w i x i p p i = 1 n x i w i i = 1 n w i x i q q {\displaystyle {\sqrt[{p}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}\leqslant \prod _{i=1}^{n}x_{i}^{w_{i}}\leqslant {\sqrt[{q}]{\sum _{i=1}^{n}w_{i}x_{i}^{q}}}}

Udowodnijmy zatem nierówność dla dodatnich p {\displaystyle p} i q . {\displaystyle q.}

Weźmy funkcję f : R + R + , {\displaystyle f\colon \mathbb {R_{+}} \to \mathbb {R_{+}} ,} f ( x ) = x q p . {\displaystyle f(x)=x^{\frac {q}{p}}.} Oczywiście f {\displaystyle f} jest rosnąca, bo q {\displaystyle q} / p {\displaystyle p} jest dodatnie. Jest to funkcja potęgowa, ma zatem drugą pochodną: f ( x ) = ( q p ) ( q p 1 ) x q p 2 , {\displaystyle f''(x)=\left({\frac {q}{p}}\right)\left({\frac {q}{p}}-1\right)x^{{\frac {q}{p}}-2},} która jest zawsze dodatnia, bo q {\displaystyle q} > p , {\displaystyle p,} z czego wynika wypukłość f . {\displaystyle f.}

Z nierówności Jensena uzyskujemy wobec tego:

f ( i = 1 n w i x i p ) i = 1 n w i f ( x i p ) {\displaystyle f\left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)\leqslant \sum _{i=1}^{n}w_{i}f(x_{i}^{p})}
i = 1 n w i x i p p q i = 1 n w i x i q {\displaystyle {\sqrt[{\frac {p}{q}}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}\leqslant \sum _{i=1}^{n}w_{i}x_{i}^{q}}

po wyciągnięciu obustronnie pierwiastka q {\displaystyle q} -tego stopnia (funkcja rosnąca, bo q {\displaystyle q} > 0) uzyskujemy żądaną nierówność dla dodatnich p {\displaystyle p} i q : {\displaystyle q{:}}

i = 1 n w i x i p p i = 1 n w i x i q q {\displaystyle {\sqrt[{p}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}\leqslant {\sqrt[{q}]{\sum _{i=1}^{n}w_{i}x_{i}^{q}}}}

Jeśli rozważamy rzędy p , q {\displaystyle p,q} ujemne, wówczas x i > 0 , {\displaystyle x_{i}>0,} więc można podstawiając x i := 1 x i {\displaystyle x_{i}:={\tfrac {1}{x_{i}}}} bez straty ogólności uzyskać:

i = 1 n w i x i p p i = 1 n w i x i q q {\displaystyle {\sqrt[{p}]{\sum _{i=1}^{n}{\frac {w_{i}}{x_{i}^{p}}}}}\leqslant {\sqrt[{q}]{\sum _{i=1}^{n}{\frac {w_{i}}{x_{i}^{q}}}}}}

Podnosimy obustronnie do potęgi -1 (funkcja malejąca):

i = 1 n w i x i p p = 1 i = 1 n w i 1 x i p p 1 i = 1 n w i 1 x i q q = i = 1 n w i x i q q {\displaystyle {\sqrt[{-p}]{\sum _{i=1}^{n}w_{i}x_{i}^{-p}}}={\sqrt[{p}]{\frac {1}{\sum _{i=1}^{n}w_{i}{\frac {1}{x_{i}^{p}}}}}}\geqslant {\sqrt[{q}]{\frac {1}{\sum _{i=1}^{n}w_{i}{\frac {1}{x_{i}^{q}}}}}}={\sqrt[{-q}]{\sum _{i=1}^{n}w_{i}x_{i}^{-q}}}}

A zatem dowiedliśmy nierówności także dla ujemnych p {\displaystyle p} i q {\displaystyle q} co kończy dowód.

Minimum i maksimum

Minimum i maksimum przyjmuje się za średnie potęgowe rzędów ± . {\displaystyle \pm \infty .} Wynika to z faktu, że są to odpowiednie granice średnich potęgowych, dowód jest następujący:

Niech x 1 {\displaystyle x_{1}} będzie największym, a x n {\displaystyle x_{n}} najmniejszym z x i . {\displaystyle x_{i}.} Na początek korzystając z twierdzenia o trzech funkcjach udowodnimy granicę:

lim p ( 1 p ln ( i = 1 n w i x i p x 1 p ) ) = 0 {\displaystyle \lim _{p\to \infty }\left({\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{1}^{p}}}\right)\right)=0}

Wystarczy zauważyć nierówności dla dodatnich p : {\displaystyle p{:}}

1 p ln ( w 1 ) = 1 p ln ( w 1 x 1 p x 1 p ) 1 p ln ( i = 1 n w i x i p x 1 p ) {\displaystyle {\frac {1}{p}}\ln(w_{1})={\frac {1}{p}}\ln \left({\frac {w_{1}x_{1}^{p}}{x_{1}^{p}}}\right)\leqslant {\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{1}^{p}}}\right)}
1 p ln ( i = 1 n w i x i p x 1 p ) 1 p ln ( i = 1 n w i x 1 p x 1 p ) = ln ( 1 ) = 0 {\displaystyle {\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{1}^{p}}}\right)\leqslant {\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{1}^{p}}{x_{1}^{p}}}\right)=\ln(1)=0}

Następnie korzystając z udowodnionej granicy:

lim p 1 p ln ( i = 1 n w i x i p ) = lim p 1 p ln ( x 1 p i = 1 n w i x i p x 1 p ) = lim p 1 p ( ln ( x 1 p ) + ln ( i = 1 n w i x i p x 1 p ) ) = {\displaystyle \lim _{p\to \infty }{\frac {1}{p}}\ln \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)=\lim _{p\to \infty }{\frac {1}{p}}\ln \left(x_{1}^{p}\cdot {\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{1}^{p}}}\right)=\lim _{p\to \infty }{\frac {1}{p}}\left(\ln(x_{1}^{p})+\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{1}^{p}}}\right)\right)=}
= lim p ( ln ( x 1 p ) p ) + lim p ( 1 p ln ( i = 1 n w i x i p x 1 p ) ) = ln ( x 1 ) + 0 = ln ( x 1 ) {\displaystyle =\lim _{p\to \infty }\left({\frac {\ln(x_{1}^{p})}{p}}\right)+\lim _{p\to \infty }\left({\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{1}^{p}}}\right)\right)=\ln(x_{1})+0=\ln(x_{1})}

Stąd korzystając z ciągłości funkcji wykładniczej:

lim p i = 1 n w i x i p p = lim p exp ( 1 p ln ( i = 1 n w i x i p ) ) = exp ( lim p 1 p ln ( i = 1 n w i x i p ) ) = x 1 {\displaystyle \lim _{p\to \infty }{\sqrt[{p}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}=\lim _{p\to \infty }\exp \left({\frac {1}{p}}\ln \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)\right)=\exp \left(\lim _{p\to \infty }{\frac {1}{p}}\ln \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)\right)=x_{1}}

Analogicznie dla ujemnych p : {\displaystyle p{:}}

lim p ( 1 p ln ( i = 1 n w i x n p x n p ) ) = 0 {\displaystyle \lim _{p\to -\infty }\left({\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{n}^{p}}{x_{n}^{p}}}\right)\right)=0}

bo (wciąż dla p < 0 {\displaystyle p<0} ):

1 p ln ( w n ) = 1 p ln ( w n x n p x n p ) 1 p ln ( i = 1 n w i x i p x n p ) {\displaystyle {\frac {1}{p}}\ln(w_{n})={\frac {1}{p}}\ln \left({\frac {w_{n}x_{n}^{p}}{x_{n}^{p}}}\right)\geqslant {\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{n}^{p}}}\right)}
1 p ln ( i = 1 n w i x i p x n p ) 1 p ln ( i = 1 n w i x n p x n p ) = ln ( 1 ) = 0 {\displaystyle {\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{n}^{p}}}\right)\geqslant {\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{n}^{p}}{x_{n}^{p}}}\right)=\ln(1)=0}

Stąd:

lim p 1 p ln ( i = 1 n w i x i p ) = lim p ( ln ( x n p ) p ) + lim p ( 1 p ln ( i = 1 n w i x i p x n p ) ) = ln ( x n ) {\displaystyle \lim _{p\to -\infty }{\frac {1}{p}}\ln \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)=\lim _{p\to -\infty }\left({\frac {\ln(x_{n}^{p})}{p}}\right)+\lim _{p\to -\infty }\left({\frac {1}{p}}\ln \left({\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}}{x_{n}^{p}}}\right)\right)=\ln(x_{n})}

I w końcu analogicznie:

lim p i = 1 n w i x i p p = exp ( lim p 1 p ln ( i = 1 n w i x i p ) ) = x n {\displaystyle \lim _{p\to -\infty }{\sqrt[{p}]{\sum _{i=1}^{n}w_{i}x_{i}^{p}}}=\exp \left(\lim _{p\to -\infty }{\frac {1}{p}}\ln \left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)\right)=x_{n}}

Zobacz też