Regla de la cadena

En matemáticas, dentro del dominio del análisis, la regla de la cadena (también conocida como el teorema de las funciones compuestas) es una fórmula explícita de la derivada de una función compuesta por dos funciones derivables.

Esta regla permite conocer la j-ésima derivada parcial de la i-ésima aplicación parcial de la composición de dos funciones de varias variables. Esquemáticamente, si una variable y {\displaystyle y} depende de una segunda variable u {\displaystyle u} , la cual depende de una variable x {\displaystyle x} , la tasa de cambio de y {\displaystyle y} respecto a x {\displaystyle x} se calcula como el producto de la tasa de cambio de y {\displaystyle y} respecto a u {\displaystyle u} y de la tasa de cambio de u {\displaystyle u} respecto a x {\displaystyle x} , esto es: d y d x = d y d u d u d x {\displaystyle {\frac {\mathrm {d} y}{\mathrm {d} x}}={\frac {\mathrm {d} y}{\mathrm {d} u}}\cdot {\frac {\mathrm {d} u}{\mathrm {d} x}}} .

La regla de la cadena proviene de la técnica de integración por cambio de variables.

Notaciones

Existen muchas formas de escribir la regla de la cadena, presentaremos aquí las formas clásicas.

Si f {\displaystyle f} y g {\displaystyle g} son funciones diferenciables, entonces la regla de la cadena expresa la derivada de la composición f g {\displaystyle f\circ g} en términos de la derivada de f {\displaystyle f} , g {\displaystyle g} y el producto de funciones como

( f g ) = ( f g ) g {\displaystyle (f\circ g)'=(f'\circ g)\cdot g'}

Alternativamente, si h = f g {\displaystyle h=f\circ g} (equivalente a h ( x ) = f ( g ( x ) ) {\displaystyle h(x)=f(g(x))} para toda x {\displaystyle x} ) entonces se puede escribir la fórmula de la regla de la cadena en la notación de Lagrange como

h ( x ) = f ( g ( x ) ) g ( x ) {\displaystyle h'(x)=f'(g(x))g'(x)}

La regla de la cadena también puede ser escrita en la notación de Leibniz de la siguiente manera. Si una variable z {\displaystyle z} depende de una variable y {\displaystyle y} y a su vez esta depende de x {\displaystyle x} (esto es y {\displaystyle y} y z {\displaystyle z} son variables dependientes) entonces z {\displaystyle z} también depende de x {\displaystyle x} , en tal caso, la regla de la cadena enuncia que

d z d x = d z d y d y d x {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}}

y para indicar el punto en el que cada derivada es evaluada

d z d x | x = d z d y | y ( x ) d y d x | x {\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x}}

Las versiones de la regla de la cadena en la notación de Lagrange y de Leibniz son equivalentes en el sentido que si z = f ( y ) {\displaystyle z=f(y)} y y = g ( x ) {\displaystyle y=g(x)} (esto es z = f ( g ( x ) ) = ( f g ) ( x ) {\displaystyle z=f(g(x))=(f\circ g)(x)} ) entonces

d z d x | x = ( f g ) ( x ) {\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=(f\circ g)'(x)}

y

d z d y | y ( x ) d y d x | x = f ( y ( x ) ) g ( x ) = f ( g ( x ) ) g ( x ) {\displaystyle \left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x}=f'(y(x))g'(x)=f'(g(x))g'(x)}

Enunciado

Caso real

Teorema

Sean I {\displaystyle I} y J {\displaystyle J} dos intervalos abiertos de R {\displaystyle \mathbb {R} } , g : I R {\displaystyle g:I\to \mathbb {R} } y f : J R {\displaystyle f:J\to \mathbb {R} } dos funciones tales que g ( I ) J {\displaystyle g(I)\subset J} , y a {\displaystyle a} es un punto de I {\displaystyle I} .

Si g {\displaystyle g} es diferenciable en a {\displaystyle a} y f {\displaystyle f} es diferenciable en g ( a ) {\displaystyle g(a)} entonces la composición f g {\displaystyle f\circ g} es diferenciable en a {\displaystyle a} y

( f g ) ( a ) = ( f ( g ( a ) ) ) g ( a ) {\displaystyle (f\circ g)'(a)=(f'(g(a)))\cdot g'(a)} ,

donde {\displaystyle \cdot } es el producto usual de R {\displaystyle \mathbb {R} } .

Si las funciones son diferenciables en todo su dominio podemos escribir de una forma más general ( f g ) = ( f g ) g {\displaystyle (f\circ g)'=(f'\circ g)\cdot g'} . Bajo esta misma condición, utilizando la notación de Leibniz si denotamos como g = d f d x {\displaystyle g^{\prime }={\frac {df}{dx}}} tenemos que la regla de la cadena puede escribirse como d ( f g ) d x = d f d g d g d x {\displaystyle {\begin{aligned}{\frac {d(f\circ g)}{dx}}&={\frac {df}{dg}}\cdot {\frac {dg}{dx}}\end{aligned}}}

donde d f d g {\displaystyle {\frac {df}{dg}}} indica que f {\displaystyle f} depende de g {\displaystyle g} como si g {\displaystyle g} fuera una variable. Para una mejor lectura es común hacer u = g ( x ) {\displaystyle u=g(x)} y obtenemos:

d ( f g ) d x = d f d u d u d x {\displaystyle {\frac {{\text{d}}(f\circ g)}{{\text{d}}x}}={\frac {{\text{d}}f}{{\text{d}}u}}\cdot {\frac {{\text{d}}u}{{\text{d}}x}}} .

Si queremos componer muchas funciones podemos hacer lo siguiente: dadas n {\displaystyle n} funciones f 1 , , f n {\displaystyle f_{1},\dots ,f_{n}} y la función compuesta f 1 ( f 2 ( f n 1 f n ) ) {\displaystyle f_{1}\circ (f_{2}\circ \cdots (f_{n-1}\circ f_{n}))} , si cada función f i {\displaystyle f_{i}} es diferenciable entonces la función compuesta también es diferenciable (por la regla de la cadena repetida varias veces) y su derivada es (en la notación de Leibniz)

d f 1 d x = d f 1 d f 2 d f 2 d f 3 d f n d x {\displaystyle {\begin{aligned}{\frac {df_{1}}{dx}}&={\frac {df_{1}}{df_{2}}}\cdot {\frac {df_{2}}{df_{3}}}\cdot \cdots \cdot {\frac {df_{n}}{dx}}\end{aligned}}}

Caso general

Teorema

Sean E, F dos espacios vectoriales normados y G un espacio vectorial topológico separable. Sean U un abierto de E, V un abierto de F, g una aplicación de U en V, f una aplicación de V en G, y a un punto de U. Si g es diferenciable en el punto a y f diferenciable en el punto g(a) entonces fg es diferenciable en el punto a, y

D a ( f g ) = ( D g ( a ) f ) D a g {\displaystyle {\rm {D}}_{a}(f\circ g)=({\rm {D}}_{g(a)}f)\circ {\rm {D}}_{a}g} .

En particular si E = R n {\displaystyle E=\mathbb {R} ^{n}} , F = R m {\displaystyle F=\mathbb {R} ^{m}} y G = R p {\displaystyle G=\mathbb {R} ^{p}} , la matriz jacobiana de f g {\displaystyle f\circ g} en el punto a {\displaystyle a} es el producto de aquella de f {\displaystyle f} en el punto g ( a ) {\displaystyle g(a)} por la de g {\displaystyle g} en el punto a {\displaystyle a} , podemos escribir esto en la forma siguiente

g ( y ) = ( g 1 ( y ) , , g p ( y ) ) , f ( x ) = ( f 1 ( x ) , , f m ( x ) ) y ( f g ) ( x ) = h ( x ) = ( h 1 ( x ) , , h p ( x ) ) {\displaystyle g(y)=(g_{1}(y),\ldots ,g_{p}(y)),\qquad f(x)=(f_{1}(x),\ldots ,f_{m}(x))\quad {\text{y}}\quad (f\circ g)(x)=h(x)=(h_{1}(x),\ldots ,h_{p}(x))}  :
h i x j ( a ) = k = 1 m f i y k ( g ( a ) ) g k x j ( a ) {\displaystyle {\frac {\partial h_{i}}{\partial x_{j}}}(a)=\sum _{k=1}^{m}{\frac {\partial f_{i}}{\partial y_{k}}}(g(a)){\frac {\partial g_{k}}{\partial x_{j}}}(a)}

para todo i 1 , , p {\displaystyle i\in {1,\dots ,p}} e i 1 , , n {\displaystyle i\in {1,\dots ,n}} .

Derivadas de orden superior

La fórmula de Faà di Bruno generalizan la regla de la cadena a derivadas de orden superior. Suponga que y = f ( u ) {\displaystyle y=f(u)} y u = g ( x ) {\displaystyle u=g(x)} entonces

d f d x = d f d g d g d x {\displaystyle {\frac {df}{dx}}={\frac {df}{dg}}{\frac {dg}{dx}}}
d 2 f d x 2 = d 2 f d g 2 ( d g d x ) 2 + d f d g d 2 g d x 2 {\displaystyle {\frac {d^{2}f}{dx^{2}}}={\frac {d^{2}f}{dg^{2}}}\left({\frac {dg}{dx}}\right)^{2}+{\frac {df}{dg}}{\frac {d^{2}g}{dx^{2}}}}
d 3 f d x 3 = d 3 f d g 3 ( d g d x ) 3 + 3 d 2 f d g 2 d g d x d 2 g d x 2 + d f d g d 3 g d x 3 {\displaystyle {\frac {d^{3}f}{dx^{3}}}={\frac {d^{3}f}{dg^{3}}}\left({\frac {dg}{dx}}\right)^{3}+3{\frac {d^{2}f}{dg^{2}}}{\frac {dg}{dx}}{\frac {d^{2}g}{dx^{2}}}+{\frac {df}{dg}}{\frac {d^{3}g}{dx^{3}}}}
d 4 f d x 4 = d 4 f d g 4 ( d g d x ) 4 + 6 d 3 f d g 3 ( d g d x ) 2 d 2 g d x 2 + d 2 f d g 2 [ 4 d g d x d 3 g d x 3 + 3 ( d 2 g d x 2 ) 2 ] + d f d g d 4 g d x 4 {\displaystyle {\frac {d^{4}f}{dx^{4}}}={\frac {d^{4}f}{dg^{4}}}\left({\frac {dg}{dx}}\right)^{4}+6{\frac {d^{3}f}{dg^{3}}}\left({\frac {dg}{dx}}\right)^{2}{\frac {d^{2}g}{dx^{2}}}+{\frac {d^{2}f}{dg^{2}}}\left[4{\frac {dg}{dx}}{\frac {d^{3}g}{dx^{3}}}+3\left({\frac {d^{2}g}{dx^{2}}}\right)^{2}\right]+{\frac {df}{dg}}{\frac {d^{4}g}{dx^{4}}}}

Demostración

Caso Real

Denotemos b = f ( a ) {\displaystyle b=f(a)} . Dado que g {\displaystyle g} es diferenciable en b {\displaystyle b} , desde la definición de la derivada, existe una función u : J R {\displaystyle u:J\to \mathbb {R} } tal que

u ( b ) = lim y b u ( y ) = g ( b )  y  y J g ( y ) g ( b ) = u ( y ) ( y b ) {\displaystyle u(b)=\lim _{y\to b}u(y)=g'(b)\quad {\text{ y }}\quad \forall y\in J\quad g(y)-g(b)=u(y)\cdot (y-b)} .

En particular (utilizando que f {\displaystyle f} es continua en a {\displaystyle a} puesto que ella es diferenciable en ese punto):

lim x a u ( f ( x ) ) = g ( b )  y  x I g ( f ( x ) ) g ( f ( a ) ) = u ( f ( x ) ) ( f ( x ) f ( a ) ) {\displaystyle \lim _{x\to a}u(f(x))=g'(b)\quad {\text{ y }}\quad \forall x\in I\quad g(f(x))-g(f(a))=u(f(x))\cdot (f(x)-f(a))} .

La tasa de variación en el punto a {\displaystyle a} de la función g f {\displaystyle g\circ f} se expresa entonces bajo la forma:

g ( f ( x ) ) g ( f ( a ) ) x a = u ( f ( x ) ) f ( x ) f ( a ) x a {\displaystyle {\frac {g(f(x))-g(f(a))}{x-a}}=u(f(x))\cdot {\frac {f(x)-f(a)}{x-a}}}

Y cuando x {\displaystyle x} tiende hacia a {\displaystyle a} (para valores distintos de a {\displaystyle a} ), esta expresión tiende hacia g ( b ) f ( a ) = g ( f ( a ) ) f ( a ) {\displaystyle g'(b)\cdot f'(a)=g'(f(a))\cdot f'(a)} .

Observación

Existe una demostración de este teorema, aparentemente más simple que utiliza la astucia

g ( f ( x ) ) g ( f ( a ) ) x a = g ( f ( x ) ) g ( f ( a ) ) f ( x ) f ( a ) f ( x ) f ( a ) x a {\displaystyle {\dfrac {g(f(x))-g(f(a))}{x-a}}={\dfrac {g(f(x))-g(f(a))}{f(x)-f(a)}}\cdot {\dfrac {f(x)-f(a)}{x-a}}} ,

pero esta demostración es errónea porque ella supone que f ( x ) f ( a ) {\displaystyle f(x)\neq f(a)} para todo x {\displaystyle x} suficientemente cerca de a {\displaystyle a} , lo cual no tiene ninguna razón de ser. Por ejemplo, una función constante. También podemos considerar el caso de la función φ : R R {\displaystyle \varphi :\mathbb {R} \to \mathbb {R} } dada por

φ ( x ) = { x 2 sin ( 1 x ) ,  si  x 0 0 ,  si  x = 0 {\displaystyle \varphi (x)={\begin{cases}x^{2}\sin \left({\frac {1}{x}}\right),&{\text{ si }}x\neq 0\\0,&{\text{ si }}x=0\end{cases}}}

en donde podemos notar que φ ( 1 2 π n ) = 0 {\displaystyle \varphi \left({\frac {1}{2\pi n}}\right)=0} para todo n N {\displaystyle n\in \mathbb {N} } .

Caso General

Denotemos L = d f a {\displaystyle L=\mathrm {d} f_{a}} y M = d g b {\displaystyle M=\mathrm {d} g_{b}} . Entonces:

  • M {\displaystyle M} y L {\displaystyle L} son lineales y continuas, en particular: M ( k ) = O ( k ) {\displaystyle M(k)=O(\|k\|)} y L ( h ) = O ( h ) {\displaystyle L(h)=O(\|h\|)} (con la notación O de Landau),
  • f ( a + h ) = f ( a ) + L ( h ) + o ( h ) {\displaystyle f(a+h)=f(a)+L(h)+o(\|h\|)} ,
  • g ( b + k ) = g ( b ) + M ( k ) + o ( k ) {\displaystyle g(b+k)=g(b)+M(k)+o(\|k\|)} .

En consecuencia:

  • M L {\displaystyle M\circ L} es lineal y continua,
  • ( g f ) ( a + h ) = g ( b ) + M [ L ( h ) + o ( h ) ] + o [ L ( h ) + o ( h ) ] = g ( b ) + ( M L ) ( h ) + M [ o ( h ) ] + o [ L ( h ) + o ( h ) ] {\displaystyle (g\circ f)(a+h)=g(b)+M\left[L(h)+o(\|h\|)\right]+o\left[\|L(h)+o(\|h\|)\|\right]=g(b)+(M\circ L)(h)+M\left[o(\|h\|)\right]+o\left[\|L(h)+o(\|h\|)\|\right]} ,
  • M [ o ( h ) ] = O [ o ( h ) ] = o ( h ) {\displaystyle M\left[o(\|h\|)\right]=O\left[\|o(\|h\|)\|\right]=o(\|h\|)} y o [ L ( h ) + o ( h ) ] = o [ O ( h ) ] = o ( h ) {\displaystyle o\left[\|L(h)+o(\|h\|)\|\right]=o\left[\|O(\|h\|)\|\right]=o(\|h\|)} .

Observación

En este enunciado y su demostración, no es necesario que G {\displaystyle G} sea un espacio vectorial normado: es suficiente que sea un espacio vectorial topológico separable.

Ejemplos

Regla del cociente

Artículo principal: Regla del cociente

La regla de la cadena puede ser utilizada para obtener algunas fórmulas para derivar, por ejemplo, la regla del cociente es una consecuencia de la regla de la cadena y la regla del producto; para esto, consideremos las funciones f , g : I R {\displaystyle f,g:I\rightarrow \mathbb {R} } con g ( x ) 0 {\displaystyle g(x)\neq 0} para todo x I {\displaystyle x\in I} , escribimos entonces el cociente f ( x ) / g ( x ) {\displaystyle f(x)/g(x)} como el producto f ( x ) 1 / g ( x ) {\displaystyle f(x)\cdot 1/g(x)} , utilizando primero la regla del producto:

d d x ( f ( x ) g ( x ) ) = d d x ( f ( x ) 1 g ( x ) ) = f ( x ) 1 g ( x ) + f ( x ) d d x ( 1 g ( x ) ) {\displaystyle {\begin{aligned}{\frac {d}{dx}}\left({\frac {f(x)}{g(x)}}\right)&={\frac {d}{dx}}\left(f(x)\cdot {\frac {1}{g(x)}}\right)\\&=f'(x)\cdot {\frac {1}{g(x)}}+f(x)\cdot {\frac {d}{dx}}\left({\frac {1}{g(x)}}\right)\end{aligned}}}

para todo x I {\displaystyle x\in I} . Para calcular la derivada de la función x 1 / g ( x ) {\displaystyle x\mapsto 1/g(x)} notemos que puede escribirse como la composición de g {\displaystyle g} con la función recíproco x 1 / x {\displaystyle x\mapsto 1/x} , cuya derivada es x 1 / x 2 {\displaystyle x\mapsto -1/x^{2}} , aplicando la regla de la cadena la expresión anterior queda como

d d x ( f ( x ) g ( x ) ) = f ( x ) 1 g ( x ) + f ( x ) ( 1 g ( x ) 2 g ( x ) ) = f ( x ) g ( x ) f ( x ) g ( x ) g ( x ) 2 {\displaystyle {\begin{aligned}{\frac {d}{dx}}\left({\frac {f(x)}{g(x)}}\right)&=f'(x)\cdot {\frac {1}{g(x)}}+f(x)\cdot \left(-{\frac {1}{g(x)^{2}}}\cdot g'(x)\right)\\&={\frac {f'(x)g(x)-f(x)g'(x)}{g(x)^{2}}}\end{aligned}}}

para todo x I {\displaystyle x\in I} , que es la fórmula de la regla del cociente.

Derivada de funciones inversas

Considere la función diferenciable e invertible g : I J {\displaystyle g:I\rightarrow J} con I , J R {\displaystyle I,J\subset \mathbb {R} } intervalos abiertos con inversa diferenciable f : J I {\displaystyle f:J\rightarrow I} . Existe una fórmula para la derivada de f {\displaystyle f} en términos de la derivada de g {\displaystyle g} , para esto, note que f {\displaystyle f} y g {\displaystyle g} satisfacen la ecuación

f ( g ( x ) ) = x  para todo  x I , {\displaystyle f(g(x))=x\quad {\text{ para todo }}\quad x\in I,}

en donde derivando ambas expresiones obtenemos

f ( g ( x ) ) g ( x ) = 1  para todo  x I . {\displaystyle f'(g(x))g'(x)=1\quad {\text{ para todo }}x\in I.}

Para expresar f {\displaystyle f'} como una función de una variable independiente y J {\displaystyle y\in J} , escribimos x = f ( y ) {\displaystyle x=f(y)} y resolvemos para f {\displaystyle f'}

f ( g ( f ( y ) ) ) g ( f ( y ) ) = 1 f ( y ) g ( f ( y ) ) = 1 f ( y ) = 1 g ( f ( y ) ) {\displaystyle {\begin{aligned}f'(g(f(y)))g'(f(y))&=1\\f'(y)g'(f(y))&=1\\f'(y)&={\frac {1}{g'(f(y))}}\end{aligned}}}

para todo y J {\displaystyle y\in J} .

Observación

Es importante tener en mente las condiciones de diferenciabilidad de ambas funciones f {\displaystyle f} y g {\displaystyle g} en sus respectivos dominios, la invertibilidad y diferenciabilidad de una función no implica que esta última condición sea satisfecha por su inversa (conocido es el caso de la función x x 3 {\displaystyle x\mapsto x^{3}} la cual es diferenciable e invertible pero su inversa no es diferenciable en 0 {\displaystyle 0} ).

Ejemplo

Por ejemplo, considere la función g ( x ) = e x {\displaystyle g(x)=e^{x}} , esta tiene función inversa f ( y ) = ln y {\displaystyle f(y)=\ln y} , como g ( x ) = e x {\displaystyle g'(x)=e^{x}} entonces por la fórmula anterior

d d y ln y = 1 e ln y = 1 y {\displaystyle {\frac {d}{dy}}\ln y={\frac {1}{e^{\ln y}}}={\frac {1}{y}}}

Ejemplo conceptual

Supóngase que se está escalando una montaña a una razón de 0,5 kilómetros por hora. La razón a la cual la temperatura decrece es 6 °F por kilómetro (la temperatura es menor a elevaciones mayores). Al multiplicar 6 °F por kilómetro y 0,5 kilómetros por hora, se obtiene 3 °F por hora, es decir, la razón de cambio de temperatura con respecto al tiempo transcurrido.

Este cálculo es una aplicación típica de la regla de la cadena.

Ejemplo algebraico

Sean las funciones y : ( 0 , + ) R {\displaystyle y:(0,+\infty )\rightarrow \mathbb {R} } y u : R R {\displaystyle u:\mathbb {R} \rightarrow \mathbb {R} } dadas por

y ( u ) = ln ( u ) u ( x ) = cos ( x ) {\displaystyle {\begin{aligned}y(u)&=\ln(u)\\u(x)&=\cos(x)\end{aligned}}}

y deseamos calcular d y d x {\textstyle {\frac {dy}{dx}}} .

Por un lado tenemos:

d y d u = 1 u {\displaystyle {\frac {dy}{du}}={\frac {1}{u}}}

y

d u d x = sen ( x ) {\displaystyle {\frac {du}{dx}}=-\operatorname {sen}(x)}

como

d y d x = d y d u d u d x {\displaystyle {\frac {dy}{dx}}={\frac {dy}{du}}\cdot {\frac {du}{dx}}}

entonces

d y d x = 1 u ( sen x ) = sen x u = sen x cos x = tan x {\displaystyle {\begin{aligned}{\frac {dy}{dx}}&={\frac {1}{u}}\cdot (-\operatorname {sen} x)\\&=-{\frac {\operatorname {sen} x}{u}}\\&=-{\frac {\operatorname {sen} x}{\cos x}}\\&=-\tan {x}\end{aligned}}}

y esto es para todo x R {\displaystyle x\in \mathbb {R} } tal que cos ( x ) ( 0 , + ) {\displaystyle \cos(x)\in (0,+\infty )} , es decir, para todo x n Z ( π 2 + 2 n π , π 2 + 2 n π ) {\displaystyle x\in \bigcup _{n\in \mathbb {Z} }\left(-{\frac {\pi }{2}}+2n\pi ,{\frac {\pi }{2}}+2n\pi \right)} .

Véase también

Referencias

Enlaces externos

Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q207455
  • Identificadores
  • GND: 4163699-5
  • Diccionarios y enciclopedias
  • Britannica: url
  • Wd Datos: Q207455