Derivado

Da Wikipédia, a enciclopédia livre
Ir para a navegação Saltar para pesquisar

O gráfico de uma função , desenhado em preto, e uma linha tangente a esse gráfico, desenhada em vermelho. A inclinação da linha tangente é igual à derivada da função no ponto marcado.

Em matemática , a derivada de uma função de uma variável real mede a sensibilidade à mudança do valor da função (valor de saída) em relação a uma mudança em seu argumento (valor de entrada). As derivadas são uma ferramenta fundamental do cálculo . Por exemplo, a derivada da posição de um objeto em movimento em relação ao tempo é a velocidade do objeto : mede a rapidez com que a posição do objeto muda quando o tempo avança.

A derivada de uma função de uma única variável em um valor de entrada escolhido, quando existe, é a inclinação da reta tangente ao gráfico da função naquele ponto. A linha tangente é a melhor aproximação linear da função perto desse valor de entrada. Por esta razão, a derivada é frequentemente descrita como a "taxa instantânea de variação", a razão da variação instantânea na variável dependente para a variável independente.

As derivadas podem ser generalizadas para funções de várias variáveis ​​reais . Nesta generalização, a derivada é reinterpretada como uma transformação linear cujo gráfico é (após uma tradução apropriada) a melhor aproximação linear ao gráfico da função original. A matriz Jacobiana é a matriz que representa essa transformação linear em relação à base dada pela escolha das variáveis ​​independentes e dependentes. Pode ser calculado em função das derivadas parciais em relação às variáveis ​​independentes. Para uma função de valor real de várias variáveis, a matriz Jacobiana se reduz ao vetor gradiente .

O processo de encontrar uma derivada é chamado de diferenciação . O processo inverso é chamado de antidiferenciação . O teorema fundamental do cálculo relaciona antidiferenciação com integração . Diferenciação e integração constituem as duas operações fundamentais no cálculo de uma variável. [Nota 1]

Definição

Uma função de uma variável real y = f ( x ) é diferenciável em um ponto a de seu domínio , se seu domínio contém um intervalo aberto I contendo a , e o limite

existe. Isso significa que, para todo número real positivo (mesmo muito pequeno), existe um número real positivotal que, para todo h tal queeentãoé definido, e

onde as barras verticais denotam o valor absoluto (ver (ε, δ)-definição de limite ).

Se a função f é diferenciável em a , isto é, se o limite L existe, então esse limite é chamado de derivada de f em a , e denotado(leia como " f prime of a ") ou(ler como "a derivada de f em relação a x em a ", " dy por dx em a ", ou " dy sobre dx em a "); veja § Notação (detalhes) , abaixo.

Explicações

A diferenciação é a ação de calcular uma derivada. A derivada de uma função y = f ( x ) de uma variável x é uma medida da taxa na qual o valor y da função muda em relação à mudança da variável x . Ela é chamada de derivada de f em relação a x . Se x e y são números reais , e se o gráfico de f é plotado em relação a x , a derivada é a inclinaçãodeste gráfico em cada ponto.

Inclinação de uma função linear:

O caso mais simples, além do caso trivial de uma função constante , é quando y é uma função linear de x , o que significa que o gráfico de y é uma linha. Neste caso, y = f ( x ) = mx + b , para números reais m e b , e a inclinação m é dada por

onde o símbolo Δ ( Delta ) é uma abreviação para "change in", e as combinaçõeseconsulte as alterações correspondentes, ou seja,

.

A fórmula acima é válida porque

Por isso

Isto dá o valor para a inclinação de uma linha.

Se a função f não é linear (ou seja, seu gráfico não é uma linha reta), então a variação em y dividida pela variação em x varia ao longo do intervalo considerado: a diferenciação é um método para encontrar um valor único para essa taxa de variação, não em um determinado intervalomas em qualquer valor dado de x .

Taxa de variação como valor limite
Figura 1 . A linha tangente em ( x , f ( x ))
Figura 2. A secante à curva y = f ( x ) determinada pelos pontos ( x , f ( x )) e ( x + h , f ( x + h ))
Figura 3. A tangente como limite das secantes
Figura 4. Ilustração animada: a linha tangente (derivada) como limite das secantes

A ideia, ilustrada pelas Figuras 1 a 3, é calcular a taxa de variação como o valor limite da razão das diferenças Δ y / Δ x quando Δ x tende para 0.

Em direção a uma definição

Uma secante se aproxima de uma tangente quando.

A abordagem mais comum para transformar essa ideia intuitiva em uma definição precisa é definir a derivada como um limite de quocientes de diferença de números reais. [1] Esta é a abordagem descrita abaixo.

Seja f uma função de valor real definida em uma vizinhança aberta de um número real a . Na geometria clássica, a linha tangente ao gráfico da função f em a era a única linha que passava pelo ponto ( a , f ( a )) que não encontrava o gráfico de f transversalmente , o que significa que a linha não passava direto por o gráfico. A derivada de y em relação a x em a é, geometricamente, a inclinação da reta tangente ao gráfico de f em( a , f ( a )) . A inclinação da linha tangente é muito próxima da inclinação da linha que passa por ( a , f ( a )) e um ponto próximo no gráfico, por exemplo ( a + h , f ( a + h )) . Essas linhas são chamadas de linhas secantes . Um valor de h próximo de zero dá uma boa aproximação da inclinação da reta tangente, e valores menores (em valor absoluto ) de h irão, em geral, fornecer melhores aproximações. A inclinação m da linha secante é a diferença entre os valores de y desses pontos dividida pela diferença entre os valores de x , ou seja,

Esta expressão é o quociente de diferença de Newton . A passagem de uma aproximação para uma resposta exata é feita usando um limite . Geometricamente, o limite das linhas secantes é a linha tangente. Portanto, o limite do quociente de diferença quando h se aproxima de zero, se existir, deve representar a inclinação da reta tangente a ( a , f ( a )) . Este limite é definido como a derivada da função f em a :

Quando o limite existe, diz-se que f é diferenciável em a . Aqui f ( a ) é uma das várias notações comuns para a derivada ( veja abaixo ). A partir desta definição é óbvio que uma função diferenciável f é crescente se e somente se sua derivada for positiva, e é decrescente se sua derivada for negativa. Este fato é usado extensivamente ao analisar o comportamento da função, por exemplo, ao encontrar extremos locais .

Equivalentemente, a derivada satisfaz a propriedade de que

que tem a interpretação intuitiva (veja a Figura 1) que a linha tangente a f em a dá a melhor aproximação linear

para f perto de a (isto é, para h pequeno ). Essa interpretação é a mais fácil de generalizar para outras configurações ( veja abaixo ).

Substituir 0 por h no quociente de diferença causa a divisão por zero , de modo que a inclinação da linha tangente não pode ser encontrada diretamente usando este método. Em vez disso, defina Q ( h ) para ser o quociente de diferença em função de h :

Q ( h ) é a inclinação da linha secante entre ( a , f ( a )) e ( a + h , f ( a + h )) . Se f é uma função contínua , o que significa que seu gráfico é uma curva ininterrupta sem lacunas, então Q é uma função contínua longe de h = 0 . Se o limite lim h →0 Q ( h ) existe, significando que existe uma maneira de escolher um valor paraQ (0) que torna Q uma função contínua, então a função f é diferenciável em a , e sua derivada em a é igual a Q (0) .

Na prática, a existência de uma extensão contínua do quociente de diferença Q ( h ) para h = 0 é mostrada modificando o numerador para cancelar h no denominador. Tais manipulações podem tornar claro o valor limite de Q para h pequeno mesmo que Q ainda não esteja definido em h = 0 . Esse processo pode ser longo e tedioso para funções complicadas, e muitos atalhos são comumente usados ​​para simplificar o processo.

Exemplo

A função quadrada

A função quadrada dada por f ( x ) = x 2 é diferenciável em x = 3 , e sua derivada é 6. Este resultado é estabelecido calculando o limite quando h se aproxima de zero do quociente de diferença de f (3) :

A última expressão mostra que o quociente de diferença é igual a 6 + h quando h ≠ 0 e é indefinido quando h = 0 , devido à definição do quociente de diferença. No entanto, a definição do limite diz que o quociente de diferença não precisa ser definido quando h = 0 . O limite é o resultado de deixar h ir a zero, ou seja, é o valor que 6 + h tende a quando h se torna muito pequeno:

Portanto, a inclinação do gráfico da função quadrada no ponto (3, 9) é 6 , e sua derivada em x = 3 é f (3) = 6 .

Mais geralmente, um cálculo semelhante mostra que a derivada da função quadrada em x = a é f ( a ) = 2 a :

Continuidade e diferenciabilidade

Esta função não tem uma derivada no ponto marcado, pois a função não é contínua ali (especificamente, tem uma descontinuidade de salto ).

Se f é diferenciável em a , então f também deve ser contínua em a . Como exemplo, escolha um ponto a e seja f a função degrau que retorna o valor 1 para todo x menor que a e retorna um valor diferente 10 para todo x maior ou igual a a . f não pode ter uma derivada em a . Se h é negativo, então a + h está na parte inferior do degrau, então a linha secante dea a a + h é muito íngreme, e como h tende a zero, a inclinação tende ao infinito. Se h é positivo, então a + h está na parte alta do degrau, de modo que a linha secante de a a a + h tem inclinação zero. Conseqüentemente, as linhas secantes não se aproximam de uma única inclinação, de modo que o limite do quociente de diferença não existe.

A função de valor absoluto é contínua, mas não é diferenciável em x = 0 , pois as inclinações tangentes não se aproximam do mesmo valor da esquerda como da direita.

No entanto, mesmo que uma função seja contínua em um ponto, ela pode não ser diferenciável nesse ponto. Por exemplo, a função de valor absoluto dada por f ( x ) = | x | é contínua em x = 0 , mas não é diferenciável lá. Se h é positivo, então a inclinação da linha secante de 0 a h é um, enquanto que se h é negativa, então a inclinação da linha secante de 0 a h é negativa. Isso pode ser visto graficamente como uma "torção" ou uma "cúspide" no gráfico em x = 0 . Mesmo uma função com um gráfico suave não é diferenciável em um ponto onde suatangente é vertical : Por exemplo, a função dada por f ( x ) = x 1/3 não é diferenciável em x = 0 .

Em resumo, uma função que possui derivada é contínua, mas existem funções contínuas que não possuem derivada.

A maioria das funções que ocorrem na prática tem derivadas em todos os pontos ou em quase todos os pontos. No início da história do cálculo , muitos matemáticos assumiram que uma função contínua era diferenciável na maioria dos pontos. Sob condições suaves, por exemplo, se a função for uma função monótona ou uma função Lipschitz , isso é verdade. No entanto, em 1872, Weierstrass encontrou o primeiro exemplo de uma função que é contínua em todos os lugares, mas diferenciável em nenhum lugar. Este exemplo agora é conhecido como a função Weierstrass . Em 1931, Stefan Banach provou que o conjunto de funções que têm uma derivada em algum ponto é um conjunto escassono espaço de todas as funções contínuas. [2] Informalmente, isso significa que quase nenhuma função contínua aleatória tem uma derivada em um único ponto.

Derivada como uma função

A derivada em diferentes pontos de uma função diferenciável. Neste caso, a derivada é igual a:

Seja f uma função que tem uma derivada em todos os pontos de seu domínio . Podemos então definir uma função que mapeia cada ponto x para o valor da derivada de f em x . Esta função é escrita f e é chamada de função derivada ou derivada de f .

Às vezes f tem uma derivada no máximo, mas não em todos os pontos de seu domínio. A função cujo valor em a é igual a f ( a ) sempre que f ( a ) é definida e em outro lugar é indefinida também é chamada de derivada de f . Ainda é uma função, mas seu domínio é estritamente menor que o domínio de f .

Usando essa ideia, a diferenciação torna-se uma função de funções: A derivada é um operador cujo domínio é o conjunto de todas as funções que possuem derivadas em todos os pontos de seu domínio e cuja imagem é um conjunto de funções. Se denotarmos este operador por D , então D ( f ) é a função f . Como D ( f ) é uma função, ela pode ser avaliada em um ponto a . Pela definição da função derivada, D ( f )( a ) = f ( a ) .

Para comparação, considere a função de duplicação dada por f ( x ) = 2 x ; f é uma função de valor real de um número real, o que significa que recebe números como entradas e tem números como saídas:

O operador D , no entanto, não é definido em números individuais. Ele é definido apenas em funções:

Como a saída de D é uma função, a saída de D pode ser avaliada em um ponto. Por exemplo, quando D é aplicado à função quadrada, xx 2 , D gera a função de duplicação x ↦ 2 x , que chamamos de f ( x ) . Essa função de saída pode então ser avaliada para obter f (1) = 2 , f (2) = 4 e assim por diante.

Derivados mais altos

Seja f uma função diferenciável e seja f sua derivada. A derivada de f (se houver) é escrita f ′′ e é chamada de segunda derivada de f . Da mesma forma, a derivada da segunda derivada, se existir, é escrita f ′′′ e é chamada de terceira derivada de f . Continuando este processo, pode-se definir, se existir, a n - ésima derivada como a derivada da ( n −1) -ésima derivada. Essas derivadas repetidas são chamadas de derivadas de ordem superior. A n -ésima derivada também é chamada de derivada de ordem n .

Se x ( t ) representa a posição de um objeto no tempo t , então as derivadas de ordem superior de x têm interpretações específicas em física . A primeira derivada de x é a velocidade do objeto . A segunda derivada de x é a aceleração . A terceira derivada de x é o empurrão . E, finalmente, as derivadas da quarta à sexta de x são snap, crepitação e pop ; mais aplicável à astrofísica .

Uma função f não precisa ter uma derivada (por exemplo, se não for contínua). Da mesma forma, mesmo que f tenha uma derivada, pode não ter uma segunda derivada. Por exemplo, deixe

O cálculo mostra que f é uma função diferenciável cuja derivada emÉ dado por

f' ( x ) é duas vezes a função de valor absoluto em, e não tem uma derivada em zero. Exemplos semelhantes mostram que uma função pode ter uma k ª derivada para cada inteiro não negativo k , mas não uma ( k + 1) ª derivada. Uma função que tem k derivadas sucessivas é chamada de k vezes diferenciável . Se, além disso, a k - ésima derivada for contínua, então a função é dita da classe de diferenciabilidade C k . (Esta é uma condição mais forte do que ter k derivadas, como mostrado pelo segundo exemplo de Suavidade § Exemplos .) Uma função que tem infinitas derivadas é chamadainfinitamente diferenciável ou suave .

Na linha real, toda função polinomial é infinitamente diferenciável. Pelas regras de diferenciação padrão , se um polinômio de grau n é diferenciado n vezes, então ele se torna uma função constante . Todas as suas derivadas subsequentes são identicamente zero. Em particular, eles existem, então polinômios são funções suaves.

As derivadas de uma função f em um ponto x fornecem aproximações polinomiais para essa função perto de x . Por exemplo, se f é duas vezes diferenciável, então

no sentido de que

Se f é infinitamente diferenciável, então este é o início da série de Taylor para f avaliada em x + h em torno de x .

Ponto de inflexão

Um ponto onde a segunda derivada de uma função muda de sinal é chamado de ponto de inflexão . [3] Em um ponto de inflexão, a segunda derivada pode ser zero, como no caso do ponto de inflexão x = 0 da função dada por, ou pode deixar de existir, como no caso do ponto de inflexão x = 0 da função dada por. Em um ponto de inflexão, uma função muda de uma função convexa para uma função côncava ou vice-versa.

Notação (detalhes)

A notação de Leibniz

Os símbolos,, eforam introduzidos por Gottfried Wilhelm Leibniz em 1675. [4] Ainda é comumente usado quando a equação y = f ( x ) é vista como uma relação funcional entre variáveis ​​dependentes e independentes . Então a primeira derivada é denotada por

e já foi pensado como um quociente infinitesimal . Derivadas mais altas são expressas usando a notação

para a n - ésima derivada de. Estas são abreviações para várias aplicações do operador derivativo. Por exemplo,

Com a notação de Leibniz, podemos escrever a derivada deno pontode duas maneiras diferentes:

A notação de Leibniz permite especificar a variável para diferenciação (no denominador), que é relevante na diferenciação parcial . Também pode ser usado para escrever a regra da cadeia como [Nota 2]

notação de Lagrange

Às vezes referida como notação prima , [5] uma das notações modernas mais comuns para diferenciação é devido a Joseph-Louis Lagrange e usa a marca prima , de modo que a derivada de uma funçãoé denotado. Da mesma forma, a segunda e terceira derivadas são denotadas

  e  

Para denotar o número de derivadas além deste ponto, alguns autores usam algarismos romanos em sobrescrito , enquanto outros colocam o número entre parênteses:

  ou  

A última notação generaliza para produzir a notaçãopara a n - ésima derivada de– esta notação é mais útil quando queremos falar sobre a derivada como sendo uma função em si, pois neste caso a notação de Leibniz pode se tornar incômoda.

notação de newton

A notação de Newton para diferenciação, também chamada de notação de ponto, coloca um ponto sobre o nome da função para representar uma derivada de tempo. Se, então

  e  

denotam, respectivamente, a primeira e a segunda derivada de. Esta notação é usada exclusivamente para derivações em relação ao tempo ou comprimento de arco . É normalmente usado em equações diferenciais em física e geometria diferencial . [6] [7] A notação de ponto, no entanto, torna-se incontrolável para derivadas de alta ordem (ordem 4 ou mais) e não pode lidar com múltiplas variáveis ​​independentes.

notação de Euler

A notação de Euler usa um operador diferencial , que é aplicado a uma funçãopara dar a primeira derivada. A n -ésima derivada é denotada.

Se y = f ( x ) é uma variável dependente, então frequentemente o subscrito x é anexado ao D para esclarecer a variável independente x . A notação de Euler é então escrita

  ou   ,

embora este subscrito seja muitas vezes omitido quando a variável x é entendida, por exemplo, quando esta é a única variável independente presente na expressão.

A notação de Euler é útil para estabelecer e resolver equações diferenciais lineares .

Regras de computação

A derivada de uma função pode, em princípio, ser calculada a partir da definição, considerando o quociente de diferença e computando seu limite. Na prática, uma vez que as derivadas de algumas funções simples são conhecidas, as derivadas de outras funções são mais facilmente calculadas usando regras para obter derivadas de funções mais complicadas a partir de funções mais simples.

Regras para funções básicas

Aqui estão as regras para as derivadas das funções básicas mais comuns, onde a é um número real.

  • Derivadas de potências :
  • Funções exponenciais e logarítmicas :
  • Funções trigonométricas :
  • Funções trigonométricas inversas :

Regras para funções combinadas

Aqui estão algumas das regras mais básicas para deduzir a derivada de uma função composta a partir de derivadas de funções básicas.

  • Regra constante : se f ( x ) é constante, então
  • Regra da soma :
    para todas as funções f e g e todos os números reaise.
  • Regra do produto :
    para todas as funções f e g . Como caso especial, esta regra inclui o fatosempre queé uma constante, poispela regra constante.
  • Regra do quociente :
    para todas as funções f e g em todas as entradas onde g ≠ 0 .
  • Regra da cadeia para funções compostas: Se, então

Exemplo de computação

A derivada da função dada por

é

Aqui o segundo termo foi calculado usando a regra da cadeia e o terceiro usando a regra do produto . As derivadas conhecidas das funções elementares x 2 , x 4 , sin( x ), ln( x ) e exp( x ) = e x , bem como a constante 7, também foram utilizadas.

Definição com hiper-reais

Em relação a uma extensão hiperreal RR dos números reais, a derivada de uma função real y = f ( x ) em um ponto real x pode ser definida como a sombra do quociente∆y _/xpara infinitesimal x , onde y = f ( x + ∆ x ) − f ( x ) . Aqui a extensão natural de f para os hiper-reais ainda é denotada f . Aqui diz-se que a derivada existe se a sombra for independente do infinitesimal escolhido.

Em dimensões superiores

Funções com valor vetorial

Uma função com valor vetorial y de uma variável real envia números reais para vetores em algum espaço vetorial R n . Uma função com valor vetorial pode ser dividida em suas funções de coordenadas y 1 ( t ), y 2 ( t ), ..., y n ( t ) , significando que y ( t ) = ( y 1 ( t ), . .., s n ( t )) . Isso inclui, por exemplo, curvas paramétricas em R 2ou R3 . _ As funções de coordenadas são funções de valor real, então a definição acima de derivada se aplica a elas. A derivada de y ( t ) é definida como o vetor , chamado de vetor tangente , cujas coordenadas são as derivadas das funções de coordenadas. Aquilo é,

Equivalentemente,

se o limite existir. A subtração no numerador é a subtração de vetores, não de escalares. Se a derivada de y existe para todo valor de t , então y ′ é outra função com valor vetorial.

Se e 1 , ..., e n é a base padrão para R n , então y ( t ) também pode ser escrito como y 1 ( t ) e 1 + ⋯ + y n ( t ) e n . Se assumirmos que a derivada de uma função com valor vetorial retém a propriedade de linearidade , então a derivada de y ( t ) deve ser

porque cada um dos vetores de base é uma constante.

Essa generalização é útil, por exemplo, se y ( t ) for o vetor posição de uma partícula no tempo t ; então a derivada y ′( t ) é o vetor velocidade da partícula no instante t .

Derivados parciais

Suponha que f é uma função que depende de mais de uma variável - por exemplo,

f pode ser reinterpretado como uma família de funções de uma variável indexada pelas outras variáveis:

Em outras palavras, todo valor de x escolhe uma função, denotada por f x , que é uma função de um número real. [Nota 3] Ou seja,

Uma vez que um valor de x é escolhido, digamos a , então f ( x , y ) determina uma função f a que envia y para a 2 + ay + y 2 :

Nesta expressão, a é uma constante , não uma variável , então f a é uma função de apenas uma variável real. Consequentemente, a definição da derivada para uma função de uma variável se aplica:

O procedimento acima pode ser executado para qualquer escolha de um arquivo . A montagem das derivadas em uma função fornece uma função que descreve a variação de f na direção y :

Esta é a derivada parcial de f em relação a y . Aqui ∂ é um d arredondado chamado símbolo da derivada parcial . Para distingui-lo da letra d , ∂ às vezes é pronunciado "der", "del" ou "parcial" em vez de "dee".

Em geral, a derivada parcial de uma função f ( x 1 , …, x n ) na direção x i no ponto ( a 1 , ..., a n ) é definida como:

No quociente de diferença acima, todas as variáveis, exceto x i , são mantidas fixas. Essa escolha de valores fixos determina uma função de uma variável

e, por definição,

Em outras palavras, as diferentes escolhas de um índice são uma família de funções de uma variável, como no exemplo acima. Essa expressão também mostra que o cálculo de derivadas parciais se reduz ao cálculo de derivadas de uma variável.

Isso é fundamental para o estudo das funções de diversas variáveis ​​reais . Seja f ( x 1 , ..., x n ) uma função de valor real . Se todas as derivadas parciais f / ∂ x j de f são definidas no ponto a = ( a 1 , ..., a n ) , essas derivadas parciais definem o vetor

que é chamado de gradiente de f em a . Se f é diferenciável em todos os pontos em algum domínio, então o gradiente é uma função de valor vetorial f que mapeia o ponto ( a 1 , ..., a n ) para o vetor f ( a 1 , ..., um n ) . Conseqüentemente, o gradiente determina um campo vetorial .

Derivados direcionais

Se f é uma função de valor real em R n , então as derivadas parciais de f medem sua variação na direção dos eixos coordenados. Por exemplo, se f é uma função de xey , então suas derivadas parciais medem a variação de f na direção x e na direção y . No entanto, eles não medem diretamente a variação de f em qualquer outra direção, como ao longo da linha diagonal y = x . Estes são medidos usando derivadas direcionais. Escolha um vetor

A derivada direcional de f na direção de v no ponto x é o limite

Em alguns casos, pode ser mais fácil calcular ou estimar a derivada direcional após alterar o comprimento do vetor. Muitas vezes isso é feito para transformar o problema no cálculo de uma derivada direcional na direção de um vetor unitário. Para ver como isso funciona, suponha que v = λ u onde u é um vetor unitário na direção de v . Substitua h = k / λ no quociente de diferença. O quociente diferencial fica:

Isso é λ vezes o quociente de diferença para a derivada direcional de f em relação a u . Além disso, tomar o limite quando h tende a zero é o mesmo que tomar o limite quando k tende a zero porque h e k são múltiplos um do outro. Portanto, D v ( f ) = λ D u ( f ) . Devido a esta propriedade de reescalonamento, as derivadas direcionais são frequentemente consideradas apenas para vetores unitários.

Se todas as derivadas parciais de f existem e são contínuas em x , então elas determinam a derivada direcional de f na direção v pela fórmula:

Isso é uma consequência da definição da derivada total . Segue que a derivada direcional é linear em v , significando que D v + w ( f ) = D v ( f ) + Dw ( f ) .

A mesma definição também funciona quando f é uma função com valores em R m . A definição acima é aplicada a cada componente dos vetores. Neste caso, a derivada direcional é um vetor em R m .

Derivada total, diferencial total e matriz Jacobiana

Quando f é uma função de um subconjunto aberto de R n para R m , então a derivada direcional de f em uma direção escolhida é a melhor aproximação linear de f naquele ponto e naquela direção. Mas quando n > 1 , nenhuma derivada direcional pode fornecer uma imagem completa do comportamento de f . A derivada total fornece uma imagem completa considerando todas as direções ao mesmo tempo. Ou seja, para qualquer vetor v começando em a , a fórmula de aproximação linear é válida:

Assim como a derivada de variável única, f  ′( a ) é escolhida de modo que o erro nesta aproximação seja o menor possível.

Se n e m são ambos um, então a derivada f  ′( a ) é um número e a expressão f  ′( a ) v é o produto de dois números. Mas em dimensões mais altas, é impossível que f  ′( a ) seja um número. Se fosse um número, então f  ′( a ) v seria um vetor em R n enquanto os outros termos seriam vetores em R m e, portanto, a fórmula não faria sentido. Para que a fórmula de aproximação linear faça sentido, f  ′(a ) deve ser uma função que envia vetores em R n para vetores em R m , e f  ′( a ) v deve denotar essa função avaliada em v .

Para determinar que tipo de função é, observe que a fórmula de aproximação linear pode ser reescrita como

Observe que se escolhermos outro vetor w , essa equação aproximada determinará outra equação aproximada substituindo w por v . Ele determina uma terceira equação aproximada substituindo w por v e a + v por a . Subtraindo essas duas novas equações, obtemos

Se assumirmos que v é pequeno e que a derivada varia continuamente em a , então f  ′( a + v ) é aproximadamente igual a f  ′( a ) , e portanto o lado direito é aproximadamente zero. O lado esquerdo pode ser reescrito de uma maneira diferente usando a fórmula de aproximação linear com v + w substituindo v . A fórmula de aproximação linear implica:

Isto sugere que f  '( a ) é uma transformação linear do espaço vetorial R n para o espaço vetorial R m . De fato, é possível fazer uma derivação precisa medindo o erro nas aproximações. Suponha que o erro nesta fórmula de aproximação linear seja limitado por uma constante vezes || v ||, onde a constante é independente de v mas depende continuamente de a . Então, depois de adicionar um termo de erro apropriado, todas as igualdades aproximadas acima podem ser reformuladas como desigualdades. Em particular, f  '( a )é uma transformação linear até um pequeno termo de erro. No limite como v e w tendem a zero, deve, portanto, ser uma transformação linear. Como definimos a derivada total tomando um limite quando v tende a zero, f  ′( a ) deve ser uma transformação linear.

Em uma variável, o fato de a derivada ser a melhor aproximação linear é expresso pelo fato de ser o limite dos quocientes de diferença. No entanto, o quociente de diferença usual não faz sentido em dimensões mais altas porque geralmente não é possível dividir vetores. Em particular, o numerador e o denominador do quociente de diferença não estão nem no mesmo espaço vetorial: o numerador está no contradomínio R m enquanto o denominador está no domínio R n . Além disso, a derivada é uma transformação linear, um tipo de objeto diferente do numerador e do denominador. Para tornar mais precisa a ideia de que f  ′( a )é a melhor aproximação linear, é necessário adaptar uma fórmula diferente para a derivada de uma variável na qual esses problemas desaparecem. Se f  : RR , então a definição usual da derivada pode ser manipulada para mostrar que a derivada de f em a é o único número f  ′( a ) tal que

Isso é equivalente a

porque o limite de uma função tende a zero se e somente se o limite do valor absoluto da função tende a zero. Esta última fórmula pode ser adaptada à situação de muitas variáveis ​​substituindo os valores absolutos por normas .

A definição da derivada total de f em a , portanto, é que é a única transformação linear f  ′( a ): R nR m tal que

Aqui h é um vetor em R n , então a norma no denominador é o comprimento padrão em R n . No entanto, f ′( a ) h é um vetor em R m , e a norma no numerador é o comprimento padrão em R m . Se v é um vetor começando em a , então f  ′( a ) v é chamado de pushforward de v por f e às vezes é escrito f v .

Se a derivada total existe em a , então todas as derivadas parciais e direcionais de f existem em a , e para todo v , f  ′( a ) v é a derivada direcional de f na direção v . Se escrevermos f usando funções de coordenadas, de modo que f = ( f 1 , f 2 , ..., f m ) , então a derivada total pode ser expressa usando as derivadas parciais como uma matriz . Essa matriz é chamada deMatriz Jacobiana de f em a :

A existência da derivada total f ′( a ) é estritamente mais forte do que a existência de todas as derivadas parciais, mas se as derivadas parciais existem e são contínuas, então a derivada total existe, é dada pela Jacobiana e depende continuamente de um .

A definição da derivada total inclui a definição da derivada em uma variável. Isto é, se f é uma função de valor real de uma variável real, então a derivada total existe se e somente se a derivada usual existir. A matriz Jacobiana se reduz a uma matriz 1×1 cuja única entrada é a derivada f ′( x ). Esta matriz 1×1 satisfaz a propriedade de que f ( a + h ) − ( f ( a ) + f  ′( a ) h ) é aproximadamente zero, em outras palavras que

Até variáveis ​​variáveis, esta é a afirmação de que a funçãoé a melhor aproximação linear para f em a .

A derivada total de uma função não fornece outra função da mesma forma que o caso de uma variável. Isso ocorre porque a derivada total de uma função multivariável precisa registrar muito mais informações do que a derivada de uma função de variável única. Em vez disso, a derivada total fornece uma função do fibrado tangente da fonte ao fibrado tangente do alvo.

O análogo natural das derivadas totais de segunda, terceira e ordem superior não é uma transformação linear, não é uma função no fibrado tangente e não é construída tomando repetidamente a derivada total. O análogo de uma derivada de ordem superior, chamada de jato , não pode ser uma transformação linear porque as derivadas de ordem superior refletem informações geométricas sutis, como concavidade, que não podem ser descritas em termos de dados lineares, como vetores. Não pode ser uma função no fibrado tangente porque o fibrado tangente só tem espaço para o espaço de base e as derivadas direcionais. Como os jatos capturam informações de ordem superior, eles tomam como argumentos coordenadas adicionais que representam mudanças de direção de ordem superior. O espaço determinado por essas coordenadas adicionais é chamado depacote de jato . A relação entre a derivada total e as derivadas parciais de uma função é paralela na relação entre o jato de ordem k de uma função e suas derivadas parciais de ordem menor ou igual a k .

Tomando repetidamente a derivada total, obtém-se versões superiores da derivada de Fréchet , especializada em R p . A derivada total de ordem k pode ser interpretada como um mapa

que toma um ponto x em R n e atribui a ele um elemento do espaço de k mapas lineares de R n a R m – a "melhor" (em certo sentido preciso) k aproximação linear de f naquele ponto. Ao precompô-la com a aplicação diagonal Δ, x → ( x , x ) , uma série de Taylor generalizada pode ser iniciada como

onde f( a ) é identificado com uma função constante, x ia i são os componentes do vetor xa , e ( Df ) i e ( D 2 f ) jk são os componentes de Df e D 2 f como lineares transformações.

Generalizações

O conceito de derivada pode ser estendido a muitas outras configurações. A linha comum é que a derivada de uma função em um ponto serve como uma aproximação linear da função naquele ponto.

  • Uma generalização importante da derivada diz respeito a funções complexas de variáveis ​​complexas , como funções de (um domínio) dos números complexos C a C. A noção de derivada de tal função é obtida substituindo variáveis ​​reais por variáveis ​​complexas na definição. Se C é identificado com R 2 escrevendo um número complexo z como x + iy , então uma função diferenciável de C para C é certamente diferenciável como uma função de R 2 para R 2(no sentido de que todas as suas derivadas parciais existem), mas o inverso não é verdade em geral: a derivada complexa só existe se a derivada real for linear complexa e isso impõe relações entre as derivadas parciais chamadas equações de Cauchy-Riemann – veja holomorfa funções .
  • Outra generalização diz respeito a funções entre variedades diferenciáveis ​​ou suaves . Intuitivamente falando, tal variedade M é um espaço que pode ser aproximado perto de cada ponto x por um espaço vetorial chamado seu espaço tangente : o exemplo prototípico é uma superfície lisa em R 3 . A derivada (ou diferencial) de uma aplicação (diferenciável) f : MN entre variedades, em um ponto x em M , é então uma aplicação linear do espaço tangente de M em x ao espaço tangente deN em f ( x ). A função derivada torna-se um mapa entre os fibrados tangentes de M e N . Esta definição é fundamental na geometria diferencial e tem muitos usos – veja pushforward (diferencial) e pullback (geometria diferencial) .
  • A diferenciação também pode ser definida para mapas entre espaços vetoriais de dimensão infinita , como espaços de Banach e espaços de Fréchet . Existe uma generalização tanto da derivada direcional, chamada derivada de Gateaux , quanto da diferencial, chamada derivada de Fréchet .
  • Uma deficiência da derivada clássica é que muitas funções não são diferenciáveis. No entanto, existe uma maneira de estender a noção de derivada para que todas as funções contínuas e muitas outras funções possam ser diferenciadas usando um conceito conhecido como derivada fraca . A ideia é embutir as funções contínuas em um espaço maior chamado espaço de distribuições e exigir apenas que uma função seja diferenciável "em média".
  • As propriedades da derivada inspiraram a introdução e o estudo de muitos objetos semelhantes em álgebra e topologia — veja, por exemplo, álgebra diferencial .
  • O equivalente discreto da diferenciação são as diferenças finitas . O estudo do cálculo diferencial é unificado com o cálculo das diferenças finitas no cálculo da escala de tempo .
  • Veja também derivada aritmética .

História

Cálculo , conhecido em sua história inicial como cálculo infinitesimal , é uma disciplina matemática focada em limites , funções , derivadas, integrais e séries infinitas . Isaac Newton e Gottfried Leibniz descobriram o cálculo independentemente em meados do século XVII. No entanto, cada inventor afirmou que o outro roubou seu trabalho em uma disputa amarga que continuou até o fim de suas vidas.

Veja também

Notas

  1. O cálculo diferencial, conforme discutido neste artigo, é uma disciplina matemática muito bem estabelecida para a qual existem muitas fontes. Veja Apostol 1967, Apostol 1969 e Spivak 1994.
  2. Na formulação do cálculo em termos de limites, o símbolo du recebeu vários significados por vários autores. Alguns autores não atribuem um significado a du por si só, mas apenas como parte do símbolo du / dx . Outros definem dx como uma variável independente e definem du por du = dxf ( x ) . Na análise não padronizada du é definido como um infinitesimal. Também é interpretado como a derivada exterior de uma função u . Verdiferencial (infinitesimal) para mais informações.
  3. ^ Isso também pode ser expresso como a operação conhecida como curry .

Referências

  1. ^ Spivak 1994, capítulo 10.
  2. ^ Banach, S. (1931), "Uber die Baire'sche Kategorie gewisser Funktionenmengen" , Studia Math. , 3 (3): 174–179, doi : 10,4064/sm-3-1-174-179 .. Citado por Hewitt, E; Stromberg, K (1963), Análise real e abstrata , Springer-Verlag, Teorema 17.8
  3. ^ Apostol 1967 , §4.18
  4. Manuscrito de 11 de novembro de 1675 (Cajori vol. 2, página 204)
  5. ^ "A Notação de Diferenciação" . MIT. 1998 . Recuperado em 24 de outubro de 2012 .
  6. ^ Evans, Lawrence (1999). Equações diferenciais parciais . Sociedade Americana de Matemática. pág. 63. ISBN 0-8218-0772-2.
  7. ^ Kreyszig, Erwin (1991). Geometria Diferencial . Nova York: Dover. pág. 1. ISBN 0-486-66721-9.

Bibliografia

Imprimir

Livros on-line

links externos