• Nenhum resultado encontrado

Capítulo Gradiente e hessiana

N/A
N/A
Protected

Academic year: 2021

Share "Capítulo Gradiente e hessiana"

Copied!
24
0
0

Texto

(1)

Cap´ıtulo 2.11 - Gradiente e hessiana

2.11.1 - Nova nota¸c˜ao 2.11.4 - O gradiente e as curvas de n´ıvel

2.11.2 - Gradiente e hessiana 2.11.5 - Interpreta¸c˜ao econˆomica do gradiente 2.11.3 - Significado do gradiente

Vimos nos ´ultimos dois cap´ıtulos como calcular derivadas de primeira e de segunda ordens (de ordens superiores, tamb´em) de fun¸c˜oes de duas ou mais vari´aveis reais. Veremos agora como organizar essas derivadas, em termos do vetor gradiente e da matriz hessiana, de um modo que ser´a ´util na maximiza¸c˜ao ou minimiza¸c˜ao dessas fun¸c˜oes. Veremos tamb´em o significado do vetor gradiente.

2.11.1 - Nova nota¸c˜

ao

Quando tratamos da derivada de fun¸c˜oes de uma vari´avel real, existem dois tipos de nota¸c˜ao, usadas de acordo com a comodidade e da preferˆencia da pessoa que as usa: a nota¸c˜ao de Leibniz, df

dx, e a nota¸c˜ao de Newton, f′(x). A primeira enfatiza o fato da derivada ser um limite de uma taxa de varia¸c˜ao e a segunda

ressalta o fato da derivada ser uma fun¸c˜ao. At´e o momento, temos usado uma nota¸c˜ao mais ao estilo de Leibniz para derivadas parciais: ∂f

∂xi. Veremos agora uma nota¸c˜ao mais ao estilo de Newton.

Primeiro, n˜ao podemos utilizar a nota¸c˜ao f (x), pois temos que especificar com rela¸c˜ao a qual vari´avel estamos derivando. A solu¸c˜ao ´e escrever

fx =

∂f

∂x e fy = ∂f ∂y .

Note que a nota¸c˜ao utiliza um x como subscrito (letra menor, colocada um pouco abaixo da base da letra f ) para designar a derivada parcial com rela¸c˜ao a x e um y subscrito para designar a derivada com rela¸c˜ao a y.

Exemplo 1: calcule as derivadas parciais da fun¸c˜ao f (x, y) =px3− y2.

Solu¸c˜ao: escrevendo f (x, y) = (x3

− y2 )1/2, calculamos fx= 1 2(x 3 − y2 )−1/2· 3x2 = 3x 2 2px3 − y2 e fy= 1 2(x 3 − y2 )−1/2· (−2y) = −y px3 − y2 .

Essa nota¸c˜ao tamb´em ´e facilmente generalizada para o caso de fun¸c˜oes com mais de duas vari´aveis, como no exemplo a seguir.

Exemplo 2: calcule as derivadas parciais da fun¸c˜ao f (x, y, z) = 2xln(y − z).

Solu¸c˜ao: as derivadas parciais ficam

fx= 2xln 2 ln(y − z) , fy=

2x

y − z e fz= −2x

y − z . A nota¸c˜ao para derivadas parciais de segunda ordem ´e dada a seguir:

fxx= (fx)x = ∂2f ∂x2 , fxy = (fx)y = ∂2f ∂y∂x , fyx= (fy)x= ∂2f ∂x∂y , fyy = (fy)y = ∂2f ∂y2 .

(2)

Exemplo 3: calcule as derivadas parciais de segunda ordem da fun¸c˜ao f (x, y) =px3− y2.

Solu¸c˜ao: utilizando as derivadas parciais calculadas no exemplo 1 escritas sob a forma de potˆencias: fx=3 2x 2 (x3 − y2 )−1/2 e f y= −y(x3− y2)−1/2 , temos fxx=3 2 · 2x · (x 3 − y2 )−1/2+3 2x 2 ·  −12  (x3 − y2 )−3/2· 3x2 = 3x(x3 − y2 )−1/29 4x 2 (x3 − y2 )−3/2 , fxy= fyx= 3 2x 2 ·  −12  (x3 − y2 )−3/2· (−2y) = 3 2x 2 y(x3 − y2 )−3/2 , fyy= −1 · (x 3 − y2 )−1/2− y ·  −1 2  (x3 − y2 )−3/2· (−2y) = −(x3 − y2 )−1/2− y2 (x3 − y2 )−3/2 .

A nota¸c˜ao para as derivadas parciais de fun¸c˜oes de mais de duas vari´aveis, ou a nota¸c˜ao de derivadas parciais de ordens superiores a dois, pode ser facilmente deduzida a partir da´ı.

2.11.2 - Gradiente e hessiana

Agora introduziremos dois conceitos que nos ser˜ao ´uteis quando formos trabalhar em otimiza¸c˜ao: os de gradiente e hessiana. O gradiente de uma fun¸c˜ao de duas vari´aveis reais ´e um vetor (matriz 2 × 1) definido como ~ ∇f(x, y) =  fx fy  , e a hessiana ´e a matriz

H(f ) =  fxx fxy fyx fyy  .

Exemplo 1: calcule o gradiente e a hessiana da fun¸c˜ao f (x, y) = xy2+ 2x. Solu¸c˜ao: o gradiente e a hessiana ficam

~ ∇f(x, y) =  fx fy  =  y2 + 2 2xy  , H(f ) =  fxx fxy fyx fyy  =  0 2y 2y 2x  .

Esses dois conceitos podem ser generalizados para fun¸c˜oes de n vari´aveis reais, como veremos a seguir para n = 3. ~ ∇f(x, y, z) =   fx fy fz   , H(f ) =   fxx fxy fxz fyx fyy fyz fzx fzy fzz   .

Exemplo 2: calcule o gradiente e a hessiana da fun¸c˜ao f (x, y) = x ln(yz). Solu¸c˜ao: temos

~ ∇f(x, y, z) =   fx fy fz  =   ln(yz) x/y x/z   , H(f ) =   fxx fxy fxz fyx fyy fyz fzx fzy fzz  =   0 1/y 1/z 1/y −x/y2 0 1/z 0 −x/z2   .

(3)

Exemplo 3: calcule o gradiente e a hessiana da fun¸c˜ao f (x, y) = xy2+ 2x em (x, y) = (1, −1). Solu¸c˜ao: dados o gradiente e a hessiana calculados no exemplo 1, temos

~ ∇f(1, −1) =  (−1)2 + 2 2 · 1 · (−1)  =  3 −2  , H(f ) =  0 2(−1) 2(−1) 2 · 1  =  0 −2 −2 2  .

Podemos nos perguntar, com toda a raz˜ao, quais s˜ao os significados do gradiente e da hessiana. A resposta para o gradiente ´e dada a seguir. Para a hessiana, teremos que esperar mais um pouco.

2.11.3 - Significado do gradiente

O gradiente tem uma caracter´ıstica muito importante, que ser´a mostrada nos exemplos a seguir.

Exemplo 1: calcule o gradiente de f (x, y) = x2+ y2 em (x, y) = (1, 0), (x, y) = (0, 1), (x, y) = (1, 1) e (x, y) = (0, 0) e desenhe esses vetores sobre as curvas de n´ıvel da fun¸c˜ao.

Solu¸c˜ao: o gradiente de f (x, y) = x2

+ y2 fica ~ ∇f(x, y) =  fx fy  =  2x 2y  . Calculado nos pontos desejados, temos

~ ∇f(1, 0) =  2 0  , ~∇f(0, 1) =  0 2  , ~∇f(1, 1) =  2 2  , ~∇f(0, 0) =  0 0  .

Note que cada gradiente ´e um vetor, onde a primeira linha ´e a sua primeira componente e a segunda linha ´e a sua segunda componente. Por exemplo, ~∇f(1, 0) ´e um vetor que, a partir do ponto (1, 0), se desloca duas unidades `a direita; o vetor ~∇f(0, 1) se desloca duas unidades para cima a partir do ponto (0, 1). A seguir, representamos cada um desses vetores sobre as curvas de n´ıvel da fun¸c˜ao. A fun¸c˜ao em trˆes dimens˜oes (um parabol´oide), com os vetores gradientes, ´e mostrada na ´ultima figura a seguir.

x y −3 −2 −1 0 1 2 3 −3 −2 −1 1 2 3 b b x y −3 −2 −1 0 1 2 3 −3 −2 −1 1 2 3 b b x y −3 −2 −1 0 1 2 3 −3 −2 −1 1 2 3 b b x y −3 −2 −1 0 1 2 3 −3 −2 −1 1 2 3 bb x y z 1.0 2.0 3.0 -1 .0 -2 .0 -3 .0 -4 .0 1.0 2.0 3.0 -1.0 -2.0 -3.0 -4.0 1.0 2.0 3.0 4.0 b b b

(4)

Note que os vetores gradiente sempre idicam a dire¸c˜ao onde a fun¸c˜ao aumenta mais rapidamente e que, no ponto onde a fun¸c˜ao ´e m´ınima, o vetor gradiente se anula. Vamos verificar esse comportamento em uma outra fun¸c˜ao.

Exemplo 2: calcule o gradiente de f (x, y) = 4 − x2− y2+ 2x + y + xy em (x, y) = (1, 0), (x, y) = (0, 1), (x, y) = (1, 1) e (x, y) = (0, 0) e desenhe esses vetores sobre as curvas de n´ıvel da fun¸c˜ao.

Solu¸c˜ao: o gradiente de f (x, y) = 4 − x2

− y2 + 2x + y + xy fica ~ ∇f(x, y) =  fx fy  =  −2x + 2 + y −2y + 1 + x  . Calculado nos pontos desejados, temos

~ ∇f(1, 0) =  0 2  , ~∇f(0, 1) =  3 −1  , ~∇f(1, 1) =  1 0  , ~∇f(0, 0) =  2 1  .

A seguir, representamos cada um desses vetores sobre as curvas de n´ıvel da fun¸c˜ao. A fun¸c˜ao em trˆes dimens˜oes (um parabol´oide el´ıptico), com os vetores gradientes ´e mostrada na ´ultima figura a seguir.

x y −2 −1 0 1 2 3 4 5 −2 −1 1 2 3 4 5 b b x y −2 −1 0 1 2 3 4 5 −2 −1 1 2 3 4 5 b b x y −2 −1 0 1 2 3 4 5 −2 −1 1 2 3 4 5 b b x y −2 −1 0 1 2 3 4 5 −2 −1 1 2 3 4 5 b b x y z 1.0 2.0 3.0 -1 .0 -2 .0 -3 .0 -4 .0 1.0 2.0 3.0 -1.0 -2.0 -3.0 -4.0 1.0 2.0 3.0 4.0 5.0 6.0 b b

Como no exemplo 1, os vetores gradiente seguem sempre a dire¸c˜ao para onde a fun¸c˜ao cresce mais rapida-mente a partir do ponto dado. Outra caracter´ıstica ´e que o vetor gradiente em um determinado ponto sempre segue uma reta perpendicular `a curva de n´ıvel naquele ponto.

Um exemplo pode facilitar a compreens˜ao da utilidade do gradiente: consideremos um aplpinista m´ıope que quer subri uma montanha. Ele s´o enxerga claramente at´e dois metros de distˆancia e n˜ao tem como enxergar mais longe que isso. Como ele far´a para subir a montanha?

Uma resposta ´e que ele pode, dentro de seu campo de vis˜ao, identificar para onde o terreno tem um maior aclive (sobe mais rapidamente) e subir um pouco naquela dire¸c˜ao e sentido. Depois, ele p´ara e verifica novamente o terreno em torno de onde ele est´a. Segue novamente a dire¸c˜ao para onde o terreno for mai ´ıngreme e repete o processo at´e que o terreno n˜ao tenha mais para onde subir.

Essa t´atica pode ou n˜ao funcionar, pois o alpinista, caso n˜ao se defronte com algum abismo pelo caminho, pode acabar chegando a um pico (m´aximo) local, achando que j´a chegou ao poco da montanha, quando ainda

(5)

est´a bem longe dela. A figura a seguir ilustra dois caminhos obtidos usando o gradiente como guia: no primeiro caminho (em vermelho), chega-se ao topo do maior dos dois picos; no segundo (azul), chega-se apenas a um m´aximo local.

Concluindo esta se¸c˜ao, o gradiente ´e um vetor que d´a a dire¸c˜ao de maior crescimento da fun¸c˜ao a partir de um determinado ponto. Isto ser´a muito ´util na maximiza¸c˜ao ou minimiza¸c˜ao de uma fun¸c˜ao (a Leitura Complementar 1.5.1 traz um m´etodo num´erico utilizando o gradiente para determinar m´aximos e m´ınimos de fun¸c˜oes de diversas vari´aveis). A hessiana servir´a mais tarde para verificar se um determinado ponto cr´ıtico ´e um m´aximo, um m´ınimo ou um ponto de inflex˜ao (ponto se sela). A demonstra¸c˜ao disto necessita do conceito de derivada direcional e ser´a feita em uma leitura complementar do M´odulo 2 deste curso.

2.11.4 - O gradiente e as curvas de n´ıvel

Algo que pode ser notado nas figuras dos exemplos da se¸c˜ao anterior ´e que o vetor gradiente ´e sempre perpendicular `a curva de n´ıvel da qual ele parte. Isto ser´a provado agora, utilizando a regra da cadeia, aprendida no Cap´ıtulo 2.8.

A regra da cadeia para uma fun¸c˜ao f (x, y), ou seja, uma fun¸c˜ao f : D(f ) ⊂ R2 → R, onde x = x(t) e y = y(t), ´e dada por

df dt(t) = ∂f ∂x(x, y) dx dt(t) + ∂f ∂y(x, y) dy dt(t) .

Se considerarmos uma curva que seja a imagem de uma fun¸c˜ao vetorial γ (x(t), y(t)), podemos escrever f (γ(t)) e γ′(t) = dx

dt(t), dy

dt(t) 

, de modo que a mesma express˜ao para a regra da cadeia possa ser escrita df

dt (γ(t)) =∇f (γ(t)) , γ

(t) ,

isto porque h∇f (γ(t)) , γ′(t)i, o produto interno do gradiente pela derivada da fun¸c˜ao vetorial γ(t), ´e dado por

∇f (γ(t)) , γ′(t) = ∂f ∂x(x, y), ∂f ∂y(x, y)  , dx dt(t), dy dt(t)  = ∂f ∂x(x, y) dx dt(t) + ∂f ∂y(x, y) dy dt(t) . Consideremos agora uma curva de n´ıvel da fun¸c˜ao f (x, y), que pode ser dada pela equa¸c˜ao f (x, y) = f (γ(t)) = c, onde c ´e uma constante. Se derivarmos ambos os lados dessa express˜ao com rela¸c˜ao a t, obtemos

f (γ(t)) = c ⇔ dfdt(γ(t)) = 0 .

Substituindo agora a derivada da esquerda pela express˜ao compacta da regra da cadeia, ficamos com ∇f (γ(t)) , γ′(t) = 0 ,

(6)

de modo que ∇f (γ(t)) ´e perpendicular ao vetor γ′(t).

Na figura ao lado, fazemos o gr´afico de uma curva de n´ıvel e de um vetor γ′(t

0), que ´e

sem-pre tangente a essa curva de n´ıvel (de acordo com o Cap´ıtulo 1.6). Se o gradiente ´e perpendicular a γ′(t

0), ent˜ao ele ser´a perpendicular `a curva de n´ıvel

no ponto t0, que ´e o que quer´ıamos demonstrar.

Esse resultado ´e, na verdade, bem geral, e pode ser aplicado `as superf´ıcies de n´ıvel de fun¸c˜oes de trˆes vari´aveis reais ou `as hipersuperf´ıcies de n´ıvel de fun¸c˜oes de mias de trˆes vari´aveis. O vetor gradi-ente ser´a sempre perpendicular a essas superf´ıcies ou hipersuperf´ıcies de n´ıvel. x y γ(t0) γ′(t0) ∇f (x(t0), y(t0))

A demonstra¸c˜ao de que o gradiente ´e o vetor que indica a dire¸c˜ao e o sentido de maior crescimento de uma fun¸c˜ao necessita do conceito de derivada direcional e n˜ao serr´a feita no texto principal deste cap´ıtulo. Essa demonstra¸c˜ao ´e feita na Leitura Complementar 2.11.1. Um m´etodo num´erico de busca pelo m´aximo ou m´ınimo local de uma fun¸c˜ao utilizando o gradiente ´e explicado na Leitura Complementar 2.11.2. A se¸c˜ao a seguir mostra um significado econˆomico para o gradiente.

2.11.5 - Interpreta¸c˜

ao econˆ

omica do gradiente

O vetor gradiente pode ser aplicado em ´areas econˆomicas e administrativas indicando que atitudes tomar quando se quer aumentar o valor de uma fun¸c˜ao (como a produ¸c˜ao, a utilidade ou o lucro) em diminu´ı-la (como na diminui¸c˜ao de custos). Mais especificamente, no caso de uma fun¸c˜ao de produ¸c˜ao P (K, L) em termos do capital K investido e do trabalho L, o gradiente pode nos dar a propro¸c˜ao em que novos investimentos devem ser feitos em cada uma dessas ´areas, como mostra o exemplo a seguir.

Exemplo 1: um industrial tem que decidir onde investir R$ 100.000 e estima que a produ¸c˜ao de sua empresa possa ser modelada pela fun¸c˜ao P (K, L) = 1, 1K0,25L0,75, onde o capital investido K e o trabalho L s˜ao medidos em milh˜oes de reais. No momento, o capital investido ´e de 7 milh˜oes de reais e o gasto em trabalho ´e de 6 milh˜oes de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas ´areas de modo a maximizar a produ¸c˜ao da empresa.

Solu¸c˜ao: o vetor gradiente, calculado a partir do ponto (7, 6), correspondente ao n´ıvel atual de investimento (7 milh˜oes em capital e 6 milh˜oes em trabalho) determina a “dire¸c˜ao” de maior crescimento da produ¸c˜ao. Portanto, podemos come¸car calculando o gradiente da fun¸c˜ao nesse ponto:

~ ∇P (K, L) =  0, 275K−0,75L0,75 0, 825K0,25 L−0,25  ⇒ ~∇P (7, 6) =  0, 275 · 7−0,75· 60,75 0, 825 · 70,25 · 6−0,25  ≈  0, 245 0, 857  .

Portanto, de modo a aumentar a produ¸c˜ao ao m´aximo, deve-se usar uma propor¸c˜ao de 0, 245

0, 857 entre o capital e o trabalho. Escrevendo o dinheiro dispon´ıvel em termos de milh˜oes de reais, isto significa que deve-se investir

IK =

0, 245

0, 245 + 0, 857· 0, 1 ≈ 0, 022 , IL =

0, 857

0, 245 + 0, 857· 0, 1 ≈ 0, 078 , isto ´e, deve-se investir R$ 22.000 em capital e deve-se gastar R$ 78.000 em trabalho.

(7)

Exemplo 2: considere que o industrial do exemplo anterior tenha investido R$ 22.000 em capital e tenha gasto R$ 78.000 em trabalho. Agora ele tem mais R$ 100.000 para investir. Onde esse dinheiro deve ser investido?

Solu¸c˜ao: no momento, temos K = 7 + 0, 22 = 7, 22 e L = 6 + 0, 78 = 6, 78, medidos em milh˜oes de reais. O vetor gradiente j´a foi calculado no exemplo anterior, de modo que s´o temos que calcul´a-lo para K = 7, 22 e L = 6, 78:

~ ∇P (K, L) =  0, 275K−0,75L0,75 0, 825K0,25 L−0,25  ⇒ ~∇P (7, 22 , 6, 78) =  0, 275 · 7, 22−0,75· 6, 780,75 0, 825 · 7, 220,25 · 6, 78−0,25  ≈  0, 262 0, 838  .

Para aumentar a produ¸c˜ao ao m´aximo, deve-se usar uma propor¸c˜ao de 0, 262

0, 838 entre o capital e o trabalho. Isto significa que deve-se investir

IK =

0, 262

0, 262 + 0, 838· 0, 1 ≈ 0, 024 , IL =

0, 838

0, 262 + 0, 838· 0, 1 ≈ 0, 076 , isto ´e, deve-se investir R$ 24.000 em capital e deve-se gastar R$ 76.000 em trabalho.

Note que as propro¸c˜oes de quanto deve ser investido em capital ou trabalho mudam de acordo com o n´ıvel pr´evio de investimento. No segundo exemplo, o investimento em trabalho n˜ao foi t˜ao grande quanto no primeiro. Isto porque, de acordo com a fun¸c˜ao de produ¸c˜ao escolhida, investimentos em capital e trabalho trazem resultados cada vez menores em termos de produ¸c˜ao conforme estes aumentam a patamares cada vez maiores.

Terminamos esta exposi¸c˜ao por aqui. Mais algumas aplica¸c˜oes do gradiente podem ser vistas na leitura complementar deste cap´ıtulo e nos exerc´ıcios. Aplica¸c˜oes para a matriz hessian ser˜ao vistas mais tarde.

Resumo

• Gradiente: o gradiente de uma fun¸c˜ao f(x, y) ´e o vetor ~ ∇f(x, y) =  fx fy 

O vetor gradiente, quando calculado em um ponto, d´a a dire¸c˜ao de maior varia¸c˜ao da fun¸c˜ao naquele ponto e ´e perpendicular `a curva de n´ıvel no mesmo ponto.

• Hessiana: a hessiana de uma fun¸c˜ao f(x, y) ´e a matriz H(f ) =  fxx fxy fyx fyy  .

• Significado do gradiente: o gradiente d´a, a cada ponto do dom´ınio de uma fun¸c˜ao, a dire¸c˜ao de maior crescimento da fun¸c˜ao a partir daquele ponto. Al´em disso, ele ´e sempre perpendicular `a curva de n´ıvel no ponto onde ´e calculado.

(8)

Leitura Complementar 2.11.1 - Derivada direcional

e o vetor gradiente

Como j´a vimos antes, o gradiente d´a as derivadas de uma fun¸c˜ao f com rela¸c˜ao a suas vari´aveis. Mais especificamente para uma f (x, y), ele fornece as derivadas parciais dessa fun¸c˜ao com rela¸c˜ao `as vari´aveis x e y. Como as derivadas parciais representam uma aproxima¸c˜ao das taxas de varia¸c˜ao da fun¸c˜ao com rela¸c˜ao a suas vari´aveis, podemos escrever

~ ∇f(x, y) =  fx fy  ≈  ∆f /∆x ∆f /∆y  =  [f (x + ∆x, y) − f(x, y)] /∆x [f (x, y + ∆y) − f(x, y)] /∆y

 .

Isto significa que o gradiente d´a, aproximadamente, a varia¸c˜ao da fun¸c˜ao f (x, y) em duas dire¸c˜oes diferentes: uma com rela¸c˜ao ao eixo x e a outra com rela¸c˜ao ao eixo y.

Mas e se quisermos saber como a fun¸c˜ao varia com rela¸c˜ao a alguma outra dire¸c˜ao? Como podemos medir tal varia¸c˜ao?

Voltemos, agora, ao exemplo pr´atico de uma fun¸c˜ao de produ¸c˜ao de Cobb-Douglas: P (K, L) = AKαL1−α. Podemos calcular, usando derivadas parciais, boas aproxima¸c˜oes para a produtividade marginal do capital, dada pela taxa de varia¸c˜ao de P com rela¸c˜ao a K, e para a produtividade marginal do trabalho, dada pela taxa de varia¸c˜ao de P com rela¸c˜ao a L, respectivamente dadas por

∆P ∆K = P (K + ∆K, L) − P (K, L) ∆K ≈ ∂P ∂K e ∆P ∆L = P (K, L + ∆L) − P (K, L) ∆L ≈ ∂P ∂L .

E se quisermos agora calcular a varia¸c˜ao da produ¸c˜ao quando fazemos uma varia¸c˜ao ∆K no capital investido e uma varia¸c˜ao ∆L no gasto com o trabalho? Podemos escrever essa varia¸c˜ao como

∆P = P (K + ∆K, L + ∆L) − P (K, L) .

O problema de como aproximar essa varia¸c˜ao por meio de derivadas parciais ´e semelhante ao problema de determinar a varia¸c˜ao de uma fun¸c˜ao em uma determinada dire¸c˜ao. A solu¸c˜ao para isso ´e definir uma derivada direcional.

a) A derivada direcional

A defini¸c˜ao de uma derivada direcional ´e dada a seguir.

Defini¸c˜ao 1 - Dada uma fun¸c˜ao f (x1, · · · , xn), a sua derivada direcional com rela¸c˜ao a uma dire¸c˜ao

dada pelo vetor u = 

u1

u2



´e definida como

Duf (x, y) = lim h→0

f (x + hu1, y + hu2) − f(x, y)

h ,

(9)

Exemplo 1: calcule a derivada direcional de f (x, y) = x2− xy + 4x + 8 na dire¸c˜ao u =  2 1  . Solu¸c˜ao: pela defini¸c˜ao 1, temos

Df(x, y) = lim h→0 f (x + hu1, y + hu2) − f(x, y) h = = lim h→0 (x + 2h)2 − (x + 2h)(y + h) + 4(x + 2h) + 8 − x2 + xy − 4x − 8 h = = lim h→0 x2 + 4hx + 4h2 − xy − hx − 2hy − 2h2 + 4x + 8h − x2 + xy − 4x h = = lim h→0 3hx + 2h2 − 2hy + 8h h = limh→0(3x + 2h − 2y + 8) = 3x − 2y + 8 .

Uma forma mais simples de se calcular uma derivada direcional ´e dada pelo teorema a seguir.

Teorema 5 - Dada uma fun¸c˜ao f (x, y) diferenci´avel em x e em y e um vetor u =  u1 u2  , ent˜ao Duf (x, y) = fx(x, y)u1+ fy(x, y)u2 .

Demonstra¸c˜ao: considere a derivada direcional Duf (x, y) = lim h→0

f (x + hu1, x + hu2) − f(x, y)

h . Se definirmos a fun¸c˜ao g(x) = f (x + hu1, y + hu2), ent˜ao teremos

g′(0) = lim h→0 g(h) − g(0) h = limh→0 f (x + hu1, y + hu2) − f(x, y) h = Du(x, y) . Escrevendo agora ¯x = x + hu1 e ¯y = y + hu2, temos g(h) = f (¯x, ¯y) e, pela regra da cadeia,

g′(h) = dg dh = fx¯(¯x, ¯y) d¯x dh + fy¯(¯x, ¯y) d¯y dh = fx¯u1+ fy¯u2 . Para h = 0, teremos ¯x = x, ¯y = y e g′(0) = f x(x, y)u1+ fy(x, y)u2.

Comparando agora as duas express˜oes para g′(0), conclu´ımos que

Du(x, y) = fx(x, y)u1+ fy(x, y)u2.

Exemplo 2: calcule a derivada direcional de f (x, y) = x2− xy + 4x + 8 na dire¸c˜ao u = 

2 1

 . Solu¸c˜ao: pelo teorema 1, temos

Df(x, y) = fxu1+ fyu2= (2x − y + 4) · 2 + (−x) · 1 = 4x − 2y + 8 − x = 3x − 2y + 8 .

Exemplo 3: calcule a derivada direcional de f (x, y) = ln(x3− y) na dire¸c˜ao u = 

−1 2

 . Solu¸c˜ao: pelo teorema 1, temos

Df(x, y) = fxu1+ fyu2= 1 x3 − y · 3x 2 · (−1) + 1 x3 − y · (−1) · 2 = −3x2 x3 − y − 2 x3 − y = −3x2 − 2 x3 − y .

O exemplo a seguir mostra os c´alculos das derivadas direcionais de uma fun¸c˜ao a partir de um ponto ao longo de trˆes vetores distintos.

(10)

Exemplo 4: calcule a derivada direcional de f (x, y) = x2+ y2− 4x + 2y + 2xy no ponto (3, 1) ao longo dos vetores u =  1 2  , v =  1 1  e w =  1 0  .

Solu¸c˜ao: primeiro, calculamos fx e fy: fx= 2x − 4 + 2y e fy= 2y + 2 + 2x.

Calculadas no ponto (3, 1), temos fx(3, 1) = 2·3−4+2·1 = 6−4+2 = 4 e fy(3, 1) = 2·1+2+2·3 = 2+2+6 = 10.

Agora, fica f´acil calcular as derivadas direcionais pedidas:

Duf (3, 1) = 4 · 1 + 10 · 2 = 24 , Dv(3, 1) = 4 · 1 + 10 · 1 = 14 , Dw(3, 1) = 4 · 1 + 10 · 0 = 4 .

b) Derivada direcional e o vetor gradiente

O conceito de derivada direcional serve, ainda, para provar que o vetor gradiente indica a dire¸c˜ao de maior crescimento de uma fun¸c˜ao. A demonstra¸c˜ao parte do fato de que, usando o vetor gradiente, podemos definir a derivada direcional de forma matricial:

Duf = u1 u2   fx fy  .

No entanto, a demonstra¸c˜ao envolve o conceito de produto escalar entre vetores, que ´e aprendido em cursos de ´

algebra vetorial e ser´a visto aqui de modo pragm´atico.

Podemos definir o produto escalar entre dois vetores u e v, escrito u · v, de duas formas distintas: u · v = tr (vtu) ,

onde vt´e a transposta do vetor v e v ´e o tra¸co (soma dos elementos da diagonal principal de uma matriz), ou

u · v = |u||v| cos θ ,

onde |u| e |v| s˜ao os m´odulos dos vetores u e v, respectivamente, e θ ´e o ˆangulo entre esses dois vetores. Cada uma dessas defini¸c˜oes ´e ´util, dependendo da forma como os dados do problema s˜ao fornecidos, como mostram os dois exemplos a seguir.

Exemplo 1: calcule u · v, onde u =

 −1 4  e v =  2 1  . Solu¸c˜ao: u · v = tr (vtu) = tr 2 1   −1 4  = tr (2) = 2 .

Exemplo 2: calcule u · v, onde |u| = 2, |v| = 3 e o ˆangulo entre eles ´e θ = 60o. Solu¸c˜ao: u · v = |u||v| cos θ = 2 · 3 · cos 60o= 6 ·1

2 = 3 .

De acordo com a primeira defini¸c˜ao de produto escalar, podemos escrever a defini¸c˜ao da derivada direcional como Duf = u1 u2   fx fy  = tr ~∇f · u , onde ~∇f =  fx fy  e u =  u1 u2 

. Alternativamente, poder´ıamos escrever essa mesma defini¸c˜ao do seguinte modo:

Duf = |~∇f||u| cos θ ,

onde θ ´e o ˆangulo entre o vetor gradiente e o vetor u.

Da segunda defini¸c˜ao, podemos ver que a derivada direcional ´e maior quando cos θ ´e maior. O valor m´aximo que cos θ pode ter ´e 1, o que ocorre quando θ = 0o. Portanto, o vetor gradiente e o vetor u devem ter a mesma dire¸c˜ao e sentido se quisermos maximizar a derivada direcional Duf . Da´ı, conclui-se que a dire¸c˜ao e o sentido

(11)

de maior valor da derivada direcional Duf , que ´e a dire¸c˜ao e o sentido de maior crescimento da fun¸c˜ao f , ´e ao

longo do gradiente.

Teorema 6 - Dada uma fun¸c˜ao f (x, y) diferenci´avel em x e em y e um vetor u = 

u1

u2

 , ent˜ao Duf (x, y) ´e m´axima se u = ~∇f(x, y).

Exemplo 3: determine a dire¸c˜ao de maior crescimento da fun¸c˜ao f (x, y) = 3x ln y no ponto (2, 1). Solu¸c˜ao: a dire¸c˜ao de maior cresciment ´e dada pelo vetor gradiente nesse ponto, isto ´e,

~ ∇f(x, y) =  fx fy  =  3 ln y 3x/y  , de modo que ∇f(2, 1) =~  3 · ln 1 3 · 2/1  =  0 6  .

(12)

Leitura Complementar 2.11.2 - M´

etodo de busca por

gradiente

Veremos agora um m´etodo bastante eficiente para encontrar m´aximos e m´ınimos de fun¸c˜oes envolvendo mais de uma vari´avel real. Esse m´etodo ´e baseado no fato do gradiente sempre apontar a dire¸c˜ao e o sentido de maior crescimento de uma fun¸c˜ao a cada ponto do dom´ınio desta. Faremos esse estudo por meio de alguns exemplos. A teoria ser´a exposta conforme a necessidade de cada exemplo.

Problema 1: M´ınimo de uma parabol´oide

Comecemos com um problema bem simples, que ´e determinar o ponto m´ınimo do parabol´oide dado pela fun¸c˜ao f (x, y) = x2+ y2 partindo do ponto (1, 1).

O m´etodo de busca por gradiente segue o seguinte algoritmo: • Calcula-se o gradiente ~∇f(x, y).

• Escolhe-se um ponto inicial ~x0 pertencente ao dom´ınio da fun¸c˜ao.

• A partir desse ponto, calculamos o pr´oximo ponto ~x1, dado por

~x1= ~x0+ λ~∇f(~x0) ,

onde o vetor gradiente d´a a dire¸c˜ao de maior varia¸c˜ao da fun¸c˜ao e λ ´e um parˆametro que indica o sentido a ser seguido e o m´odulo da varia¸c˜ao a ser feita.

• Determina-se o valor de λ que maximiza ou minimiza a fun¸c˜ao objetivo, dependendo do problema ser um de maximiza¸c˜ao ou de minimiza¸c˜ao.

• Calcula-se ~x1 usando o valor de λ determinado anteriormente. Se |~x1− ~x0| < ǫ, onde ǫ ´e um parˆametro dado

pelo problema que indica qual o grau de precis˜ao desejado, ent˜ao o problema termina por a´ı. Sen˜ao, repete-se todo o processo.

Apliquemos esse procedimento ao problema em quest˜ao. Primeiro, calculamos o gradiente da fun¸c˜ao f (x, y):

~ ∇f(x, y) =    ∂f ∂x ∂f ∂y   =  2x 2y  .

O ponto inicial j´a foi escolhido pelo problema: ~x0=

 1 1



. Calculando o gradiente, temos

~ ∇f(~x0) =  2 · 1 2 · 1  =  2 2  . Determinamos ent˜ao um novo ponto ~x1:

~x1= ~x0+ λ~∇f(~x0) =  1 1  + λ  2 2  =  1 + 2λ 1 + 2λ  . Substituindo esse ponto na fun¸c˜ao objetivo, temos

f (~x1) = (1 + 2λ)2+ (1 + 2λ)2 = 1 + 4λ + λ2+ 1 + 4λ + λ2 = 2 + 8λ + 8λ2 .

Note que a fun¸c˜ao s´o depende agora do parˆametro λ, de modo que podemos escrevˆe-la como f (λ) = 2 + 8λ + 8λ2 .

(13)

Essa fun¸c˜ao tem um ponto cr´ıtico quando

f′(λ) = 0 ⇔ 8 + 16λ = 0 ⇔ 16λ = −8 ⇔ λ = −1

2 .

Para determinamos se esse ponto cr´ıtico ´e um m´ınimo da fun¸c˜ao, calculamos a segunda derivada desta: f′′(x) = 16 .

Como esse valor ´e positivo, a concavidade da fun¸c˜ao ´e sempre para cima e λ = −12 ´e um ponto de m´ınimo. Substituindo o valor de λ encontrado, temos

~x1 =   1 + 2 · −12  1 + 2 · −12   =  0 0  .

O gradiente de ~x1 fica, ent˜ao,

~ ∇f(~x1) =  2 · 0 2 · 0  =  0 0  .

O fato do vetor gradiente ser nulo indica que atingimos a solu¸c˜ao ´otima. Se quis´essemos calcular um novo ponto ~x2, ter´ıamos ~x1= ~x1+ λ~∇f(~x1) =  0 0  + λ  0 0  =  0 0  = ~x1 .

Portanto, n˜ao h´a mais como melhorar a solu¸c˜ao e o ponto que minimiza a fun¸c˜ao ´e ~x1 =

 0 0

 .

Problema 2: Fun¸c˜ao exponencial

Vamos usar o m´etodo de busca por gradiente para maximizar a fun¸c˜ao f (x, y) = 12e−(x+4)2−y2. Come¸camos

calculando o gradiente da fun¸c˜ao f (x, y):

~ ∇f(x, y) =    ∂f ∂x ∂f ∂y   . As derivadas parciais s˜ao dadas por

∂f

∂x = 12 e

−(x+4)2−y2 · [−2(x + 4)] = −24(x + 4) e−(x+4)2−y2 ,

∂f

∂y = 12 e

−(x+4)2−y2 · (−2y) = −24y e−(x+4)2−y2 ,

de modo que o gradiente fica ~ ∇f(x, y) =   −24(x + 4) e−(x+4)2−y2 −24y e−(x+4)2−y2  .

Escolhamos o ponto inicial como sendo: ~x0 =

 0 0



. Calculando o gradiente, temos

~ ∇f(~x0) =   −24(0 + 4) e−(0+4)2−02 −24 · 0 · e−(0+4)2−02  =  −96 e−16 0  .

Determinamos ent˜ao um novo ponto ~x1:

~x1 = ~x0+ λ~∇f(~x0) =  0 0  + λ  −96 e−16 0  =  −96 e−16λ 0  .

(14)

Substituindo esse ponto na fun¸c˜ao objetivo, temos f (~x1) = 12 e−(−96 e

−16λ+4)2−02

= 12 e−(−96 e−16λ+4)2

. A fun¸c˜ao agora s´o dependedo parˆametro λ, de modo que podemos escrevˆe-la como

f (λ) = 12 e−(−96 e−16λ+4)2

. Derivando a fun¸c˜ao com rela¸c˜ao a λ, temos

f′(λ) = 12 e−(−96 e−16λ+4)2

·−2(−96 e−16λ + 4)(−96 e−16 = 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2

. Essa fun¸c˜ao tem um ponto cr´ıtico quando

f′(λ) = 0 ⇔ 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2

= 0 ⇔ −96 e−16λ + 4 = 0 ⇔ 96 e−16λ = 4 ⇔

⇔ λ = 241 e16 .

Para determinamos se esse ponto cr´ıtico ´e um m´ınimo da fun¸c˜ao, calculamos a segunda derivada desta: f′′(x) = 2304 e−16(−96 e−16) e−(−96 e−16λ+4)2 + 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 · ·−2(−96 e−16λ + 4)(−96 e−16 = = −221184 e−32e−(−96 e−16λ+4)2 + 442368 e−32(−96 e−16λ + 4)2e−(−96 e−16λ+4)2 . Substituindo o valor de λ encontrado, temos

f′′ e 16 24  = −221184 e−32e−  −96 e−16 e 16 24 +4 2 + 442368 e−32  −96 e−16e 16 24 + 4 2 e−  −96 e−16 e 16 24 +4 2 = = −221184 e−32e−(−4+4)2 + 442368 e−32(−4 + 4)2e−(−4+4)2 = = −221184 e−32e0+ 442368 e−32· 0 · e0 = −221184 e−32 .

Como esse valor ´e negativo, a concavidade da fun¸c˜ao nesse ponto ´e para baixo e λ = e416 ´e um ponto de m´aximo. Substituindo o valor de λ encontrado, temos

~x1=  −96 e−16 e16 24 0  =  −4 0  . Calculando o gradiente para esse ponto, temos

~ ∇f(~x1) =   −24(−4 + 4) e−(−4+4)2−02 −24 · 0 · e−(−4+4)2−02  =  0 0  .

Como o gradiente ´e nulo, ~x1 corresponde ao m´aximo da fun¸c˜ao f (x, y).

Problema 4: Localiza¸c˜ao de um armaz´em

Vamos, agora, resolver um problema mais pr´atico envolvendo a minimiza¸c˜ao de uma fun¸c˜ao. Um novo armaz´em de uma ind´ustria de pesticidas deve ser instalado na regi˜ao que compreende as cidades de Besourinhos, Formigas e Cupinzal. A cidade de Besourinhos tem 400.000 habitantes; a cidade de Formigas, localizada 20 km a leste de Besourinhos, tem uma popula¸c˜ao de 250.000; a cidade de Cupinzal tem 140.000 habitantes e fica a 10 km a leste de Besourinhos e a 100 km ao norte dessa cidade.

a) Formule um problema de pesquisa operacional que minimize as distˆancias do novo armaz´em `as trˆes cidades que ser˜ao servidas por ele.

b) Resolva esse problema usando busca por gradiente.

(15)

d) Resolva o problema modificado usando busca por gradiente. Solu¸c˜ao:

a) O problema consiste em determinar onde deve ser constru´ıdo um armaz´em que sirva `as trˆes cidades indicadas de modo a minimizar a distˆancia deste `as cidades. Podemos localizar as cidades em um eixo cartesiano de coordenadas estabelecendo Besourinhos na origem (0, 0), a cidade formigas no ponto (20, 0) e a cidade de Cupinzal em (10, 10). No gr´afico indicamos coordenadas arbitr´arias para a localiza¸c˜ao do armaz´em que dever˜ao ser determinadas pelo problema.

x y 0 10 20 10 b b b B F C b (x, y)

As vari´aveis de decis˜ao do problema s˜ao (x, y) =coordenadas do armaz´em. A fun¸c˜ao-objetivo ´e minimizar a soma das distˆancias do armaz´em aos trˆes centros urbanos. As distˆancias do armaz´em at´e Besourinhos, Formigas e Cupinzal s˜ao dadas, respectivamente, por

dB =p(x − 0)2+ (y − 0)2 =

p

x2+ y2 ,

dF =p(x − 20)2+ (y − 0)2 =p(x − 20)2+ y2 ,

dC =p(x − 10)2+ (y − 10)2 .

Portanto, o problema fica

min d(x, y) =px2+ y2+p(x − 20)2+ y2+p(x − 10)2+ (y − 10)2 .

O problema n˜ao tem restri¸c˜oes, pois as vari´aveis x e y podem assumir quaisquer valores reais.

b) Para resolver o problema por meio de busca por gradiente, precisamos calcular as derivadas parciais dx e dy

da fun¸c˜ao-objetivo: dx = ∂d ∂x = 1 2(x 2+ y2)−1/2· 2x +1 2(x − 20) 2+ y2−1/2 · 2(x − 20) + +1 2(x − 10) 2 + (y − 10)2−1/2 · 2(x − 10) = = x(x2+ y2)−1/2+ (x − 20)(x − 20)2+ y2−1/2 + (x − 10)(x − 10)2+ (y − 10)2−1/2 , dy = ∂d ∂y = 1 2(x 2+ y2)−1/2· 2y + 1 2(x − 20) 2+ y2−1/2 · 2y +12(x − 10)2 + (y − 10)2−1/2 · 2(y − 10) = = y(x2+ y2)−1/2+ y(x − 20)2+ y2−1/2 + (y − 10)(x − 10)2 + (y − 10)2−1/2 . O gradiente fica ~ ∇d(x, y) =  dx dy  , onde dx e dy s˜ao dados pelas equa¸c˜oes anteriores.

Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Quanto mais pr´oximo do ponto ´otimo estiver esse ponto inicial, melhores ser˜ao as chances da busca terminar logo. Observando o gr´afico que mostra as posi¸c˜oes das cidades, vemos que elas s˜ao sim´etricas com rela¸c˜ao a x = 10. Portanto, podemos partir, por exemplo, do ponto ~x0 =

 10

0 

. Calculando o gradiente, temos ~ ∇d(~x0) =  0 −1  .

(16)

Determinamos ent˜ao um novo ponto ~x1: ~x1= ~x0+ λ~∇d(~x0) =  10 0  + λ  0 −1  =  10 −λ  . Substituindo esse ponto na fun¸c˜ao objetivo, temos

d(~x1) = p102+ (−λ)2+p(10 − 20)2+ (−λ)2+p(10 − 10)2+ (−λ − 10)2 =

= p100 + λ2+p100 + λ2+p(λ + 10)2= 2p100 + λ2+ |λ + 10| = d(λ) .

A presen¸ca do m´odulo mostra que, `a direita ou `a esquerda do ponto λ + 10 = 0 ⇔ λ = −10, podemos escrever essa fun¸c˜ao como

d(λ) = 2 √

100 + λ2− λ − 10 , λ < −10 ;

2√100 + λ2+ λ + 10 , λ ≥ −10 .

Para λ < −10 a derivada dessa fun¸c˜ao fica d′(λ) = 2 · 1 2(100 + λ 2)−1/2· 2λ − 1 = 2λ(100 + λ2)−1/2− 1 . Para λ > −10, temos d′(λ) = 2 · 1 2(100 + λ 2)−1/2· 2λ + 1 = 2λ(100 + λ2)−1/2+ 1 .

Note que a derivada n˜ao ´e definida em λ = −10.

Essa fun¸c˜ao tem pontos cr´ıticos quando d′(λ) = 0 ou quando d(λ) n˜ao existe. Portanto, ela tem um ponto

cr´ıtico em λ = −10, que ´e onde ela n˜ao ´e definida. Para λ < −10, temos

d′(λ) = 0 ⇔ 2λ(100 + λ2)−1/2− 1 = 0 ⇔ 2λ(100 + λ2)−1/2 = 1 ⇔ 2λ = (100 + λ2)1/2 ⇔ 4λ2 = 100 + λ2 ⇔ 4λ2 = 100 + λ2 ⇔ 3λ2 = 100 ⇔ λ2 = 100 3 ⇔ λ = ± 10 √ 3 . S´o que tanto λ = −√10 3 quanto λ = 10 √

3 s˜ao maiores que −10, o que indica que para λ < −10 n˜ao h´a pontos

cr´ıticos. Para λ > −10, d′(λ) = 0 ⇔ 2λ(100 + λ2)−1/2+ 1 = 0 ⇔ 2λ(100 + λ2)−1/2= −1 ⇔ 2λ = −(100 + λ2)1/2 ⇔ 4λ2 = 100 + λ2 ⇔ 4λ2 = 100 + λ2 ⇔ 3λ2= 100 ⇔ λ2 = 100 3 ⇔ λ = ± 10 √ 3 . No entanto, d′  −√10 3  = 0 , d′ 10 3  = 2 , o que mostra que λ = √10

3 n˜ao ´e um ponto cr´ıtico. Portanto, os pontos cr´ıticos da fun¸c˜ao d(x, y) s˜ao dados por

λ = −10 e λ = −√10 3 .

Para determinamos se algum desses pontos cr´ıticos s˜ao um m´ınimo da fun¸c˜ao, calculamos a segunda derivada desta. Para λ > −10, que ´e o ´unico caso (fora λ = −10) onde ocorrem pontos cr´ıticos, temos

d′′(λ) = 2(100 + λ2)−1/2+ 2  −12  (100 + λ2)−3/2· 2λ = 2(100 + λ2)−1/2− 2λ(100 + λ2)−3/2 . Substituindo λ = −√10 3, temos d′′  −√10 3  ≈ 0, 104 . Portanto, λ = −√10

3 ´e um ponto de m´ınimo.

Resta ainda analisar o ponto λ = −10, que n˜ao pode ser analisado usando derivadas. Tomando valores pr´oximos a ele, vemos que d(−10, 1) ≈ 28, 526 e d(−9, 9) ≈ 28, 243. J´a que d(−10) = 28, 284, este n˜ao ´e um

(17)

ponto de m´ınimo nem de m´aximo da fun¸c˜ao, mas apenas uma c´uspide. Conclu´ımos, ent˜ao, que λ = −√10 3 ´e o

´

unico ponto de m´ınimo da fun¸c˜ao d(λ). Para que visualizemos melhor a situa¸c˜ao, segue um gr´afico da fun¸c˜ao d(λ). λ d(λ) −15 −10 −5 5 0 5 10 15 20 25 30 35 40 45

Substituindo o valor de λ encontrado, temos ~x1 = 10 10 √ 3 ! . O gradiente de ~x1 fica, ent˜ao,

~ ∇d(~x0) =  0 0  =  0 0  .

O fato do vetor gradiente ser nulo indica que atingimos a solu¸c˜ao ´otima. Portanto, n˜ao h´a mais como melhorar a solu¸c˜ao e o ponto que minimiza a fun¸c˜ao ´e

~x1= 0 10 √ 3 ! ≈  0 5, 774  .

O valor m´ınimo da fun¸c˜ao-objetivo ´e d ≈ 27, 320. A seguir, fazemos uma descri¸c˜ao gr´afica dos passos feitos pelo problema: x y 0 10 20 10 b b b B F C b b

c) O problema agora consiste em determinar onde deve ser constru´ıdo um armaz´em que sirva `as trˆes cidades indicadas de forma proporcional `as suas popula¸c˜oes. Podemos fazer isto dando um peso a cada distˆancia

(18)

da fun¸c˜ao-objetivo que seja proprocional `a popula¸c˜ao de cada cidade. Usando como vari´aveis de decis˜ao do problema (x, y) =coordenadas do armaz´em, temos, ent˜ao,

min d(x, y) = 400px2+ y2+ 250p(x − 20)2+ y2+ 140p(x − 10)2+ (y − 10)2 .

d) O gradiente ´e dado por

~ ∇d(x, y) =  dx dy  , onde dx = ∂d ∂x = 400 · 1 2(x 2+ y2)−1/2· 2x + 250 · 1 2(x − 20) 2+ y2−1/2 · 2(x − 20) + +140 · 1 2(x − 10) 2+ (y − 10)2−1/2 · 2(x − 10) = = 400x(x2+ y2)−1/2+ 250(x − 20)(x − 20)2+ y2−1/2 + 140(x − 10)(x − 10)2+ (y − 10)2−1/2 , dy = ∂d ∂y = 400 · 1 2(x 2+ y2)−1/2· 2y + 250 · 1 2(x − 20) 2+ y2−1/2 · 2y + +140 · 1 2(x − 10) 2+ (y − 10)2−1/2 · 2(y − 10) = = 400y(x2+ y2)−1/2+ 250y(x − 20)2+ y2−1/2 + 140(y − 10)(x − 10)2+ (y − 10)2−1/2 .

Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Partiremos novamente do ponto inicial ~x0=

 10

0 

. Calculando o gradiente, temos

~ ∇d(~x0) =  150 −140  . Determinamos ent˜ao um novo ponto ~x1:

~x1 = ~x0+ λ~∇d(~x0) =  10 0  + λ  150 −140  =  10 + 150λ −140λ  . Substituindo esse ponto na fun¸c˜ao objetivo, temos

d(~x1) = 400p(10 + 150λ)2+ (−140λ)2 + 250p(−10 + 150λ)2 + (−140λ)2+ +140p(150λ)2+ (−140λ − 10)2 = = 400p100 + 3000λ + 22500λ2+ 19600λ2 + 250p100 − 3000λ + 22500λ2+ 19600λ2+ +140p22500λ2+ 100 + 2800λ + 19600λ2 = d(λ) = = 400p100 + 3000λ + 42100λ2+ 250p100 − 3000λ + 42100λ2+ +140p100 + 2800λ + 42100λ2 = d(λ) .

Calculando a derivada da fun¸c˜ao, ficamos com

d′(λ) = 200(3000 + 84200λ)(100 + 3000λ + 42100λ2)−1/2+

+125(−3000 + 84200λ)(100 − 3000λ + 42100λ2)−1/2+

+70(2800 + 84200λ)(100 + 2800λ + 42100λ2)−1/2

Teremos que usar um m´etodo num´erico (m´etodo de Newton) para encontrar as ra´ızes dessa derivada. Para isso, precisamos calcular sua derivada segunda:

d′′(λ) = 16840000(100 + 3000λ + 42100λ2)−1/2− 62, 5(−3000 + 84200λ)2(100 − 3000λ + 42100λ2)−3/2+

+10525000(100 − 3000λ + 42100λ2)−1/2− 62, 5(−3000 + 84200λ)2(100 − 3000λ + 42100λ2)−3/2+

(19)

Usando o algoritmo de Newton, temos, ent˜ao, partindo de λ0 = 0, λ1 = λ0− d′ 0) d′′0) = 0 − d′(0) d′′(0) ≈ 0 − 42100 1926500 ≈ −0, 022 , λ2 = −0, 022 − d′(−0, 022) d′′(−0, 022) ≈ −0, 022 − −4651, 944 2596943 ≈ −0, 020 , λ3 = −0, 020 − d′(−0, 020) d′′(−0, 020) ≈ −0, 020 − 897, 329 2522698, 865 ≈ −0, 020 .

Como d′′(−0, 020) = 2522698, 865, que ´e positivo, este ´e um m´ınimo da fun¸c˜ao. Para visualizarmos melhor essa

fun¸c˜ao, ela est´a representada no gr´afico a seguir.

λ d(λ) −0, 03 −0, 02 −0, 01 0, 01 0 7000 7500 8000

Substituindo o valor de λ encontrado, temos ~x1 =  7 2, 8  . O gradiente de ~x1 fica, ent˜ao,

~ ∇d(~x0) =  73, 149 71, 964  . Precisamos fazer uma nova itera¸c˜ao para encontrar um resultado melhor.

Determinamos ent˜ao um novo ponto ~x2:

~x2= ~x1+ λ~∇d(~x1) =  7 2, 8  + λ  73, 149 71, 964  =  7 + 73, 149λ 2, 8 + 71, 964λ  . Substituindo esse ponto na fun¸c˜ao objetivo, temos

d(~x2) = 400p(7 + 73, 149λ)2+ (2, 8 + 71, 964λ)2+ 250p(−13 + 73, 149λ)2 + (2, 8 + 71, 964λ)2+

+140p(−3 + 73, 149λ)2+ (−7, 2 + 71, 964λ)2 .

Usando novamente um m´etodo num´erico, descobrimos que esta fun¸c˜ao tem um m´ınimo em λ = −0, 033. Substituindo novamente na express˜ao para ~x2, temos

~x2 =  4, 586 0, 425  . O gradiente fica ~ ∇d(~x0) =  79, 480 −78, 066  . Constru´ımos, ent˜ao, o ponto ~x3:

~x3 =  4, 586 + 79, 480λ 0, 425 − 78, 066λ  . A fun¸c˜ao-objetivo fica

d(~x2) = 400p(4, 586 + 79, 480λ)2+ (0, 425 − 78, 066λ)2+

+250p(−15, 414 + 79, 480λ)2 + (0, 425 − 78, 066λ)2+

(20)

Usando um m´etodo num´erico, descobrimos que esta fun¸c˜ao tem um m´ınimo em λ = −0, 012. Portanto, ~x3 =  3, 632 1, 362  . Repetindo o mesmo processo, chegamos ao ponto

~x4 =  2, 760 0, 362  .

A tabela a seguir mostra todos passos do m´etodo, que v˜ao at´e que a precis˜ao de trˆes casas decimais seja alcan¸cada. i xi yi 0 10 0 1 7 2, 8 2 4, 586 0, 425 3 3, 632 1, 362 4 2, 760 0, 362 5 2, 242 0, 814 6 1, 739 0, 234 7 1, 432 0, 509 8 1, 112 0, 154 9 0, 922 0, 325 10 0, 722 0, 101 11 0, 601 0, 210 12 0, 469 0, 066 13 0, 391 0, 136 14 0, 305 0, 043 15 0, 255 0, 088 i xi yi 16 0, 197 0, 027 17 0, 165 0, 057 18 0, 128 0, 018 19 0, 107 0, 037 20 0, 084 0, 012 21 0, 070 0, 024 22 0, 054 0, 007 23 0, 045 0, 015 24 0, 032 0, 004 25 0, 027 0, 009 26 0, 019 0, 002 27 0, 016 0, 005 28 0, 008 0, 000 29 0, 007 0, 002 30 0, 000314 −0, 000044 31 0, 000301 0, 0000861

Nas ´ultimas duas linhas foram usadas mais casas decimais para evitar singularidades nas derivadas primeira e segunda da fun¸c˜ao d(x, y). Pode-se ver que a solu¸c˜ao ´otima, com precis˜ao de duas casas decimais, ´e

~x =  0 0  , isto ´e, o armaz´em deve ser constru´ıdo na cidade de Besourinhos.

Uma descri¸c˜ao gr´afica dos passos feitos pelo problema ´e feita a seguir:

x y 0 10 20 10 b b b B F C

Note o comportamento em zigue-zague da busca, t´ıpica do m´etodo de busca por gradiente, que torna a busca dif´ıcil e lenta quando nos aproximamos da solu¸c˜ao do problema.

(21)

Exerc´ıcios - Cap´ıtulo 2.11

N´ıvel 1

Gradiente

Exemplo 1: calcule o gradiente da fun¸c˜ao f (x, y, z) = x cos(yz). Solu¸c˜ao: temos

fx=

∂f

∂x = cos(yz) , fy= ∂f

∂y = −xz sen (yz) , fz= ∂f

∂z = −xy sen (yz) . Portanto, ~ ∇f =   fx fy fz  =   cos(yz) −xz sen (yz) −xy sen (yz)

  .

E1) Calcule os gradientes das seguintes fun¸c˜oes:

a) f (x, y) = xy3, b) f (x, y) = 2x + cos y, c) f (x, y, z) = 4xz − 8y2, d) f (x, y, z) = 8x√y− 2 ez.

Exemplo 2: calcule o vetor que d´a a dire¸c˜ao e sentido de maior crescimento da fun¸c˜ao f (x, y, z) = x cos(yz) no ponto (1, 0, 2).

Solu¸c˜ao: o gradiente da fun¸c˜ao, calculado no exemplo 3, ´e dado por

~ ∇f =   cos(yz) −xz sen (yz) −xy sen (yz)

  .

O vetor gradiente calculado no ponto desejado d´a a dire¸c˜ao e o sentido de maior varia¸c˜ao da fun¸c˜ao. Portanto, em (1, 0, 2), temos ~ ∇f(1, 0, 2) =   cos(0 · 2) −1 · 2 sen (0 · 2) −1 · 0 sen (0 · 2)  =   cos 0 −2 sen 0 −0  =   1 0 0   .

E2) Calcule os vetores que d˜ao as dire¸c˜oes e sentidos de maior crescimento das fun¸c˜oes abaixo nos pontos indicados:

a) f (x, y) = xy3 , (1, 1); b) f (x, y) = 2x + cos y , (0, π); c) f (x, y, z) = 4xz − 8y2 , (1, 4, 2);

d) f (x, y, z) = 8x√y− 2 ez , (2, 1, 0).

Hessiana

Exemplo 3: calcule a hessiana da fun¸c˜ao f (x, y, z) = x cos(yz).

Solu¸c˜ao: as derivadas parciais de segunda ordem j´a foram calculadas no exemplo 3. A partir delas, temos

H(f ) =   fxx fxy fyz fyx fyy fyz fzx fzy fzz  =  

0 −z sen (yz) −y sen (yz) −z sen (yz) −xz2

cos(yz) −x sen (yz) − xyz cos(yz) −y sen (yz) −x sen (yz) − xyz cos(yz) −xy2

cos(yz)

 

(22)

a) f (x, y) = xy3, b) f (x, y) = 2x + cos y, c) f (x, y, z) = 4xz − 8y2, d) f (x, y, z) = 8x√y − 2 ez.

N´ıvel 2

E1) As figuras a seguir ilustram algumas curvas de n´ıvel das fun¸c˜oes f (x, y) = 2x2+ 3y2, g(x) = 3x2− 2y2 e

h(x, y) = 3x − x3− 3xy2. Desenhe sobre essas curvas de n´ıvel os vetores gradiente normalizados dessas fun¸c˜oes

nos pontos (0, 0), (1, 0), (0, 1) e (1, 1) com origem nos pontos dados.

x y −1 0 1 −1 1 b f (x, y) = 2x2+ 3y2 x y −3 −2 −1 0 1 2 3 −4 −3 −2 −1 1 2 3 4 g(x, y) = 3x2− 2y2 x y −2 −1 0 1 2 −2 −1 1 2 b b h(x, y) = 3x − x3− 3xy2

E2) Considerando os dados a seguir, calcule, aproximadamente, um vetor que dˆe a dire¸c˜ao e o sentido do gradiente no ponto (0, 0). x/y −2 −1 0 1 2 −2 −3, 2 −3, 1 −2, 9 −2, 8 −3, 0 −1 −2, 9 −2, 7 −2, 7 −2, 6 −2, 8 0 −1, 6 −1, 4 −1, 2 −1, 4 −1, 6 1 −0, 4 −0, 6 −0, 4 −0, 7 −0, 6 2 0, 6 0, 8 0, 7 0, 8 0, 3 E3) O laplaciano de uma fun¸c˜ao f (x, y) ´e definido como ∇2f = f

xx+ fyy. Dada f (x, y) = px2+ y2, prove

que ∇2f = 1f.

E4) Determine em qual dire¸c˜ao e sentido uma fun¸c˜ao f decresce mais rapidamente.

E5) Determine todos os pontos para os quais a dire¸c˜ao de maior mudan¸ca da fun¸c˜ao f (x, y) = x2+ y2− x − 3y

´e dada por 

1 1

 .

E6) Um industrial tem que decidir onde investir R$ 50.000 e estima que a produ¸c˜ao de sua empresa possa ser modelada pela fun¸c˜ao P (K, L) = 1, 3K0,45L0,55, onde o capital investido K e o trabalho L s˜ao medidos em

milh˜oes de reais. No momento, o capital investido ´e de 5 milh˜oes de reais e o gasto em trabalho ´e de 4 milh˜oes de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas ´areas de modo a maximizar a produ¸c˜ao da empresa (use uma precis˜ao de um milhar de reais na resposta).

N´ıvel 3

E1) Calcule a reta normal e a reta tangente `a elipse x

2

4 + y

2

= 2 no ponto (−2, 1) seguindo as seguintes instru¸c˜oes:

(23)

a) Considere que a elipse ´e uma curva de n´ıvel da fun¸c˜ao f (x, y) = x

2

4 + y

2 e calcule o gradiente dessa fun¸c˜ao

no ponto (−2, 1).

b) Usando o fato do gradiente ser perpendicular `a curva de n´ıvel para calcular um ponto da reta normal `a elipse no ponto dado.

c) Utilize o ponto (−2, 1) e o novo ponto dado para calcular a equa¸c˜ao da reta normal `a elipse naquele ponto. d) Use o fato da reta tangente ser perpendicular `a reta normal calculada para repetir o processo (considerando agora a reta normal como uma isoquanta de uma fun¸c˜ao adequada) e calcular a equa¸c˜ao da reta tangente. e) Desenhe em um mesmo gr´afico a elipse dada, o ponto (−2, 1) e as retas normal e tangente a essa curva nesse ponto.

E2) Calcule a reta normal e a reta tangente `a curva x3− 3y = 5 no ponto (2, 1).

E3) Um industrial estima que a produ¸c˜ao de sua empresa possa ser modelada pela fun¸c˜ao de produ¸c˜ao de Cobb-Douglas P (K, L) = 1, 2K0,6L0,4, onde o capital investido K e o trabalho L s˜ao medidos em milh˜oes de

reais. No momento, o capital investido ´e de 5 milh˜oes de reais e o gasto em trabalho ´e de 4 milh˜oes de reais. Ele pretende, nos pr´oximos 6 meses, investir R$ 1.000.000 todo mˆes. Determine uma estrat´egia de investimentos para o industrial para os pr´oximos 6 meses de modo a maximizar a sua produ¸c˜ao. Assuma nos seus c´alculos que ele sempre invista em unidades de milhares de reais.

E4) Use busca por gradiente com precis˜ao de duas casas decimais para maximizar a fun¸c˜ao f (x, y) = 4 − x2− y2+ 2x − 3y partindo do ponto x0= (0, 0).

E5) Use busca por gradiente com precis˜ao de duas casas decimais para maximizar a fun¸c˜ao f (x, y) = 4 − x2− y2+ 2x − xy partindo do ponto x0 = (0, 0).

Respostas

N´ıvel 1 E1) a) ~∇f =  y3 3xy2  , b) ~∇f =  y2 − sen y  , c) ~∇f =   4z −16y 4x  , d) ~∇f =   8√y 4x/√y −2 ez  . E2) a) ~∇f(1, 1) =  1 3  , b) ~∇f(0, π) =  2 0  , c) ~∇f(1, 4, 2) =   8 −64 4  , d) ~∇f(2, 1, 0) =   8 8 −2  . E3) a) H(f ) =  0 3y2 3y2 6xy  , b) H(f ) =  0 0 0 − cos y  , c) H(f ) =   0 0 4 0 −16 0 4 0 0  , d) H(f ) =   0 4 √x 0 4 √ x − 2x y3/2 0 0 0 −2 ez  . N´ıvel 2 E1) x y −1 0 1 −1 1 b f (x, y) = 2x2+ 3y2 b x y −3 −2 −1 0 1 2 3 −4 −3 −2 −1 1 2 3 4 g(x, y) = 3x2− 2y2 b x y −2 −1 0 1 2 −2 −1 1 2 b b h(x, y) = 3x − x3− 3xy2 b b

(24)

E2)  0 −1  . E3) ∇2 f = fxx+ fyy= y 2 (x2+ y2)3/2 + x2 (x2+ y2)3/2 = x2 + y2 (x2+ y2)3/2 = 1 (x2+ y2)1/2 = 1 f . E4) Na dire¸c˜ao dada por −~∇f.

E5) Para os pontos (1, 2) e (0, 1).

E6) Ele deve investir R$ 19.780 em captial e usar R$ 30.220 em trabalho.

N´ıvel 3 E1) a) ~∇f(−2, 1) =  −1 2  . b) (−3, 3). c) y = −2x − 3. d) y =1 2x + 2. e) x y −3 −2 −1 0 1 2 3 −3 −2 −1 1 2 3 b

E2) A reta normal ´e dada por y = −0, 3x + 1, 6. A reta tangente ´e dada por y =1

3(x + 1).

E3) A estrat´egia de investimentos ´e dada pela tabela a seguir. Os investimentos s˜ao dados em milhares de reais. Mˆes K L 1 623 377 2 623 377 3 622 378 4 622 378 5 623 377 6 623 377 E4) a) x = 1 e y = −1, 5, f = 7, 25 (uma itera¸c˜ao).

Referências

Documentos relacionados

Assim sendo, o presente estudo visa tratar do uso virtual da linguagem com base na rede social Facebook e no gênero digital comentário, os quais se caracterizam como

a) Falta aos entrevistados embasamento teórico sobre o conceito global de direitos humanos que lhes permitam organizar seus pensamentos, refletindo sobre as ideias, para criar

Dos 10 isolados confirmados para Salmonella spp, todos foram identificados como sendo pertencentes ao sorovar Newport, 30% foram positivos para o gene invA e todos foram

Estima-se que, dentre os processos de separação por membranas, as membranas de cerâmica têm crescido cerca de 15% ao ano, apesar dos conhecimentos detalhados sobre

No que concerne à presença das emoções como tristeza, raiva, medo e alegria, investigada na questão “Você costuma se sentir triste, com raiva, medo ou

• Trio: Através das informações genéticas dos progenitores, são selecionadas as variantes responsáveis pelo fenótipo do paciente, contemplando tanto a apresentação clínica

Silma do Carmo Nunes A reformulação do projeto pedagógico do curso técnico em agropecuária do Instituto Federal do Triângulo Mineiro – Campus Uberlândia:. possibilidades e

Para a perfeita conservação de suas características alguns cuidados deverão ser seguidos, para tal, a Polipiso do Brasil desenvolveu este Manual de Manutenção,