• Nenhum resultado encontrado

2 CONCEITOS FUNDAMENTAIS

2.2 CONCEITOS ESTATÍSTICOS

2.2.11 Testes Estatísticos Usados Neste Trabalho

2.2.11.3 Teste estatístico da Análise de Variância (ANOVA)

Figura 17 - Critério de rejeição de H0 para a aplicação do teste estatístico de comparação entre duas variâncias

Fonte: Autor.

Na Figura 17, verifica-se que 𝑠𝐶𝑛𝑀2 , 𝑠𝐷𝑛𝑀2 e 𝑠𝑂𝑛𝑀2 representam as variâncias calculadas das amostras de parâmetros elétricos extraídos experimentalmente dos CnM, DnM e OnM, respectivamente. Ressalta-se que este teste estatístico foi aplicado nesta tese de doutorado utilizando o software estatístico MINITAB 2020 [64].

Tabela 1 – Exemplo de uma tabela que descreve o procedimento utilizado para o cálculo das médias de “k” amostras

Amostra 1 Amostra 2 Amostra k

𝒙𝟏𝟏 𝒙𝟐𝟏 ⋯ 𝒙𝒌𝟏

𝒙𝟏𝟐 𝒙𝟐𝟐 ⋯ 𝒙𝒌𝟐

𝒙𝟏𝟑 𝒙𝟐𝟑 ⋯ 𝒙𝒌𝟑

⋮ ⋮ ⋯ ⋮

𝒙𝟏𝒏𝟏 𝒙𝟐𝒏𝟐 ⋯ 𝒙𝒌𝒏𝒌

𝝁

̅𝟏 𝝁̅𝟐 ⋯ 𝝁̅𝒌

Fonte: Autor “adaptado de” [65], p. 92.

Na Tabela 1, 𝜇̅1 é a média da Amostra 1, 𝜇̅2 é a média da Amostra 2, 𝜇̅𝑘 é a média da Amostra k, sendo que os parâmetros 𝑥1𝑛1 são os parâmetros representativos da Amostra 1, os parâmetros 𝑥2𝑛2 são os parâmetros representativos da Amostra 2 e os parâmetros 𝑥𝑘𝑛𝑘 são os parâmetros representativos da Amostra k. Assim, pode-se afirmar que o objetivo do teste ANOVA é verificar quão grande é a variabilidade entre as médias das amostras em relação à variabilidade que se observa dentro de cada amostra [53], [65], [67]. Dessa maneira, o teste de igualdade de várias médias compara a dispersão (variância) entre as médias das amostras e a dispersão (variância) que existe dentro de cada amostra [53], [65], [67].

Os dados das amostras que são utilizados para a aplicação deste teste estatístico são separados em grupos segundo uma característica (fator). Ressalta-se que fator (ou tratamento) é uma característica que permite distinguir diferentes populações umas das outras [53], [67].

Para ilustrar um exemplo, pode-se analisar as amostras das VTHs extraídas de 3 tipos diferentes de nMOSFETs (DnM, OnM e CnM) quando irradiados com doses diferentes de radiações ionizantes de raios-X (como dose ionizante total, Total Ionizing Dose, TID). Assim, temos um único fator (única variável), que é a geometria de porta e 3 populações das VTHs diferentes de nMOSFETs [53], [67]. A Figura 18 ilustra, a título de exemplo, a ideia básica para aplicação do teste ANOVA para este exemplo citado.

Figura 18 - Ideia básica para aplicação do teste ANOVA nas VTHs extraídas de 3 tipos diferentes de nMOSFETs (DnM, OnM e CnM) quando irradiados com doses diferentes de radiações ionizantes de raios-X

Fonte: Autor.

Na Figura 18, pode-se observar que TID 1, TID 2, TID 3 e TID 4 são as doses de radiações ionizantes do tipo raios-X diferentes aplicadas nos 3 tipos diferentes de nMOSFETs (DnM, OnM e CnM) para a obtenção das VTHs destes dispositivos. Além disso, ao analisar a Figura 18, verifica-se que o objetivo da aplicação do teste ANOVA, neste exemplo, é o de verificar se a geometria de porta dos nMOSFETs contribui ou não para uma maior robustez dos transistores em um ambiente de radiação ionizante de raios-X, isto é, uma menor variação possível dos parâmetros elétricos em estudo.

Assim, pode-se resumir o conceito da aplicação do teste ANOVA para uma amostra de dados por meio da ilustração apresentada na Figura 19.

Figura 19- Ilustração para mostrar o conceito da aplicação do teste ANOVA para uma amostra de dados

Fonte: Autor “adaptado de” [67], slide 11.

Para que este teste estatístico seja efetuado corretamente, deve-se considerar k populações, sendo que k deve ser pelo menos igual a 3 [52], [53], [54], [66]. Além disso, as distribuições das populações têm que ter distribuições normais e também as populações têm que ter praticamente as mesmas variâncias s2 ou desvios-padrão s. Desde que os tamanhos amostrais sejam iguais ou quase iguais, as variâncias das populações podem diferir por quantidades que tornem a maior variância até nove vezes o valor da menor variância (razão estimada entre as variâncias) e os resultados da ANOVA continuarão a ser essencialmente confiáveis [52], [53], [54], [66]. Além disso, as hipóteses a serem criadas para a aplicação deste teste devem apresentar as seguintes características:

H0: 𝜇̅1 = 𝜇̅2 = 𝜇̅3 = ⋯ = 𝜇̅𝑘

H1: há pelo menos uma média diferente das demais

Na prática, ao aplicar o teste ANOVA e constatar que a hipótese H0 é verdadeira, teremos a condição ilustrada na Figura 20.

Figura 20 - Condição para hipótese H0 verdadeira ao aplicar o teste ANOVA.

Fonte: Autor “adaptado de” [67], slide 7.

Na Figura 20 podem-se observar três diferentes funções densidade de probabilidade normais de um parâmetro x qualquer e também três valores médios (𝜇̅̅̅, 𝜇1 ̅̅̅ 2 e 𝜇̅̅̅) das diferentes amostras 1, 2 e 3. 3

Por outra lado, se H0 for rejeitada e H1 for aceita, teremos a condição ilustrada na Figura 21.

Figura 21 - Condição para H0 rejeitada e H1 aceita ao aplicar o teste ANOVA

Fonte: Autor “adaptado de” [67], slide 8.

Desta forma, o principal objetivo da aplicação deste teste estatístico ANOVA é comparar a dispersão (variância) entre as médias amostrais e a dispersão (variância) que existe dentro de cada amostra [52], [53], [54], [66].

No processo de montagem desta análise, deve-se trabalhar com o conceito de que a variação total dos dados provém de dois fatores: variação entre as amostras e a variação de dentro das amostras [52], [53], [54], [67], [66].

A equação (23) ilustra como é efetuado o cálculo da variação total entre as amostras para a aplicação do teste ANOVA.

𝑆𝑄𝑇 = ∑ ∑(𝑥𝑖𝑗− 𝜇̅)2

𝑛𝑗

𝑖=1 𝑘

𝑗=1

(23) onde na equação (23), SQT é a soma de quadrados total, xij é um dado de uma amostra que se pretende estudar da amostra “j”, 𝜇̅ é o valor médio do conjunto de k amostras, nj é o número de observações na amostra “j” e k é o número de amostras [52], [53], [54], [66].

A equação (24) ilustra como é efetuado o cálculo da variação entre as amostras para a aplicação do teste ANOVA [52], [53], [54], [66].

𝑆𝑄𝐸 = ∑ 𝑛𝑗∙ (𝑥̅𝑗− 𝜇̅)2

𝑘

𝑗=1

(24) onde na equação (24), SQE é a soma de quadrados dos erros, 𝑥̅𝑗 é um valor médio de uma amostra “j” que se pretende estudar, 𝜇̅ é o valor médio representativo de todas as amostras, nj é o número de elementos da amostra “j” e k é o número de amostras [52], [53], [54], [66]. Assim, o valor calculado de SQE é uma medida da variação entre os valores médios devido à diferença entre as amostras, conforme ilustrado na Figura 22 [66], [67].

Figura 22 – Ilustração da variação entre os valores médios devido à diferença entre as amostras.

Fonte: Autor “adaptado de” [67], slide 19.

Na Figura 22 podem-se observar duas diferentes funções densidade de probabilidade normais de um parâmetro x qualquer e também dois diferentes valores médios (𝜇̅ e 𝑥̅𝑗).

A equação (25) ilustra como é efetuado o cálculo da variação de dentro das amostras para a aplicação do teste ANOVA [52], [53], [54].

𝑆𝑄𝑅 = ∑ ∑(𝑥𝑖𝑗− 𝑥̅ )𝑗 2

𝑛𝑗

𝑖=1 𝑘

𝑗=1

(25) onde na equação (25), SQR é a soma de quadrados da regressão, nj é o número de elementos da amostra “j”, k é o número de amostras, 𝑥̅𝑗 é a média da amostra “j” e 𝑥𝑖𝑗 é a i-ésima observação na amostra j [52], [53], [54], [66], [67]. Assim, o valor calculado de SQR é a soma de quadrados que representa a variabilidade comum a todas as populações em consideração, conforme ilustrado na Figura 23 [67].

Figura 23 – Cálculo da variabilidade de todas as populações considerando a soma da variação dentro de cada amostra e então somam-se todas as amostras.

Fonte: Autor “adaptado de” [67], slide 21.

Para aceitarmos ou rejeitarmos a hipótese nula (H0), pode-se proceder de duas formas diferentes:

a) escolha de um FC por meio de uma tabela denominada de distribuição F para um nível de significância α’ (neste estudo é adotado para ser igual a 0,05 ou 5%) e é utilizada para a aplicação do teste ANOVA [52], [53], [54], [66];

b) por meio da comparação do valor p com o nível de significância escolhido [52], [53], [54], [66].

A escolha do FC permite criar os intervalos de aceitação e de rejeição das hipóteses escolhidas para o teste ANOVA, ou seja, se o valor de “Fcalculado” calculado por meio da equação (26) está dentro do intervalo de aceitação, deve-se considerar a hipótese afirmativa como verdadeira, caso contrário, a hipótese afirmativa será considerada falsa [52], [53], [65] [66].

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =

𝑆𝑄𝐸⁄(𝑘 − 1) 𝑆𝑄𝑅⁄(𝑛− 𝑘)

(26) onde na equação (26) “k-1” representa os graus de liberdade do numerador (g.l.1) e “n’-k” representa os de graus de liberdade do denominador (g.l.2) e k representa a quantidade de médias diferentes sendo comparadas. Desta forma, deve-se comparar este valor de

“Fcalculado” com o valor de FC obtido da tabela de distribuição F em função do nível de significância α’ e em função do número de graus de liberdade (g.l.) das amostras que têm (k-1) graus de liberdade no numerador da equação (26) e (n’-k) graus de liberdade no denominador da equação (26). Se “Fcalculado” for superior ao valor de FC, deve-se rejeitar a hipótese nula [52], [53], [54], [67], [66]. A Figura 24 ilustra um exemplo de um gráfico da FDP 𝜒2 em função de FC indicando a forma pela qual é feita a decisão para aceitar ou rejeitar H0, em função de um valor de F obtido da tabela de distribuição F e em função do nível de significância α’ adotado igual a 5%.

Figura 24 – Exemplo de um gráfico de FDP 𝜒2 em função de FC indicando a forma pela qual é feita a decisão para aceitar ou rejeitar H0 em função de um valor de F, que é obtido da tabela de distribuição F em função do nível de significância α’, que foi adotado igual a 5%, para a aplicação do teste estatístico ANOVA.

Fonte: Autor “adaptado de” [67], slide 29.

A outra maneira de aceitarmos ou rejeitarmos a hipótese afirmativa (H0) é por meio da comparação do valor p do teste ANOVA com o nível de significância escolhido para a aplicação deste teste [52], [53], [65] [66]. O valor de p é calculado como sendo a área sob a curva de distribuição F (distribuição proporcional à densidade de probabilidade 𝜒2) em função do valor de “Fcalculado”, onde este está inserido no intervalo para F > 0[52], [53], [65], [66]. Assim, se o valor de p for superior ao valor do nível de significância (α’) escolhido, deve-se considerar H0 verdadeira, caso o valor de p seja inferior ao valor do nível de significância (α’), deve-se considerar H0 como falsa.

Ressalta-se que este teste estatístico foi aplicado nesta tese de doutorado utilizando o software estatístico MINITAB 2020 [64].