• Nenhum resultado encontrado

APÊNDICE C Uma Outra Base Filmes

C.3 Implementando a BaseF ilmes

A BaseF ilmes foi implementada a partir de duas bases dispon´ıveis na Internet com dados reais de filmes e pessoas que atuaram neles:

•base 1 - (KAGGLE, 2017) - arquivo CSV com todos os filmes, atores, diretores, roteiristas indicados e ganhadores do Oscar, prˆemio do cinema americano, desde 1927 at´e 2015;

•base 2 - (TEMPLE, 2016) - arquivo CSV com 5.043 filmes como nome do filme, diretor, at´e trˆes atores e atrizes que atuaram no filme e categoria do filme.

As diversas entidades e relacionamentos da base foram populadas conforme segue: •pessoa - o nome da pessoa nos registros de indica¸c˜ao para Ator, Atriz, Diretor, etc

da base 1 mais os nomes dos trˆes atores em cada registro de filmes na base 2. O campo sexo foi preenchido com 1, masculino, para aqueles indicados `a melhor ator, 2, feminino, para as indicadas a melhor atriz, e 3, n˜ao informado, para os demais. Como n˜ao existiam datas, foi gerada uma data aleat´oria para cada registro;

•f ilme - o nome dos filmes nas duas bases. O atributo ano foi preenchido com o ano do Oscar para os filmes vindos da base 1, ou o ano do filme naqueles da base 2. O atributo dura¸c˜ao foi preenchido com o valor informado na base 2. N˜ao existindo essa informa¸c˜ao foi atribu´ıdo o valor −1;

•categoria - as diversas categorias informadas nas duas bases foram combinadas e montada uma base sem registros duplicados;

•f uncao - as fun¸c˜oes foram definidas como ‘Ator’, ‘Atriz, ‘Diretor, ‘Roteirista’ e ‘M´usico´;

•premio - foram colocados os registros ‘Oscar’, ‘Festival de Cannes’,‘C´esar’,‘Framboesa de Outro’ (piores filmes do ano nos Estados Unidos) e ‘Gramado’;

•tipoP remio - os diversos tipos de prˆemios constantes na base 1;

•relacionamento F ilmeCategoria - conforme as diferentes categorias indicadas para o filme nas bases 1 e 2, foram criados estes relacionamentos;

•relacionamento Atuou - de acordo com a base 1, foram combinados o f ilme, a pessoa indicada ao prˆemio e, de acordo com o tipo do prˆemio, foi definida a fun¸c˜ao. Se Melhor Atriz, atuou como Atriz, se Melhor Diretor, atuou como Diretor, etc; •relacionamento indicada - de acordo com a base 1, onde os registros traziam a

pessoa, o f ilme, o tipoP remio a que ela foi indicada (melhor atriz, melhor ator, etc.) e o premio (Oscar). Al´em disso, o registro trazia o atributo winner, com o valor 1 se a pessoa foi a premiada ou 0 se apenas indicada;

•relacionamento indicado - da mesma maneira que o relacionamento indicada, sendo relacionados apenas aqueles registros da base 1 sem pessoa informada, ou seja, indica¸c˜ao do filme, como, por exemplo, ‘Melhor filme’.

As tabelas C.4, C.5 e C.6 trazem o total de v´ertices por m´etodo, total de arestas por m´etodo e tamanho das bases.

Analisando as tabelas pode-se observar que, ao contr´ario da BaseT este onde a base com menor n´umero de v´ertices e arestas foi a do m´etodo M 04, aqui isso ocorreu com a base do m´etodo M 05, mas que apesar disso, ainda teve ´area total maior que a do m´etodo M 04. De resto, as mesmas conclus˜oes podem ser obtidas aqui.

Tabela C.4: BaseFilmes - Tamanho das Bases por M´etodo

Base Tamanho (MB) M01 335 M03 488 M04 129 M05 132

Tabela C.5: BaseFilmes X M´etodos - Total de V´ertices por M´etodo

V´ertice M01 M03 M04 M05 Ano - 89 - - Atuacao 21.850 21.850 21.850 - Categoria 26 26 26 26 Data - 7.034 - - Duracao - 192 - - Filme 12.509 12.509 12.509 12.509 Funcao 6 6 - Indicada 2.681 2.681 2.681 2.681 Indicado 5.902 5.902 5.902 5.902 Pais 86 85 - - Pessoa 9.595 9.595 9.595 9.595 Premio 5 5 5 5 Sexo - 3 - - TipoPremio 114 114 114 - 52.774 60.091 52.682 30.718

C.4 Consultas Efetuadas

Seguindo todos os passos descritos na se¸c˜ao 4.2 para as consultas na BaseT este da disserta¸c˜ao, para a BaseF ilmes foram executadas 14 diferentes consultas com o objetivo de explorar as diferentes caracter´ısticas dos diversos modelos gerados. Da mesma maneira que nos experimentos com a BaseT este, aqui tamb´em cada consulta foi executada oito vezes, sendo a primeira considerada como aquecimento e descartada e as sete ´ultimas consideradas para a m´edia.

Tabela C.6: BaseFilmes X M´etodos - Total de Arestas por M´etodo Aresta M01 M03 M04 M05 atuacaoTOfilme 21.850 21.850 21.850 - filmeTOano - 12.509 - - filmeTOatuacao 21.850 21.850 21.850 - filmeTOcategoria 14.241 14.241 14.241 14.241 filmeTOduracao - 12.509 - - filmeTOindicada 2.681 2.681 2.681 2.681 filmeTOindicado 5.902 5.902 5.902 - filmeTOpais 12.509 12.509 - - filmeTOpremio - - - 5.902 funcaoTOatuacao 21.850 21.850 - - indicadaTOano - 2.681 - - indicadaTOpremio 2.681 2.681 2.681 - indicadaTOtipoPremio 2.681 2.681 2.681 2.681 indicadoTOano - 5.902 - - indicadoTOpremio 5.902 5.902 5.902 - indicadoTOtipoPremio 5.902 5.902 5.902 - pessoaTOatuacao 43.700 43.700 43.700 - pessoaTOdata - 9.595 - - pessoaTOindicada 2.681 2.681 2.681 2.681 pessoaTOsexo - 9.595 - - 164.430 217.221 130.071 28.186

As consultas foram executadas no mesmo equipamento das consultas com a BaseT este e seguindo os mesmos crit´erios. A tabela C.8 traz o tempo m´edio das consultas. A` semelhan¸ca das tabelas do cap´ıtulo 4, elas cont´em as colunas:

•Consulta - n´umero da consulta;

•M 01 M 03 M 04 M 05, com as seguintes colunas para cada modelagem:

–M ED - tempo m´edio em milissegundos (ms) das 7 execu¸c˜oes das consultas nas bases dos m´etodos;

–DP - desvio padr˜ao do tempo das 7 execu¸c˜oes;

–IC - intervalo de confian¸ca student t para as 7 execu¸c˜oes.

A an´alise dos resultados permite afirmar que:

•o mesmo ganho de desempenho obtido com a aplica¸c˜ao do m´etodo M 05 na BaseT este se repetiu na BaseF ilmes;

•da mesma maneira que na base anterior, aqui tamb´em o m´etodo proposto n˜ao foi o de melhor desempenho em todas as consultas, mas, tamb´em, n˜ao foi o de pior performance, reafirmando, assim, sua validade;

Tabela C.7: BaseFilmes - Consultas Efetuadas

Consulta Entidades Envolvidas Objetivo

01 Pessoa, Filme, Funcao Pessoas Com Maior N´umero de Atua¸c˜oes 02 Pessoa, Filme, Funcao,

Atua¸c˜ao

Pessoas Com Maior N´umero de Atua¸c˜oes como Di- retor

03 Pessoa, Filme, Funcao, Atua¸c˜ao, TipoPremio, In- dicada

Pessoas com Maior N´umero de Indica¸c˜oes

04 Pessoa, Filme, Funcao, Atua¸c˜ao, TipoPremio, In- dicada

Pessoas com Maior N´umero de Premia¸c˜oes

05 Pessoa, Filme, Funcao, Atua¸c˜ao, TipoPremio, In- dicada

Pessoas com Maior N´umero de Indica¸c˜oes Sem Pre- mia¸c˜ao

06 Pessoa, Filme, TipoPre- mio, Indicada

Pessoas que Receberam Uma ´Unica Indica¸c˜ao e Fo- ram Premiadas

07 Filme, Categoria Categorias com Maior N´umero de Filmes 08 Pessoa, Filme, Funcao,

Atua¸c˜ao, TipoPremio, In- dicada, Indicado, Premio, Categoria

Filmes por Pessoas

09 Pessoa, Atuacao, Funcao, Indicada

Pessoas Com Maior N´umero de Indica¸c˜oes

10 Filme, Indicada, Indicado, Premio

Filmes Mais Indicados que Foram Premiados em To- das as Indica¸c˜oes

11 Filme, Pais, Indicada, In- dicado, Premio

Pa´ıses com Mais Indica¸c˜oes e Premia¸c˜oes para Me- lhor Filme Estrangeiro

12 Filme, Pais, Indicada, In- dicado, Premio

Paises com Maior Numero de Filmes na Base exceto EUA

13 Pessoa Caminho M´ınimo Entre Fernanda Torres e Charles Chaplin

14 Pessoa Todos os Caminhos M´ınimos entre Fernanda Torres e Keanu Reeves

Tabela C.8: BaseFilmes - 7 Execu¸c˜oes da Consulta (M 01/M 02, M 03, M 04, M 05)

Cons

M01/M02 M03 M04 M05

MED DP IC MED DP IC MED DP IC MED DP IC 01 465 22,4 ±20,7 617 39,5 ±36,5 333 35,0 ±32,4 185 78,8 ±72,9 02 101 15,0 ±13,9 365 555,5 ±513,8 92 15,2 ±14,0 82 3,3 ±3,1 03 50 4,0 ±3,7 65 4,3 ±4,0 52 3,7 ±3,4 39 4,2 ±3,9 04 17 3,6 ±3,4 20 3,8 ±3,5 19 4,5 ±4,1 17 2,6 ±2,4 05 51 4,8 ±4,5 56 8,1 ±7,5 52 3,1 ±2,8 38 3,3 ±3,1 06 24 6,9 ±6,4 23 3,8 ±3,5 21 2,9 ±2,7 20 3,7 ±3,4 07 32 4,9 ±4,5 39 6,5 ±6,0 30 1,1 ±1,0 30 2,7 ±2,5 08 22 4,2 ±3,8 42 3,8 ±3,6 19 4,9 ±4,6 44 5,8 ±5,4 09 954 68,1 ±63,0 865 21,6 ±20,0 906 41,2 ±38,1 781 24,1 ±22,3 10 965 17,8 ±16,5 918 8,8 ±8,1 1.030 28,0 ±25,9 1.010 5,1 ±4,7 11 186 14,9 ±13,8 185 6,3 ±5,8 182 17,5 ±16,2 195 4,2 ±3,9 12 14 4,2 ±3,9 17 3,7 ±3,4 34 4,1 ±3,8 31 3,9 ±3,6 13 9 2,5 ±2,3 9 2,3 ±2,1 8 3,5 ±3,2 1 0,5 ±0,5 14 16 2,1 ±1,9 16 3,0 ±2,8 17 4,9 ±4,5 2 0,5 ±0,5

•as consultas demonstraram que onde houve redu¸c˜ao de caminho com a elimina¸c˜ao de v´ertices e incorpora¸c˜ao de seus atributos por relacionamentos, houve melhora no desempenho.