• Nenhum resultado encontrado

EDITAL Nº 9/2020. Diretoria de Pesquisa e Pós-Graduação - Campus Dois Vizinhos CURSO DE ESPECIALIZAÇÃO EM CIÊNCIA DE DADOS

N/A
N/A
Protected

Academic year: 2021

Share "EDITAL Nº 9/2020. Diretoria de Pesquisa e Pós-Graduação - Campus Dois Vizinhos CURSO DE ESPECIALIZAÇÃO EM CIÊNCIA DE DADOS"

Copied!
42
0
0

Texto

(1)

Ministério da Educação

​UNIVERSIDADE TECNOLÓGICA FEDERAL DO

PARANÁ

DIRETORIA DE PESQUISA E PÓSGRADUAÇÃO -CAMPUS DOIS VIZINHOS

DEPARTAMENTO DE APOIO DOS CURSOS DE ESPECIALIZAÇÃO LATO-SENSU DO CAMPUS DOIS

VIZINHOS

EDITAL Nº 9/2020

Diretoria de Pesquisa e Pós-Graduação - Campus Dois Vizinhos CURSO DE ESPECIALIZAÇÃO EM CIÊNCIA DE DADOS

Pelo presente, fazemos saber aos interessados que se acham abertas as inscrições para o CURSO DE ESPECIALIZAÇÃO EM CIÊNCIA DE DADOS, nível Lato Sensu, cujo funcionamento foi aprovado pelo Conselho de Ensino, Pesquisa e Pós-Graduação da UTFPR - COPPG, conforme Resolução 08/2020, de acordo com o Regulamento da Organização Didático-Pedagógica dos Cursos de Pós-Graduação Lato Sensu da UTFPR, aprovado pela Resolução 33/2019 de 30 de setembro de 2019, do COPPG, e em concordância com a Resolução 01/2018 CNE/CES, obedecendo as seguintes condições:

I - FINALIDADE DO CURSO

O curso de Especialização em Ciência de Dados, na modalidade à distância, objetiva preparar profissionais especialistas para que possam atuar em serviços de (i) Gerência e Administração de Banco de Dados, (ii) Inteligência de Negócio, (iii) Inteligência Artificial e Aprendizagem de Máquina, e (iv) Gerenciamento de Volumes Massivos de Dados. Os objetivos específicos desse curso são: (i) formar recursos humanos com análise crítica preparado para atuar na academia e indústria, (ii) correlacionar o desenvolvimento de métodos e modelos propostos na literatura científica da Ciência de Dados com a resolução de problemas reais enfrentados pelas organizações, e (iii) introduzir o desenvolvimento de trabalhos técnico-científicos que podem contribuir para as organizações e sociedade.

Área de Conhecimento: Banco de Dados (1.03.03.03-0).

II - LOCAL DO CURSO

O curso será ministrado no Ambiente Virtual de Ensino e Aprendizagem (AVEA) Moodle Institucional da UTFPR. O curso de Especialização em Ciência de Dados será ambientado no Câmpus de Dois Vizinhos, situado à Estr. p/ Boa Esperança, km 04 - Zona Rural, Dois Vizinhos - PR, 85660-000.

III - DURAÇÃO, TURNO E HORÁRIO DE FUNCIONAMENTO DO CURSO

A carga horária total do curso é de 360 horas, sendo que as aulas são ministradas semanalmente por meio do AVEA Moodle Institucional da UTFPR. Utilizando este ambiente o docente de uma disciplina poderá disponibilizar: (i) material didático como apresentações e apostilas, (ii) vídeos curtos que descrevem os pontos principais do material didático disponibilizado, (iii) web conferências que serão

Boletim de Serviço Eletrônico em 23/12/2020

(2)

gravadas e contarão com a participação virtual dos alunos, tirando dúvidas e discutindo o conteúdo das disciplinas, e (iv) procedimentos avaliativos.

IV - VAGAS

O curso oferecerá 60 vagas para concorrência pública. Sobre o número total de alunos matriculados a UTFPR se reserva o direito de acrescer vagas adicionais (10%) visando a capacitação de servidores, conforme política institucional da UTFPR.

A turma será aberta se houver no mínimo 35 candidatos selecionados com matrícula confirmada.

V - DATAS PARA INSCRIÇÃO, CLASSIFICAÇÃO E MATRÍCULA

Período de Inscrição 11/01/2021 a 22/02/2021

Resultado da classificação 23/02/2021

Interposição de Recurso 24/02/2021 a 10/03/2021

Período de Matrícula 24/02/2021 a 10/03/2021

Segunda chamada para matrícula 11/03/2021 a 12/03/2021

VI - CONDIÇÕES PARA INSCRIÇÃO

Os interessados em participar do processo de classificação deverão: 1. Efetuar a inscrição no site http://pos.funtefpr.org.br/

2. Efetuar o pagamento da taxa de inscrição no valor de R$ 35,00 (trinta e cinco reais).

3. Encaminhar através do site da inscrição, até o dia 22/02/2021 (último dia da inscrição), cópia dos seguintes documentos:

Documento de identidade e CPF;

Diploma ou certificado de conclusão do curso de graduação contendo a data de colação de grau do aluno;

Obs.: O certificado de conclusão é aceito apenas para inscrição e matrícula. Para fazer jus ao Certificado da Especialização, além de cumprir os requisitos acadêmicos do curso, o estudante deverá obrigatoriamente entregar cópia do Diploma de Graduação e apresentar o documento original para autenticação em até seis meses após o início das atividades letivas, sob pena de cancelamento da matrícula.

(3)

Histórico escolar do curso de graduação; Curriculum Vitae;

Comprovante de Residência;

Para o candidato estrangeiro, poderá ser solicitada documentação complementar, após análise inicial. Os documentos necessários para esta situação serão requeridos pela secretaria do curso, em atendimento à legislação vigente;

Importante: A documentação apresentada pelos candidatos não aprovados deverá ser retirada em um prazo máximo de 30 dias após o término do processo de matrícula, sob pena de eliminação de tais documentos.

4. O candidato, ao se inscrever, aceita as condições constantes no presente edital, delas não podendo alegar desconhecimento.

5. O candidato deve armazenar o número do protocolo e código de acesso, gerados no momento da inscrição no sistema. Essas informações serão necessárias para acompanhar os processos de inscrição e classificação.

VII - CRONOGRAMA DE EXECUÇÃO DO CURSO

Início das atividades letivas 13/03/2021

Férias 02/08/2021 a 08/08/2021 e

27/12/2021 a 09/01/2022

Reinício das atividades letivas 09/08/2021 e 10/01/2022

Término das atividades letivas 15/05/2022

Data limite para entrega do Trabalho de Conclusão de Curso 12/09/2022

VIII - CRITÉRIOS PARA CLASSIFICAÇÃO

1. Os candidatos serão classificados por uma Comissão designada pelo Diretor Geral do Câmpus Dois Vizinhos, conforme Regulamento da Organização Didático-Pedagógica dos Cursos de Pós-Graduação Lato Sensu da UTFPR;

2. A classificação dos candidatos será feita até o número de vagas existentes na concorrência pública. Os demais comporão lista de espera para o caso de desistências.

3. A Seleção dos Candidatos será feita pelos seguintes critérios e obedecerá à seguinte prioridade 1. Histórico Escolar;

2. Curriculum-Vitae; 3. Idade mais avançada.

(4)

4. Os candidatos serão ranqueados em ordem decrescente de pontuação, segundo tabela a seguir Subitem Pontos por subitem Limite por subitem Limite do conjunto

Diploma de graduação na área* 30 por

diploma 30

30

Curso na área de programação 1 por

hora 30

Livro 3 livropor Não há

25

Capítulo de livro 2 por

capítulo Não há Periódicos JCR acima de 2 ou SNIP acima de 1,501 10 por trabalho Não há JCR de 1 até 1,99 ou SNIP de 1,001 até 1,500 8 por trabalho Não há JCR de 0,2 até 0,99 ou SNIP de 0,501 até 1,000 4 por trabalho Não há SNIP de 0,001 até 0,500 2 por trabalho Não há

Sem JCR ou SNIP 1 por

trabalho 5 Trabalhos publicados Internacionais (trabalho completo, resumo expandido ou resumo) 4 por trabalho

(5)

em eventos científicos na área* Nacionais ou regionais ou locais (trabalho completo ou resumo expandido ou resumo) 2 por trabalho 20 Patente ou registro de software na área* Concedidas e Devidamente registradas 2 por item 10 Participação em projetos financiados na área* 2 por projeto 10

Experiência profissional comprovada na área* 3 por ano 30 30 Média aritmética de notas obtidas na graduação 8 a 10 15 pontos 15 15 6 a 8 5pontos 5 4 a 6 3 pontos 3

* de computação, matemática, física, estatística, engenharias e outras áreas que a Comissão de Seleção julgar pertinentes à área de Ciência de Dados

5. Um trabalho poderá ser pontuado em apenas um subitem (o de maior pontuação).

6. Em caso de empate entre dois ou mais candidatos, terá preferência aquele com idade igual ou superior a 60 (sessenta) anos, conforme dispõe o parágrafo único do art. 27 da Lei nº 10.741/2003. Persistindo o empate ou em caso de não haver candidato na situação prevista no dispositivo legal em comento, terá preferência para efeito de desempate o candidato que, na seguinte ordem: (1) maior pontuação resultante da soma dos subitens Periódicos na área e Trabalhos publicados em eventos científicos; (2) melhor pontuação em Experiência profissional comprovada na área; (3) melhor pontuação em Média aritmética de notas obtidas na graduação; (4) maior idade. Os casos omissos serão julgados pela comissão de seleção, tendo a Direção Geral do Câmpus como instância superior.

7. O resultado da seleção será publicado no site de inscrição, na data indicada no item V;

8. A interposição de recurso, em relação ao resultado do processo de seleção, deve ser feita junto à Assessoria de Pós-Graduação Lato Sensu (adirppg-dv@utfpr.edu.br), das 8:00 horas às 18:00 horas, até a data indicada no item V do presente documento.

(6)

1. O processo de matrícula compreende a apresentação de documentos e assinatura de contrato de prestação de serviços;

2. Os candidatos selecionados deverão efetuar o pagamento da taxa de matrícula até 10/03/2021 e concluir o processo de matrícula, junto à secretaria do curso, enviando:

1. Cópias autenticadas do documento de identidade e CPF, diploma de graduação, e histórico escolar da graduação ;

2. Documentação para estrangeiros, quando solicitada pela coordenação.

3. No ato da matrícula deverá ser assinado o contrato de prestação de serviços, disponível, para leitura e conhecimento prévio, no site de inscrição;

4. Os candidatos que não fizerem a matrícula até a data limite perderão suas vagas, sendo as mesmas preenchidas a partir da lista de espera.

X – CONVÊNIO UTFPR E FUNTEF-PR

1. A Fundação de Apoio à Educação, Pesquisa e Desenvolvimento Científico e Tecnológico da Universidade Tecnológica Federal do Paraná (FUNTEF-PR) atuará como apoiadora à UTFPR na gestão financeira do presente curso, sendo a responsável pela inscrição inicial e captação das mensalidades, e esta parceria entre a UTFPR e FUNTEF-PR é regulada pelo Convênio No. 13/2020.

XII - CONDIÇÕES DE PAGAMENTO

1. O candidato, no ato da matrícula, fará a opção de uma das seguintes condições de pagamento: Taxa de Inscrição: R$ 35,00. Valor do Curso à vista: Matrícula no valor de R$ 456,00 e parcela única no valor de R$ 8.618,40.

Taxa de Inscrição: R$ 35,00. Valor do Curso parcelado - Matrícula no valor de R$ 456,00 mais 20 parcelas de R$ 456,00 com vencimentos nos dias 10 de cada mês, a partir do mês de abril de 2021.

2. Não haverá a devolução da taxa de inscrição dos candidatos desistentes ou não classificados, caso o curso tiver sua abertura confirmada.

3. A devolução da taxa de matrícula, no caso de desistência, se fará no montante de 80% de seu valor, desde que solicitada antes do início das aulas do curso.

4. Atenção: Para fins de formalização dos serviços prestados durante o curso, será elaborado um contrato a ser assinado pelo Aluno selecionado com a Fundação de Apoio da UTFPR, para quem deverão ser realizados os depósitos referentes ao pagamento do curso.

XIII - CERTIFICADO DE CONCLUSÃO

1. Ao estudante que cumprir com todos os requisitos previstos no Regulamento da Organização Didático-Pedagógica dos Cursos de Pós-Graduação Lato Sensu da UTFPR vigente, fará jus ao

(7)

respectivo Certificado de Especialista, acompanhado de seu Histórico Escolar.

XIV – INFORMAÇÕES GERAIS

1. O candidato não selecionado poderá interpor recurso, conforme prazos estabelecidos no item V do edital de abertura, nos termos do artigo 59 da lei 9.784/99.

2. Eventuais questões do presente edital poderão ser dirimidas, em caso de discordância, no foro da Justiça Federal para dirimir eventuais questões decorrentes do edital, não solucionadas administrativamente.

3. Informações adicionais e eventuais dúvidas sobre o curso poderão ser atendidas pelo telefone +55 (46) 3536-8900 Ramal 8251, ou pelo e-mails da coordenação e secretaria do curso (cdados-dv@utfpr.edu.br).

4. O presente edital será publicado em meio eletrônico no site da FUNTEF.

5. Casos omissos a este edital serão resolvidos pelo Diretor de Pesquisa e Pós-graduação.

Dois Vizinhos, 22 de Dezembro de 2020.

Profa. Dra. Michele Potrich

Diretora de Pesquisa e Pós-Graduação do Câmpus Dois Vizinhos

Prof. Dr. Everton Ricardi Lozano da Silva Diretor Geral Câmpus Dois Vizinhos

Relação de links desse edital:

Diretoria de Pesquisa e Pós-Graduação-Câmpus Dois Vizinhos (DIRPPG-DV):

http://portal.utfpr.edu.br/estrutura/pesquisa-e-pos-graduacao/dirppg/dois-vizinhos

Pós-Graduação Lato Sensu-Especializações:

http://www.utfpr.edu.br/cursos/especializacao

(8)

http://pos.funtefpr.org.br/

Regulamento da Organização Didático-Pedagógica dos Cursos de Pós-Graduação Lato Sensu da UTFPR:

http://portal.utfpr.edu.br/documentos/pesquisa-e-pos-graduacao/proppg/lato-sensu/regulamento_lato_sensu_2018/view

Documento assinado eletronicamente por (Document electronically signed by) EVERTON RICARDI

LOZANO DA SILVA, DIRETOR(A)-GERAL, em (at) 22/12/2020, às 14:56, conforme horário oficial de

Brasília (according to official Brasilia-Brazil time), com fundamento no (with legal based on) art. 6º, § 1º, do

Decreto nº 8.539, de 8 de outubro de 2015.

Documento assinado eletronicamente por (Document electronically signed by) MICHELE POTRICH,

DIRETOR(A), em (at) 23/12/2020, às 14:43, conforme horário oficial de Brasília (according to official

Brasilia-Brazil time), com fundamento no (with legal based on) art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de 2015.

A autenticidade deste documento pode ser conferida no site (The authenticity of this document can be checked on the website) https://sei.utfpr.edu.br/sei/controlador_externo.php?acao=documento_conferir&id_orgao_acesso_externo=0, informando o código verificador (informing the verification code) 1829274 e o código CRC (and the CRC code)

C32ADF3C.

Anexo 1: DISCIPLINAS DO CURSO DE ESPECIALIZAÇÃO EM CIÊNCIA DE DADOS

Disciplina: Ambiente de Ensino e Aprendizagem a Distância (1) Carga Horária: 10 horas

Objetivo:

Compreender o conceito EAD como modalidade de ensino, suas especificidades, definições e evolução ao longo do tempo.

Participar de uma comunidade virtual de aprendizagem.

Conhecer as regras de convivência para participação de comunidades virtuais e as ferramentas de comunicação: emoticons, netiqueta, clareza, citações e diretrizes de feedback.

Participar de atividades de ambientação do ambiente virtual de aprendizagem (Moodle) e experimentar seus recursos e ferramentas como maneira de viabilizar sua participação como aluno virtual em

disciplinas posteriores em seu curso virtual.

(9)

Importância da tecnologia de informação e de comunicação como mediadora da aprendizagem. Apresentação do ambiente WEB como um dos meios eficazes para a EAD.

Diferentes categorias de EAD e os modelos de aprendizagem usados no desenvolvimento de um curso à distância em diferentes níveis: superior e pós-graduação.

Aspectos (pedagógicos, tecnológicos, organizacionais e institucionais) associados ao EAD baseado na WEB.

Apresentação e análise de diferentes ambientes virtuais: Moodle, TelEduc, Eureka, AulaNet e outros. Ênfase nas ferramentas disponibilizadas pelo Moodle.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. MORAES, M. C. Educação a distância: fundamentos e práticas. Campinas, SP: Unicamp/Nied, 2002.

2. QUINTELA, A. J. F.; ZAMBERLAN, M. F. Ambientação para EAD. Cuiabá, MT: Rede eTec Brasil, 2014.

3. NASH, S.; PILJAK, Z; MOORE, M. Moodle Course Design Best Practices. England: Packt Publishing, 2014.

4. SILVA, R. S. Moodle 3 para gestores, autores e tutores: Educação na era digital. São Paulo, SP: Novatec, 2016.

(10)

Consulta à base BiblioTec em 27/11/2019: bibliografias 1 e 3 disponíveis.

Disciplina: Análise e Modelagem de Banco de Dados (2) Carga Horária: 20 horas

Objetivo:

Apresentar a visão geral do gerenciamento de banco de dados relacionais.

Explicar o projeto conceitual de banco de dados relacional aplicando o modelo entidade-relacionamento e o diagrama entidade-relacionamento.

Estender conceitos do projeto conceitual de banco de dados para considerar diferentes visões de usuários e principais problemas de integração de esquemas.

Explicar o mapeamento do projeto conceitual para o projeto lógico usando o modelo relacional. Apresentar conceitos fundamentais de álgebra relacional.

Programa:

Demonstração da visão geral de banco de dados relacionais.

Importância de um Sistema Gerenciador de Banco de Dados e do uso de banco de dados na ciência de dados.

Abstração de dados: classificação, agregação, divisão e generalização. Projeto de banco de dados relacional: modelagem conceitual, lógica e física.

Modelo entidade-relacionamento (MER) e a construção de diagramas entidade-relacionamento considerando problemas de integração de esquemas entre diferentes visões de usuários.

Demonstração de técnicas de mapeamento do MER para o modelo lógico (esquema relacional). Dependências funcionais: normalização e sua importância.

Álgebra relacional: operadores fundamentais.

Construção de um projeto de banco de dados relacional: nível conceitual e lógico.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

(11)

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. HEUSER, C. A. Projeto de banco de dados. Porto Alegre, RS: Bookman, 2008.

2. SILBERSCHATZ, A.; KORTH, H. F.; SUDARSHAN, S. Sistema de banco de dados. Rio de Janeiro, RJ: Elsevier, 2012.

3. MACHADO, F. N. R. Banco de dados: projeto e implementação. São Paulo, SP: Erica, 2014. 4. ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. São Paulo, SP: Pearson

Addison-Wesley, 2019.

Consulta à base BiblioTec em 27/11/2019: bibliografia 3 disponível.

Disciplina: Introdução à Análise e Ciência de Dados (3) Carga Horária: 20 horas

Objetivo:

Abordar os aspectos fundamentais acerca ciência de dados.

Apresentar as principais etapas do processo de tomada de decisão e discutir os objetivos de cada etapa, a problemática envolvida, e as ferramentas tipicamente empregadas na solução dos problemas.

Apresentar e discutir técnicas para coleta, integração, pré-processamento e análise de dados, comunicação e visualização de resultados.

(12)

Programa:

Apresentação e discussão acerca ciência de dados e suas relações com Big Data e Inteligência de Negócio.

Demonstração do ecossistema de ciência de dados (etapas) e as capacidades exigidas de um cientista de dados.

Interpretação dos dados e como a ciência de dados pode solucionar problemas.

Coleta e pré-processamento de dados: obtenção de dados, tipos/formatos de dados, data scraping, Web, bibliotecas, limpeza, normalização e seleção de atributos e amostras.

Análise exploratória de dados: exploração dos dados, estatísticas descritivas (por exemplo, média, mediana, moda).

Visualização de dados: tipos de gráficos/dados, visualização, ferramentas e bibliotecas para construção de gráficos estáticos, dinâmicos e interativos.

Utilização da linguagem R para demonstração de conceitos.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. FACELI, K.; LORENA, A. C.; GAMA, J.; CARVALHO, A. C. P. L. F. Inteligência Artificial -Uma Abordagem de Aprendizado de Máquina. Rio de Janeiro, RJ: LTC, 2011.

2. AMARAL, F. Introdução a ciência de dados: Mineração de dados e Big Data. Rio de Janeiro, RJ: Alta Books, 2016.

(13)

3. GROLEMUND, G.; WICKHAM, H. R for Data Science: Visualize, model, transform, tidy, and import data. USA: O’Reilly Media, 2016.

Consulta à base BiblioTec em 27/11/2019: bibliografia 3 disponível.

Disciplina: Introdução ao Gerenciamento de Banco de Dados (4) Carga Horária: 10 horas

Objetivo:

Apresentar a visão geral das linguagens de programação para banco de dados relacionais e suas relações com a ciência de dados.

Explicar e implementar o projeto físico de um banco de dados relacional.

Aplicar a linguagem de definição de dados e a linguagem de manipulação de dados da SQL em um projeto de banco de dados relacional.

Apresentar conceitos gerais das outras partes da linguagem SQL.

Programa:

Demonstração das linguagens de programação usadas em um Sistema Gerenciador de Banco de Dados (SGBD) e sua importância na ciência de dados.

Utilização de um SGBD: instalação, configuração, usuários e funcionalidades principais. Construção do esquema físico de um banco de dados relacional.

Linguagem de definição de dados (DDL): criação, remoção e alterações estruturais de objetos armazenados em um banco de dados relacional.

Linguagem de manipulação de dados (DML): inserção, remoção, alteração e recuperação de dados. Conceitos básicos das linguagens de: controle de dados e controle de transações.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

(14)

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. SILBERSCHATZ, A.; KORTH, H. F.; SUDARSHAN, S. Sistema de banco de dados. Rio de Janeiro, RJ: Elsevier, 2012.

2. CHAUHAN, C. PostgreSQL Cookbook. Birmingham, UK: Packt Publishing, 2015.

3. MACHADO, F. N. R. Banco de dados: projeto e implementação. São Paulo, SP: Erica, 2014. 4. NIELD, T. Introdução à Linguagem SQL: Abordagem Prática Para Iniciantes. São Paulo, SP:

Novatec, 2016.

5. ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. São Paulo, SP: Pearson Addison-Wesley, 2019.

Consulta à base BiblioTec em 27/11/2019: bibliografias 2 e 3 disponíveis.

Disciplina: Administração e Gerenciamento de Banco de Dados (5) Carga Horária: 20 horas

Objetivo:

Contrastar elementos avançados da linguagem de manipulação de dados da SQL para recuperar dados de forma eficiente destacando esta importância na ciência de dados.

Aplicar a linguagem de controle de dados e a linguagem de controle de transações da SQL em um projeto de banco de dados relacional.

Construir esquemas de administração de usuários, delegar suas permissões e analisar aspectos de segurança.

(15)

procedural do Sistema Gerenciador de Banco de Dados e seu impacto na ciência de dados. Introduzir ferramentas avançadas para um SGBD: extensões e outras linguagens procedurais.

Programa:

Importância do gerenciamento e administração de banco de dados relacional na ciência de dados. Otimização na recuperação de dados: estruturas de indexação (índice invertido, B-tree, Hash, Bitmap, entre outros), plano de execução de consulta, habilitação de funcionalidades extras do Sistema

Gerenciador de Banco de Dados (SGBD), conceitos de tunning (configurações avançadas de um SGBD). Linguagem de controle de dados (DCL): atribuição, remoção e tipos de privilégios sobre um objeto de um banco de dados relacional.

Linguagem de controle de transações (TCL): conceito de transação e controle de concorrência, problemas clássicos de concorrência, propriedades ACID (atomicidade, consistência, isolamento e durabilidade).

Linguagem de programação procedural: gatilhos, funções, procedimentos e outras funcionalidades. Introdução ao SGBD extensível: bibliotecas, ferramentas e outras linguagens procedurais.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de Problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. SILBERSCHATZ, A.; KORTH, H. F.; SUDARSHAN, S. Sistema de banco de dados. Rio de Janeiro, RJ: Elsevier, 2012.

(16)

2. CHAUHAN, C. PostgreSQL Cookbook. Birmingham, UK: Packt Publishing, 2015.

3. MACHADO, F. N. R. Banco de dados: projeto e implementação. São Paulo, SP: Erica, 2014. 4. NIELD, T. Introdução à Linguagem SQL: Abordagem Prática Para Iniciantes. São Paulo, SP:

Novatec, 2016.

5. ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. São Paulo, SP: Pearson Addison-Wesley, 2019.

Consulta à base BiblioTec em 27/11/2019: bibliografias 2 e 3 disponíveis.

Disciplina: Preparação Pedagógica (6) Carga Horária: 10 horas

Objetivo:

Discutir as abordagens sistêmicas do processo de ensino e aprendizagem. Analisar os elementos que compõem um sistema de ensino em nível superior. Apresentar e descrever os modelos de ensino e aprendizagem.

Contrastar a metodologia de ensino, as estratégias individuais e em grupo de aprendizagem. Demonstrar e refletir sobre os métodos de avaliação de aprendizagem.

Apresentar ferramentas para elaboração de planos de ensino de disciplina e aula.

Programa:

Atuais desafios da Profissão Acadêmica: Ensino superior e sua função social. A formação de professores e a profissionalização do docente da Educação Superior. Metodologia do Ensino e da Aprendizagem: Planejamento Educacional.

As habilidades didáticas para docência e as competências para ensinar e para aprender. Uso de tecnologias de informação e comunicação no processo de ensino e aprendizagem. Construção de plano de ensino para o ensino superior e sua aplicação em uma aula.

(17)

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. FREIRE, P. Pedagogia da Autonomia: saberes necessários à prática educativa. São Paulo, SP: Paz e Terra, 2016.

2. GIL, A. C.. Metodologia do Ensino Superior. São Paulo, SP: Atlas, 2018.

3. OLIVIERI, M. A. et al. Didática e Prática do Ensino Superior. São Paulo, SP: Globus, 2016.

Consulta à base BiblioTec em 27/11/2019: bibliografia 1 disponível.

Disciplina: Linguagens de Programação para Ciência de Dados (7) Carga Horária: 20 horas

Objetivo:

Apresentar as principais linguagens de programação para ciência de dados. Introduzir a linguagem de programação Python para ciência de dados. Criar soluções algorítmicas aplicadas à ciência de dados.

Aplicar as bibliotecas Matplotlib, NumPY e Pandas para a manipulação e visualização de dados. Contrastar os principais conceitos de ciência de dados.

(18)

Programa:

Principais linguagens de programação para ciência de dados e a importância/popularização da linguagem de programação Python.

Instalação e preparação de ambiente de programação para a linguagem Python.

Elementos básicos da linguagem Python, estrutura sequencial, de decisão e de repetição. Tipos de dados em Python: tipos básicos, tuplas, listas, mutação e dicionários.

Funções.

Manipulação de strings. Recursão, busca e ordenação. Classes e herança.

Eficiência, estilo de programação e documentação interna.

Introdução às bibliotecas Pandas, colab, spyder, Matplotlib e NumPy. Desenvolvimento de algoritmos utilizando Python.

Conceitos fundamentais: predição, aprendizado supervisionado e não supervisionado.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de Problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

(19)

1. IDRIS, I. Python Data Analysis: Learn how to apply powerful data analysis techniques with popular open source Python modules. UK: Packt Publishing Ltd, 2014.

2. LANGTANGEN, H. P. A primer on scientific programming with Python. Berlin, Heidelberg: Springer, 2016.

3. GUTTAG, J. Introduction to Computation and Programming Using Python: With Application to Understanding Data Second Edition. USA: MIT Press, 2016.

4. BORGES, L. E. Python para desenvolvedores. São Paulo, SP: Novatec, 2017.

Consulta à base BiblioTec em 27/11/2019: bibliografias 2, 4, e resenha da bibliografia 3 disponíveis.

Disciplina: Recuperação de Informação Baseada em Conteúdo (8) Carga Horária: 20 horas

Objetivo:

Discutir sobre o gerenciamento de dados não convencionais (complexos) e sua manipulação em aplicações avançadas e modernas.

Contrastar os diferentes tipos de consultas por similaridade em bases de dados complexos, com e sem o uso da diversidade nos resultados.

Analisar a representação dos dados complexos, em especial imagens, em bases de dados pela extração de características por diferentes categorias, discutindo a dimensionalidade dos dados e como reduzi-las. Contrastar as diferentes funções de distância, aplicando-as no espaço métrico.

Aplicar métodos de acesso métrico para melhorar o desempenho de consultas por similaridade. Desenvolver aplicações utilizando imagens para enriquecer o uso da ciência de dados.

Programa:

Definição de dados não convencionais e suas manipulações: dados espaciais e imagens. Importância de utilizar imagens em aplicações com ciência de dados.

Discussão dos principais operadores para manipular imagens.

Demonstração das etapas da recuperação de informação baseada em conteúdo.

Consultas por similaridade e suas implementações: Knn, consulta por abrangência (range query), Knn reverso, entre outros.

(20)

Diversidade em consultas por similaridade. Descritores.

Extração de características: baseado em segmentação, textura, cor e suas combinações. Funções de distância: Minkowski, Mahalanobis, Canberra, entre outras.

Definições de espaço métrico.

Métodos de acesso métrico: conceitos, implementação e desempenho.

Redução de dimensionalidade: PCA, Fractal e a maldição da dimensionalidade.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de Problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. CHÁVEZ, E. et al. Searching in metric spaces. ACM Computing Surveys. New York, v. 33., n. 3, p. 273-321, 2001.

2. BAEZA-YATES, R.; RIBEIRO-NETO, B. Recuperação de informação: conceitos e tecnologia das máquinas de busca. Porto Alegre, RS: Bookman, 2013.

3. RUSS, J. C; NEAL, F. B. The Image Processing Handbook. Switzerland, Europe: CRC Press, 2016.

(21)

Consulta à base BiblioTec em 27/11/2019: bibliografias 2 e 3 disponíveis.

Disciplina: Introdução ao Big Data (9) Carga Horária: 20 horas

Objetivo:

Introduzir conceitos fundamentais acerca Big Data e sua importância na ciência de dados.

Contrastar os diferentes tipos de modelos de dados NoSQL existentes, comparando com os modelos de dados relacionais.

Construir soluções de gerenciamento de dados utilizando como base os banco de dados NoSQL.

Aplicar técnicas para melhorar o processamento massivo de dados presentes em banco de dados NoSQL, culminando nos princípios de computação paralela e distribuída de dados.

Desenvolver aplicações para ciência de dados utilizando conceitos de Big Data e NoSQL.

Programa:

Conceitos básicos sobre Big Data e seus elementos principais: características dos Vs do Big Data. Conceitos sobre NoSQL e sua importância na ciência de dados.

Paradigma BASE e suas diferenças em relação ao paradigma ACID.

Modelos de dados para NoSQL e Big Data: orientado a documentos, orientado a chave e valor, orientado a coluna, orientado a linha e orientado a grafo.

Banco de dados NoSQL: aplicações, desenvolvimento e suas linguagens de consulta. Preparação de ambiente para utilização de um sistema NoSQL.

Conectividade de sistemas NoSQL utilizando uma linguagem de programação para ciência de dados. Técnicas de otimização de consultas para Big Data usando ferramentas NoSQL.

Introdução ao processamento massivo de grandes volumes de dados: combinando NoSQL e Sistemas Gerenciadores de Dados tradicionais com sistemas distribuído de dados.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

(22)

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. GHAVAMI, P. K. Big Data Governance: Modern Data Management Principles for Hadoop, NoSQL & Big Data Analytics (English Edition). Washington, DC: CreateSpace Independent Publishing Platform, 2016.

2. MARQUESONE, R. F. P. Big Data: Técnicas e tecnologias para extração de valor dos dados. São Paulo, SP: Casa do Código, 2017.

3. ÖZSU, M. T.; VALDURIEZ, P. Principles of Distributed Database Systems. France, Europe: HAL CCSD, Springer, 2019.

Consulta à base BiblioTec em 27/11/2019: bibliografias 2 e 3 disponíveis.

Disciplina: Processamento Analítico de Dados (10) Carga Horária: 20 horas

Objetivo:

Demonstrar o processamento analítico de dados como um subsídio fundamental para o auxílio na tomada de decisão estratégica e sua importância na inteligência de negócio.

Interpretar o ambiente de data warehousing como um aliado na ciência de dados. Aplicar a modelagem dimensional na resolução de problemas.

Comparar consultas analíticas em termos de suporte à decisão, escalabilidade, desempenho e funcionamento.

(23)

inteligência de negócio apresentando uma visão holística de ferramentas OLAP e conceitos avançados de data warehousing.

Programa:

Visão geral das etapas e elementos do ambiente de data warehousing e do processamento analítico de dados.

Importância do processamento analítico de dados na ciência de dados aplicada à inteligência de negócio. Processo de ETL: extração, transformação, limpeza e tratamento de dados e demonstração de

ferramentas disponíveis.

Modelagem dimensional: conceitos e objetivos, hipercubo de dados, tabelas de fato, tabelas de dimensão, medidas, hierarquias e grafo de derivação e entre outros elementos.

Data warehouse: conceitos e aplicações, esquema estrela, esquema floco-de-neve e constelação de fatos. Ferramentas de processamento analítico de dados: OLTP e OLAP, arquitetura, aplicações, demonstração e suas linguagens de consulta.

Consultas e operações OLAP: drill-down, roll-up, drill-across, pivoting, slice-and-dice

Técnicas de otimização de consultas analíticas: fragmentação horizontal e vertical, visão materializada e estruturas de indexação.

Conceitos sobre data warehouses não-convencionais e data lake.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

(24)

Bibliografia:

1. KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. Switzerland, Europe: John Wiley and Sons, 2013.

2. VAISMANN, A;, ZIMÁNYI, E. Data Warehouse Systems: Design and Implementation. Berlin, Heidelberg: Springer, 2014.

3. LINSTEDT, D.; OLSCHIMKE, M. Building a Scalable Data Warehouse with Data Vault 2.0. Switzerland, Europe: Morgan Kaufmann, 2016.

Consulta à base BiblioTec em 27/11/2019: todas bibliografias disponíveis.

Disciplina: Banco de Dados Espaciais (11) Carga Horária: 20 horas

Objetivo:

Interpretar fenômenos do mundo real como objetos a serem representados como tipos de dados espaciais e posteriormente serem manipulados de forma eficiente em banco de dados espaciais.

Aplicar conceitos fundamentais de banco de dados espaciais como suporte à análise espacial na ciência de dados.

Contrastar e comparar consultas espaciais utilizando diferentes operadores em cenários realistas. Construir soluções eficientes para manipular um volume massivo de dados espaciais.

Combinar banco de dados espaciais oriundos de diferentes fontes visando aplicá-los em outros ambientes para auxiliar a tomada de decisão.

Programa:

Definição de dados espaciais e sistemas de informação geográficas: abstrações, tipos de dados espaciais e o que eles representam no mundo real.

Importância da manipulação e análise espacial na ciência de dados.

Instalação e configuração de extensão espacial para um Sistema Gerenciador de Banco de Dados (SGBD).

Projeto e implementação de um banco de dados espacial utilizando um SGBD espacial. Representações de dados espaciais: formato textual, formato binário e tipos de arquivos.

(25)

Operações sobre dados espaciais: numéricas, geométricas de conjunto, relacionamentos topológicos, dependentes de tipo e operações diversas.

Consultas típicas em banco de dados espaciais.

Métodos de acesso espacial: conceitos, implementação e desempenho.

Aplicação de dados espaciais em ambientes para tomada de decisão: data warehouse espacial e consultas SOLAP.

Qualidade de dados espaciais: coleta de informações, conceitos iniciais de vagueza espacial e sua representação no mundo real.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. YEUNG, A. K. W.; HALL, G. B. Spatial Database Systems: Design, Implementation and Project Management. Netherlands: Springer, 2007.

2. VISWANATHAN, G.; SCHNEIDER, M. User-Centric Spatial Data Warehousing: A Survey of Requirements & Approaches. International Journal of Data Mining, Modelling and Management, v. 6, n. 4, p. 369-390, 2014.

3. ZURBARAN, M. et al. PostGIS Cookbook: Store, organize, manipulate, and analyze spatial data. Switzerland, Euope: Packt Publishing, 2018.

(26)

Disciplina: Introdução ao Reconhecimento de Padrões (12) Carga Horária: 20 horas

Objetivo:

Apresentar como o reconhecimento de padrões está associado à inteligência artificial e à ciência de dados.

Contrastar as diferentes formas de reconhecimento de padrões para a ciência de dados. Ilustrar e explorar os conceitos abordados com exemplos práticos e cenários realistas.

Experimentar a formalização de problemas visando resolvê-los utilizando técnicas de reconhecimento de padrão.

Criar soluções algorítmicas para problemas utilizando princípios da ciência de dados selecionando métodos para aprendizagem supervisionada e não supervisionada.

Programa:

Visão do reconhecimento de padrões e sua importância na ciência de dados.

Modelos e métodos para aprendizagem supervisionada: árvores de decisão, modelos lineares (regressão linear e logística), Knn e support vector machine (SVM).

Modelos e métodos para aprendizagem não supervisionada: K-means, DBScan, agrupamento hierárquico e PAM.

Implementação de soluções algorítmicas de reconhecimento de padrões utilizando Python e/ou R.

Visão geral de quais tipos de modelos e métodos de aprendizagem supervisionado e não supervisionado a serem aplicados para resolver problemas em ciência e dados.

Validação de modelo: holdout, cross-validation, problemas com overfitting e underfitting.

Matriz de confusão e medidas de desempenho: F-measure, acurácia, precisão e revocação, entre outras.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

Previsão de Trabalhos Discentes:

(27)

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. BISHOP, C. M. Pattern Recognition and Machine Learning (Information Science and Statistics). Singapore: Springer, 2006.

2. THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition. Academic Press, 2009. 3. HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning: Data

Mining, Inference, and Prediction. Springer, 2016.

4. JOSHI, P. Python Machine Learning Cookbook. Birmingham, UK: Packt Publishing, 2016.

5. RASCHKA, S.; MIRJALILI, V. Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow. UK: Packt Publishing, 2017.

Consulta à base BiblioTec em 27/11/2019: bibliografia 4 disponível.

Disciplina: Metodologia de Pesquisa Científica em Computação (13) Carga Horária: 20 horas

Objetivo:

Aplicar conhecimentos sobre os fundamentos do pensamento científico e as normas para a construção e o desenvolvimento de projetos, relatórios e trabalhos científicos.

Organizar o problema a ser resolvido no trabalho de conclusão de curso, oferecendo suporte nas tomadas de decisões de orientação, tema e técnicas de pesquisa a serem adotadas.

Planejar as primeiras etapas de escrita do trabalho de conclusão de curso.

Programa:

Conceitos fundamentais sobre a importância da pesquisa científica e sua aplicabilidade na resolução de problemas.

(28)

Tipos de revisões bibliográficas.

Natureza da pesquisa: quantitativa e qualitativa.

Tipos de pesquisas experimentais: survey, estudo de caso, experimento.

Processo de experimentação: definição, seleção amostral, o planejamento do experimento e execução. Análise e interpretação dos resultados e empacotamento dos resultados.

Interpretação de problemas da academia e indústria para resolução utilizando ciência de dados. O processo de seleção de temas para o trabalho de conclusão de curso - ciência de dados aplicado à: Inteligência de Negócio, Big Data e/ou dados não convencionais.

O processo de seleção de orientador.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. WAINER, J. Métodos de pesquisa quantitativa e qualitativa para a ciência computação. In T. KOWALTOWSKI e K. BREITMAN (Org.), Atualização em Informática da Sociedade Brasileira de Computação, pp. 221-262, 2007. Disponível para download no endereço

http://www.ic.unicamp.br/~wainer/publications.html.

2. WOHLIN, C. et al. Experimentation in Software Engineering. Sweden, Europe: Springer, 2012. 3. WAZLAWICK, R. S. Metodologia de pesquisa para ciência da computação. Rio de Janeiro, RJ:

(29)

Consulta à base BiblioTec em 27/11/2019: bibliografias 2 e 3 disponíveis.

Disciplina: Tópicos Especiais em Ciência de Dados (14) Carga Horária: 20 horas

Objetivo:

Analisar e comparar novas tendências tecnológicas de dispositivos de armazenamento na manipulação de dados.

Aplicar a imprecisão de valores na ciência de dados por meio de sistemas nebulosos.

Construir aplicações emergentes em ciência de dados por meio da extensibilidade provida por um sistema gerenciador de banco de dados.

Modelar tipos abstratos de dados definidos pelo usuário tendo em vista solucionar problemas específicos na manipulação de dados.

Projetar soluções algorítmicas usando sistemas nebulosos e dados não convencionais.

Programa:

Importância de sistemas nebulosos, estudo de novas memórias e extensibilidade de banco de dados na ciência de dados.

Sistemas nebulosos: teoria de conjuntos fuzzy, operações sobre conjuntos fuzzy, lógica fuzzy, sistema de inferência fuzzy, métodos de fuzzificação e defuzzificação.

Conceitos fundamentais de algoritmos avançados para lógica fuzzy: classificação fuzzy, agrupamento fuzzy e a geração automática e adequação de regras.

Aplicação da teoria de conjuntos e lógica fuzzy em dados não convencionais: o estudo de dados espaciais fuzzy e a inferência espacial fuzzy.

Gerenciamento de dados em memórias emergentes (flash, ReRAM, STT-RAM, entre outras): características intrínsecas, aplicações, estudos experimentais e algoritmos e estruturas de dados. Banco de dados extensíveis: especificação de novos tipos abstratos de dados.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

(30)

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. WEST F. New Approaches in Fuzzy Logic. NY Research Press, 2015.

2. CHEN, F.; HOU, B.; LEE, R. Internal parallelism of flash memory-based solid-state drives. ACM Transactions on Storage, v. 12, n. 3, p. 13:1–13:39, 2016.

3. CARNIEL, A. C. Spatial Indexing on Flash-based Solid State Drives. Tese (Doutorado) — Universidade de São Paulo (USP), São Carlos, SP, Brasil, Junho 2018.

4. FEVGAS, A. et al. Indexing in flash storage devices: a survey on challenges, current approaches, and future trends. The VLDB Journal, pp 1–39. 2019.

5. ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. São Paulo, SP: Pearson Addison-Wesley, 2019.

Consulta à base BiblioTec em 27/11/2019: bibliografia 3 disponível.

Disciplina: Escrita de Artigo Científico (15) Carga Horária: 10 horas

Objetivo:

Demonstrar os aspectos acerca da problematização, contextualização e escopo de um artigo científico. Experimentar a resolução de problemas por meio da escrita de artigo científico.

Planejar a estrutura de um artigo, seguindo o tema de pesquisa escolhido, e então propor conteúdo para cada seção evidenciada.

Organizar a revisão da literatura e trabalhos correlatos acerca o tema de pesquisa escolhido, comparando a estrutura dos artigos levantados.

(31)

Programa:

Conceitos fundamentais sobre a organização e escrita de artigo científico. Estrutura de um artigo científico.

Tipos de artigos científicos: resumo, resumo expandido, artigo completo em conferência e artigo completo em periódico.

Classificação de eventos científicos e periódicos de acordo com o Qualis-CAPES, SNIP, JCR, entre outros.

Utilização de processadores e editores de texto na escrita de artigos (LaTeX e Word). Escrita de seções de um artigo: resumo, introdução, métodos e metodologia, resultados. Normas de escrita de artigos científicos em computação: IEEE, ACM, Springer, entre outros. Ética na escrita e publicação de artigos: participação de autores, plágio e autoplágio.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. SWALES, J. M.; FEAK, C. B. Academic writing for graduate students: essential tasks and skills: a course for nonnative speakers of English. University of Michigan Press, 2012.

2. WAZLAWICK, R. S. Metodologia de pesquisa para ciência da computação. Rio de Janeiro, RJ: Elsevier, 2014.

(32)

3. MEDEIROS, J. B.; TOMASI, C. Redação De Artigos Científicos. São Paulo, SP: Atlas, 2016.

Consulta à base BiblioTec em 27/11/2019: todas bibliografias disponíveis.

Disciplina: Métodos e Modelos Avançados em Ciência de Dados (16) Carga Horária: 30 horas

Objetivo:

Experimentar e comparar conceitos avançados de técnicas, ferramentas e algoritmos de aprendizado de máquina para ciência de dados.

Analisar a combinação de diferentes métodos e modelos como forma de enriquecimento da análise de dados.

Aplicar o fluxo de uma solução de ciência de dados para construir aplicações avançadas. Ilustrar e explorar os conceitos abordados com exemplos práticos e cenários realistas.

Programa:

Visão geral dos modelos e métodos avançados em ciência de dados. Redes Neurais Artificiais.

Modelos de Aprendizagem Profunda: Deep Learning e Rede neural convolucional. Técnicas baseadas em Comitês: bagging e boosting.

Florestas aleatórias (random forest). Inteligência de Enxame: PSO, ACO.

Fluxo de uma solução de ciência de dados em problemas reais.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

Previsão de Trabalhos Discentes:

(33)

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. BISHOP, C. M. Pattern Recognition and Machine Learning (Information Science and Statistics). Singapore: Springer, 2006.

2. HAYKIN, S. Neural networks and learning machines. Pearson Education, 2009.

3. FACELI, K. et al. Inteligência Artificial: uma Abordagem de Aprendizado de Máquina. Rio de Janeiro, RJ: LTC, 2011.

4. MARSLAND, S. Machine Learning: An algorithmic perspective. Switzerland, Europe: CRC Press, 2015.

5. JOSHI, P. Python Machine Learning Cookbook. Birmingham, UK: Packt Publishing, 2016. 6. GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A. Deep Learning, MIT Press, 2016.

7. RASCHKA, S.; MIRJALILI, V. Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow. Switzerland, Europe: Packt Publishing, 2017.

Consulta à base BiblioTec em 27/11/2019: bibliografias 4, 5, 6 e 7 disponíveis.

Disciplina: Trabalho de Conclusão de Curso (17) Carga Horária: 10 horas

Objetivo:

Desenvolver a capacidade de aplicação dos conceitos e teorias adquiridas durante o curso de forma integrada e transversal, resultando em um trabalho científico.

Organizar o fluxo de ideias para a elaboração e apresentação do trabalho de conclusão de curso.

(34)

de curso.

Programa:

Conceitos fundamentais sobre a organização e escrita de trabalho de conclusão de curso. Estrutura de uma monografia a nível de pós-graduação.

Utilização de processadores e editores de texto na escrita de monografia (LaTeX e Word).

Escrita de seções de uma monografia: resumo, introdução, revisão sistemática da literatura, métodos e metodologia, resultados e conclusões.

Ética na escrita de monografia.

Desenvolvimento do trabalho proposto.

Técnicas para apresentação e defesa de monografia perante uma banca examinadora. Normas da UTFPR para elaboração de trabalhos acadêmicos.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. ACEVEDO, C. R.; NOHARA, J. J. Como fazer monografias: TCC, dissertações, teses. São Paulo, SP: Atlas, 2013.

2. WAZLAWICK, R. S. Metodologia de pesquisa para ciência da computação. Rio de Janeiro, RJ: Elsevier, 2014.

(35)

3. MARCONI, M. A. Metodologia do trabalho científico. Rio de janeiro, RJ: Atlas, 2017.

Consulta à base BiblioTec em 27/11/2019: todas bibliografias disponíveis.

Disciplina: Resolução de Problemas com Ciência de Dados (18) Carga Horária: 20 horas

Objetivo:

Desenvolver a capacidade de planejamento e disciplina para resolver problemas dentro da ciência de dados.

Comparar métodos da ciência de dados para a resolução de problemas. Experimentar diferentes fatores de regularização e modelos.

Criar soluções algorítmicas para problemas complexos utilizando princípios da ciência de dados e selecionando métodos adequados.

Programa:

Utilização de métodos e modelos avançados na resolução de problemas: computação evolucionária (algoritmos genéticos e programação genética) e métodos Ensemble.

Seleção e ajuste de modelos.

Regularização e parametrização de modelos. Otimização de algoritmos para ciência de dados. Aprendizagem baseada em problemas.

Resolução de problemas da indústria e academia. Estudo de casos aplicados à ciência de dados.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

(36)

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. LUKE, S. Essentials of Metaheuristics. Slovenia, Europe: Lulu, 2015.

2. IDRIS, I. Python Data Analysis: Learn how to apply powerful data analysis techniques with popular open source Python modules. UK: Packt Publishing Ltd, 2014.

3. ALPAYDIN, E. Introduction to Machine Learning. MIT Press, 2014.

4. BOWLES, M. Machine Learning in Python: Essential Techniques for Predictive Analysis. Indianapolis, IN: John Wiley & Sons Inc, 2015.

5. JOSHI, P. Python Machine Learning Cookbook. Birmingham, UK: Packt Publishing, 2016.

6. RASCHKA, S.; MIRJALILI, V. Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow. UK: Packt Publishing, 2017.

Consulta à base BiblioTec em 27/11/2019: bibliografias 1, 5 e 6 disponíveis.

Disciplina: Processamento de Grandes Volumes de Dados (19) Carga Horária: 20 horas

Objetivo:

Relacionar o ecossistema da computação paralela e distribuída com o processamento massivo de grandes volumes de dados presente na ciência de dados.

Apresentar e discutir os modelos e linguagens de programação para o processamento massivo de grandes volumes de dados.

(37)

Criar soluções algorítmicas para problemas complexos utilizando sistemas paralelos e distribuídos. Classificar os conceitos acerca computação em nuvem.

Programa:

Principais elementos, ecossistema e a arquitetura de ambientes de computação paralela e distribuído. Paradigma de programação MapReduce na resolução de problemas com computação paralela e distribuídos.

Sistemas paralelos e distribuídos: Apache Hadoop e Apache Spark.

Linguagens de programação e de consultas para ambientes Hadoop e Spark (pySpark). Extensões do Apache Hadoop e Apache Spark.

Conceitos fundamentais sobre computação em nuvem: Software como Serviço (SaaS), Plataforma como um Serviço (PaaS) e Infraestrutura como Serviço (IaaS).

Ambientes de computação em nuvem: AWS, Azure, entre outros.

Metodologias de Ensino Aprendizagem:

Aula expositiva-dialogada. Aula expositiva. Resolução de exercícios. Estudo de casos. Trabalho individual. Trabalho em grupo. Debate/Discussão. Estudo dirigido. Resolução de problemas.

Previsão de Trabalhos Discentes:

Trabalho individual. Trabalho em grupo. Prova individual.

Forma de Avaliação:

A avaliação da disciplina é realizada por meio da combinação dos seguintes fatores a serem realizados no ambiente de aprendizagem: (i) verificação da participação em atividades programadas; (ii) aferição do desempenho em tarefas/trabalhos; e (iii) provas. As atividades programadas nas quais a participação é avaliada abrangem conferências web e fóruns de discussão. Ademais, haverá um projeto integrador, que avaliará transversalmente esta disciplina conjuntamente a outras com término em comum. O projeto integrador corresponderá a 40% da nota e será apresentado por meio de vídeo, com autenticação individual ao mostrar um documento de identificação oficial.

Bibliografia:

1. WHITE, T. Hadoop: The Definitive Guide, Storage and Analysis at Internet Scale. Switzerland, Europe: O'Reilly Media, 2015.

(38)

Paulo, SP: Casa do Código, 2016.

3. ÖZSU, M. T.; VALDURIEZ, P. Principles of Distributed Database Systems. France, Europe: HAL CCSD, Springer, 2019.

Consulta à base BiblioTec em 27/11/2019: todas bibliografias disponíveis.

Disciplina: Mineração de Dados para Inteligência de Negócio (20) Carga Horária: 20 horas

Objetivo:

Apresentar e discutir conceitos básicos de mineração de dados.

Analisar a exploração de grandes volumes de dados de ambientes de data warehousing por meio de processamento de séries temporais e de regras de associação.

Comparar técnicas de processamento de séries temporais. Aplicar conceitos e algoritmos de regras de associação.

Construir soluções utilizando os métodos apresentados em um sistema gerenciador de banco de dados.

Programa:

Conceitos de mineração de dados e seus diferentes pontos de vista: o ponto de vista de banco de dados, ponto de vista da inteligência artificial e o ponto de vista da estatística.

Importância de um ambiente de data warehousing na mineração de dados.

Utilização de workflows para ciência de dados usando um Sistema Gerenciador de Banco de Dados (SGBD) como base.

Importância de séries temporais e regras de associação em um ambiente de inteligência de negócio. Séries temporais: comparação de séries temporais (DTW, correlação cruzada), implementação, predição de valores numa série temporal (ARIMA), redução de dimensionalidade para séries temporais (piecewise aggregate approximation).

Detecção de anomalias.

Regras de associação: conceitos, medidas, algoritmo APRIORI, implementação em um SGBD.

Referências

Documentos relacionados

Para al´ em disso, quando se analisa a rentabilidade l´ıquida acumulada, ´ e preciso consid- erar adicionalmente o efeito das falˆ encias. Ou seja, quando o banco concede cr´ editos

Figure 6.4 shows the results of using different hash functions in the ISB scheme and the impact of the hash functions presented in Section 5.2.1 on the usage of local (on-chip)

After the eval- uation of the influence of each modification of the surfaces on the internal air temperatures and energy consumption of the compressor a final test was done with

Apesar de pesquisadores na França, na Inglaterra e no Brasil (e talvez em outros tantos lugares) terem identificado igualmente seus processos de fixação da imagem

Além da multiplicidade genotípica de Campylobacter spp., outro fator que pode desencadear resistência à desinfecção é a ineficiência dos processos de limpeza em si,

Serpentine, alstonine et sempervirine, medicaments inhibant specifiquement les cellules cancéreuses et tumorales.. The African species of Strychnos.Part.II .The

• The definition of the concept of the project’s area of indirect influence should consider the area affected by changes in economic, social and environmental dynamics induced

Na figura seguinte apresenta-se o aspecto de uma folha de cálculo com esta informação, mais texto adicional que apenas serve para nos ajudar a compreender o que está em cada sítio