Inscrições Abertas
Início das Aulas: 24/03/2015
Dias e horários das aulas:
Terça-Feira 19h00 às 22h45 Semanal
Quinta-Feira 19h00 às 22h45 Semanal
Carga horária: 460 Horas
Duração: 18 meses
Este curso tem como objetivo principal analisar e extrair informações de dados não estruturados.
Apresentar as ferramentas de Análise de Big Data como um processo importante para manipulação de
dados e análise estatística de dados, em tempo real, para tomada de decisão e agregar valor no processo
de administração de empresas; Apresentar os aspectos fundamentais de programação para que o aluno
tenha capacidade de programar em ferramentas de Análise de Big Data.
Aulas expositivas, resolução de exercícios práticos, estudos de casos, laboratórios e debate com
especialistas em Big Data.
Metodologia
Profissionais das áreas de: computação, TI, analytics, estatísticos, analistas de mídia social, publicitários,
gestores de marketing e CRM, profissionais de e-commerce, profissionais do mercado que manipulam e
precisam tomar rápidas decisões por meio de grandes bases de dados.
Perfil do Aluno
Objetivo
*As informações podem sofrer alterações
Pós-Graduação "Lato Sensu"
Especialização em Análise de
Dados e Data Mining
Composto por professores altamente qualificados com experiência em estatística, computação, TI e
especialistas em análise de Big Data.
Disciplina 1 – Introdução ao Data Mining
• Noções de Macro economia e modelos econômicos:
A disciplina tem como objetivo fornecer o instrumental analítico necessário à compreensão dos fenômenos e variáveis macroeconômicas, como inflação, taxa de juros e taxa de câmbio. Princípios básicos de construção de modelos macroeconômicos.
• Noções de micro economia:
O objetivo da disciplina é prover ao aluno o instrumental básico de raciocínio econômico. O programa cobrirá os conceitos básicos de funcionamento de mercado, oferta e procura.
• Introdução à Macro e Micro Economia
• Conceitos básicos para análise de dados financeiros e de mercado
• Conceitos básicos de finanças:
Essa disciplina busca dar ao participante os principais conceitos de finanças e suas aplicações. Matemática financeira: Juros compostos, valor presente, valor futuro e taxa interna de retornos, fluxo de caixa, inflação, taxa de câmbio, impostos e ciclo de vida. Risco e Retorno: o modelo CAPM. Mercado de Capitais e Crédito. Derivativos. Mercados Futuros. Opções. Fundamentos e Aplicações de corporate e project finance.
• Conceitos Básicos de Marketing:
Essa disciplina busca dar noções sobre os conceitos básicos de Marketing tais como composto de Marketing, relacionamento com o cliente.
• Objetivos:
Entender as formas iniciais de análise exploratória dos dados. Tomar contato com os dados e entender o conjunto de dados obtidos, sua qualidade, seu poder explicativo. Estudar a qualidade dos dados e sua aplicabilidade em um processo de Data Mining. Serão discutidas as formas de exploração e reconhecimento dos dados extraídos, análise de formas de distribuição. • Conteúdo:
• Análise Exploratória de Dados
• Bancos de Dados e Tipos de Variáveis - Examinando os dados: - Dados Qualitativos - Dados Quantitativos • Medidas de posição • Medidas de Variabilidade • Sumarizando os dados: - Box-plot
- Identificação e tratamento de outliers - Dados faltantes
- Dados inconsistentes
- Distribuição de freqüência e histogramas
- Métodos de transformação dos dados e aplicação Objetivos:
Este módulo visa dar a base onde as técnicas de análise de dados e data mining são aplicados. Busca dar uma visão geral dos conceitos de Economia, Marketing, Finanças e Estatística Básica, onde o estudo e aplicação de modelos de análise quantitativa, análise multivariada e econométricos serão desenvolvidos.
Disciplina 2 – Fundamentos de Estatística
• Objetivos:
Identificação e obtenção dos dados a partir de bases de dados operacionais. Entender métodos de extração, seleção e validação de amostras.
• Conteúdo:
• Principais Distribuições Teóricas e Amostragem
• Principais Distribuições Discretas • Principais Distribuições Contínuas
• Tipos de amostragem e seleção de amostras • Casual simples
• Sistemática • Estratificada • Conglomerados
• PPS- Probability Proportional to Size • Objetivos:
Entender as formas iniciais de análise exploratória dos dados. Tomar contato com os dados e entender o conjunto de dados obtidos, sua qualidade, seu poder explicativo. Estudar a qualidade dos dados e sua aplicabilidade em um processo de Data Mining. Serão discutidas as formas de exploração e reconhecimento dos dados extraídos, análise de formas de distribuição. • Conteúdo: • Inferência Estatística • População e amostras • Distribuições Amostrais: - Estimação - Teste de Hipótese
- Teste de Hipótese não paramétrico
• Vantagens e desvantagens da amostra e do censo
Disciplina 3 – Estatística Aplicada I
• Modelos de Regressão Linear Simples e MúltiplaMódulo II - Técnicas Aplicadas a Data Mining
• Objetivos:
Determinar quando a análise de regressão é adequada, suas limitações. Saber interpretar os resultados da análise. Entender e aplicar a análise de regressão para estimações, previsões.
• Conteúdo:
• Testes estatísticos
• Previsão, estimação e explicação com regressão linear múltipla • Suposições da análise de regressão
• Interpretação dos resultados • Exercícios
• Análise de agrupamento
• Objetivos:
Entender o conceito de similaridade entre observações, entender como identificar grupos homogêneos de indivíduos, segmentos e perfis de grupos de indivíduos obtidos. Entender as diferentes técnicas de agrupamento.
• Conteúdo:
• Objetivos da análise de agrupamento • Técnicas de agrupamentos
• Identificação de grupos e escolha do número de grupos • Interpretação dos grupos e perfis que os compõem
• Técnicas de Classificação
• Objetivos:
Determinar quando a análise de discriminante ou a regressão logística são adequadas. Entender suas limitações. Saber interpretar os resultados da análise. Criar modelos discriminantes e avaliar sua capacidade discriminante, classificatória ou preditiva. Aprender a comparar e testar os modelos para escolha do melhor modelo.
• Conteúdo:
• Objetivos da regressão logística e análise discriminante • Suposições da análise discriminante
• Identificação e discriminação e classificação de grupos • Estimação e previsão através de regressão logística • Interpretação dos resultados
• Comparação e testes dos modelos de regressão e análise discriminante para escolha do melhor modelo
Disciplina 4 – Estatística Aplicada II
• Objetivos:
Apresentar como a árvore de decisão pode ser utilizada para classificação • Conteúdo:
• Árvore de Decisão
• Principais Distribuições Discretas • Principais Distribuições Contínuas
• Tipos de amostragem e seleção de amostras • Casual simples
• Sistemática • Estratificada • Conglomerados
• PPS- Probability Proportional to Size
• Objetivos:
Entender as formas iniciais de análise exploratória dos dados. Tomar contato com os dados e entender o conjunto de dados obtidos, sua qualidade, seu poder explicativo. Estudar a qualidade dos dados e sua aplicabilidade em um processo de Data Mining. Serão discutidas as formas de exploração e reconhecimento dos dados extraídos, análise de formas de distribuição. • Conteúdo: • Séries Temporais • População e amostras • Distribuições Amostrais: - Estimação - Teste de Hipótese
- Teste de Hipótese não paramétrico
Disciplina 5 – Tópicos Especiais de Data Mining I
• Objetivos:
Discutir sobre técnicas e ferramentas de tecnologia de informação para criação, acesso e preparo dos dados para data mining. São explorados conceitos de modelagem de bancos de dados, de acesso a dados.
• Conteúdo:
• Acesso e Modelagem de dados para negócios
• Conceitos de Business Intelligence
- Apresentação dos conceitos e objetivos da Business Intelligence
- Datawarehouses, datamarts e infra-estrutura para inteligência de negócios
- Fases de um projeto de modelagem de negócios; organização e papeis em um projeto; erros a evitar • Requisitos de Informação
- Determinação dos requisitos de informação - Apresentação de caso para trabalho em grupo
- Trabalho em grupo para determinação de requisitos de informação • Modelagem Dimensional
- Modelagem dimensional
- Estrutura dos modelos para inteligência de negócios - Particularidades da modelagem dimensional • Alimentação e exploração de dados:
- Mercado de softwares para BI - Apresentação de caso prático
• Objetivos:
Este módulo tem como objetivo, mostrar ao participante uma visão geral dos conceitos e objetivos das técnicas de Data Mining • Conteúdo:
• O que é Data Mining
• Data Mining e Tecnologia de Informática • Data Mining e Estatística
• O Processo de Data Mining • Softwares para Data Mining • Objetivos:
Apresentar as ferramentas atuais de data mining e explorá-las a partir de informações relativas a aspectos econômicos, financeiros e de mercado. São utilizadas uma ou mais das ferramentas de data mining. Discutir casos aplicados em empresas de diversos setores.
• Análise de Dados com as Ferramentas e Técnicas de Data Mining
• Introdução ao Data Mining
• Objetivos:
Apresentar as principais ferramentas e produtos de Data Mining existentes no mercado. • Conteúdo:
• O que é Data Mining • Noções de Clementine • Noções de Entreprise Miner • Outros pacotes de Data Mining
• Ferramentas de data mining
Disciplina 6 – Tópicos Especiais de Data Mining II
• Objetivos:
A técnica de algoritmos genéticos tem sido usados de maneira integrada às redes neurais tanto para a geração de novas entradas de dados quanto para a geração de novas redes. Esta disciplina propõe apresentar esta técnica e discutir exemplos de aplicação.
• Algoritmos genéticos
• Conceito de Algoritmos genéticos • Conceito de mutação genética
• Aplicação de algoritmos genéticos em Data Mining
• O que são redes neurais e quais aplicações • Arquiteturas de redes neurais
• Modelos multicamadas
• Construção de aplicações com redes neurais • Objetivos:
As redes neurais são uma poderosa técnica de estruturação de conhecimento a partir de dados. Esta disciplina tem por objetivo expor os principais modelos de redes neurais e suas aplicações em gestão. Pretende explorar modelos de classificação e de previsão tanto em aplicações financeiras como de marketing.
• Conteúdo:
• Redes Neurais
• Objetivos da análise • Métodos de detecção • Identificação de grupos
• Softwares de detecção automática • Exercícios de aplicação
• Objetivos:
Mostrar de que maneira podem ser utilizados os métodos de detecção automática de clusters para identificação de grupos homogêneos de indivíduos.
• Conteúdo:
• Identificação automática de conglomerados (automatic cluster detection) • Métodos analíticos para análise de dados
• Objetivos:
Uma das aplicações críticas de data mining na área financeira é o apoio à gestão de risco de crédito. Esta disciplina visa discutir a análise de dados e a construção de modelos de avaliação de risco de crédito através das técnicas mais adequadas a esta aplicação (regressão logística, redes neurais e árvore de decisão)
• Credit Scoring
• Objetivos da Análise • Descrição dos dados • Explorando os dados • Construção de Modelos:
- Modelos de Regressão Logística - Modelos de Arvores de Decisão - Modelos de Redes Neurais • Comparação de Modelos • Relatórios de Sumarização
O curso possui uma carga horária de 460 horas. Sendo 360 horas de aula e 100 horas para elaboração
individual de TCC (trabalho de conclusão de curso).
O curso terá carga horária semanal de 8 horas, ministradas à noite as terças e quintas.
Horário das aulas: 19:00 horas às 23:00 horas.
Localização: FIA – Unidade Vila Olímpia – Rua do Rocio, 109
Carga Horária e Localização
Destina-se a profissionais das áreas de administração, economia, engenharia, medicina, direito,
tecnologia da informação que buscam desenvolver suas competências no processo de análise quantitativa
de dados bem como conduzir a implantação desta atividade na empresa.
Público Alvo
A Faculdade FIA de Administração e Negócios – mantida pela Fundação Instituto de Administração,
responsável pelo Certificado expedirá o Certificado a que farão jus os alunos que obtiverem presença
mínima de 75% da carga horária total do curso, e simultaneamente frequência mínima de 50% das aulas
ministradas por disciplina, e nota igual ou superior a 7 nas disciplinas, bem como no trabalho de
conclusão do curso.
Certificação
• Objetivos:
Apresentar de que maneira a técnica de análise de cestos de compras permite identificar grupos de itens de venda que tendem a ocorrerem em uma mesma transação de compra. Discutir a construção dos modelos.
• Link Analysis
• Objetivos da análise • Descrição dos dados
• Análise exploratória de dados • Construindo modelos:
- Modelos loglineares - Regras de Associação
• Objetivos:
Apresentar o uso de árvore de decisão em problemas de gestão, as técnicas e aplicações de árvore de decisão mais utilizadas. • Conteúdo:
• Arvore de Decisão
• Estudos de Caso
• Aplicações de árvore de decisão
• Modelos de árvore de decisão (CART, CHAID, outras variações) • Softwares de árvore de regressão