• Nenhum resultado encontrado

A primeira análise apresentada foi com relação ao tamanho de janela. Constatou-se que o tamanho de janela de treinamento dos dados influencia diretamente no erro observado na previsão e, ao mesmo tempo, é sensível às oscilações embutidas no conjunto de dados. Para conjuntos como o abordado neste estudo, onde há uma tendência de queda ao longo do tempo, janelas menores se mostram mais interessantes. Porém, caso a demanda de passageiros não tivesse se alterado ao longo do tempo, este comportamento provavelmente se alteraria. Contudo, é normal que a demanda de passageiros se altere ao longo do tempo, acompanhando a tendência de aumento ou diminuição da utilização do transporte por parte da população. Com as análises propostas acerca deste tópico, a janela de tamanho 30 foi considerada a mais apropriada.

Após análise dos tamanhos de janela, o próximo ponto importante é o estudo das bases utilizadas em cada previsão. Ressalta-se, neste ponto, que a escolha dos objetos utilizados para a previsão tem essencial importância para sua assertividade. No Subconjunto 1 é utilizada a base completa, com fins de semana, feriados e período de recesso escolar. Porém, sabe-se que estes períodos são atípicos para a demanda de passageiros do transporte público. Sendo assim, foi proposta a análise da previsão gerada em 4 subconjuntos, partindo do menos para o mais restritivo, de modo a observar a necessidade de análises separadas para cada caso. Como no Subconjunto 4 os dados possuem maior constância, com oscilações menos representativas, este

consegue gerar menores erros de previsão. Sendo assim, para dias como fins de semana, feriados e períodos de recesso escolar, o mais adequado seria aplicar os métodos separadamente em bases que contenham apenas estes períodos e refazer os testes e análises, em busca de menores erros de previsão.

Além disso, para o Subconjunto 4 há uma significativa redução para a ociosidade do sistema. Considerando, por exemplo, a janela com tamanho 30, inicialmente a ociosidade era de 93, 30%, reduzindo para 1, 33%, já que o delta médio entre oferta e demanda, anteriormente, era de 5325, 09 passageiros por dia, passando a ser 75, 82. Com base nestes valores, a Árvore de Regressão foi o método que gerou menos ociosidade, enquanto a Regressão Linear se mostrou menos assertiva. Ainda assim, vale ressaltar que a diferença entre o melhor erro médio, observado na Árvore de Regressão, e o pior, observado na Regressão Linear, é de apenas 13, 95. Percebe-se, portanto, que o método pior avaliado ainda está bem próximo dos demais.

Por fim, tendo analisado o tamanho de janela e subconjunto mais adequado, resta analisar qual método se mostrou mais adequado. Com base nos resultados, percebe-se, para os dois parâmetros de comparação utilizados, que a Árvore de Regressão é o método mais indicado para a previsão. Neste quesito, vale mencionar que a sensibilidade de cada método à alterações de tamanhos de janela e do subconjunto utilizado, faz com que o método mais ou menos indicado para cada caso oscile. Por isso, o estudo foi feito a partir do tamanho de janela e subconjunto, até chegar ao método mais indicado.

Adicionalmente, apesar deste trabalho não ter utilizado como parâmetro o tempo de processamento de cada método, vale ressaltar que todos os métodos, exceto a Rede Neural Artificial, tiveram tempo de processamento na ordem de minutos, sendo passíveis de utilização prática no dia a dia. Já a RNA possui tempo de processamento na ordem de dias, não sendo tão interessante para este caso.

Sendo assim, a análise final dos resultados gerados foi sumarizada na Tabela 11.

Tabela 11 – Resultado final

Método Janela Minimum samples leaf Subconjunto RM SE R2

Árvore de Regressão 30 10 4 280, 48 0, 64

Fonte: Autora (2021)

A Figura 19 ilustra o comportamento da quantidade de passageiros medida versus a quantidade prevista para o melhor resultado apontado na Tabela 11.

Figura 19 – Medidos x Previstos

6 CONCLUSÕES

Um fator muito importante para a mobilidade urbana e o planejamento de transportes dos grandes centros é o equilíbrio entre oferta e demanda dos serviços de transporte público urbano. Além disso, para a empresa fornecedora do serviço, este equilíbrio é determinante para que o sistema não fique ocioso nem sobrecarregado, impactando diretamente na sua receita. Porém, prever o comportamento humano é um grande desafio para a área, visto que os métodos tradicionais de previsão de demanda envolvem fatores socioeconômicos da população e são voltados para o planejamento de médio a longo prazo. Por isso, ressaltou-se neste trabalho a oportunidade da utilização de métodos de Aprendizado de Máquina para previsão de demanda de passageiros, voltado ao transporte público urbano em uma linha de Joinville.

Neste sentido, este estudo propôs a comparação de cinco métodos de Aprendizado de Máquina, sendo eles: Regressão por Vizinho mais Próximo, Regressão Linear, Árvore de Regressão, Regressão por Vetores de Suporte e Rede Neural Artificial. Cada método foi calibrado em relação aos seus parâmetros e testado para diversos tamanhos de janela de treinamento, com objetivo de propor o melhor contexto para futuras previsões. Como destaque positivo nos resultados, aponta-se a Árvore de Regressão, que apresentou no geral as melhores previsões, associada à um baixo custo de treinamento. Dentre as janelas, destaca-se que, para dados com tendência de queda ou aumento da demanda, como é o caso abordado ao longo deste estudo, janelas não ancoradas e de menores tamanhos se mostraram mais adequadas, visto que não carregam nos dados de treinamento valores antigos (que não refletem mais a realidade observada), que podem levar a maiores erros na previsão.

Uma abordagem sugerida para trabalhos futuros seria comparar os resultados obtidos variando-se, além dos parâmetros abordados aqui, o tamanho do passo na aplicação dos modelos. Neste caso, o passo considerado foi sempre de tamanho igual a 7, porém pode-se testar, por exemplo, a aplicação diária da previsão para ver a assertividade ou, até mesmo, a aplicação mensal, reduzindo a frequência da atividade.

REFERÊNCIAS

ANTP.Sistema de Informação da Mobilidade Urbana : Relatório Geral 2016. São

Paulo, SP, 2018.

BARROS, A.; OLIVEIRA, B. de; BEDNARSKI, C. Como pandemia e tecnologia estão impulsionando a venda de carros. [S.l.], 2020.

BRACHMAN, R. J.; ANAND, T. The process of knowledge discovery in databases:: a first sketch. In:Workshop on Knowledge Discovery in Databases. Washington,

EUA: American Association for Artificial Intelligence, 1994.

CAMPOS, V. B. G. Planejamento de transportes: conceitos e modelos. Rio de

Janeiro: Interciência, 2013. 188 p.

CHOWDHURY, M.; APON, A.; DEY, K.Data Analytics for Intelligent Transportation Systems. Amsterdam, Netherlands: Elsevier, 2017.

COPPIN, B.Inteligência artificial. Rio de Janeiro: LTC, 2013. 636 p.

FACELI, K. et al.Inteligência artificial : uma abordagem de aprendizado de máquina.

Rio de Janeiro: LTC, 2015. 378 p.

FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. In:AI Magazine. Providence, EUA: American Association for

Artificial Intelligence, 1996. v. 17, n. 3.

FERRAZ, A. C. P.; TORREZ, I. G. E.Transporte público urbano. 2. ed. São Carlos:

Rima, 2004. 410 p.

FRAWLEY, W. J.; PIATETSKY-SHAPIRO, G.; MATHEUS, C. J. Knowledge discovery in databases: an overview. In:AI Magazine. California, EUA: American Association for

Artificial Intelligence, 1992. v. 13, n. 3.

GOLDSCHMIDT, R.; PASSOS, E.Data mining: um guia prático. Rio de Janeiro, RJ:

Elsevier Editora Ltda., 2005. 253 p.

HOEL, L. A.; GARBER, N. J.; SADEK, A. W. Engenharia de infraestrutura de transportes : uma integração multimodal. São Paulo: Cengage Learning, 2011. 598 p.

IBGE. [S.l.], 2020. Disponível em: <https://www.ibge.gov.br/cidades-e-estados/sc/ joinville.html>.

IPPUJ/IPC. Pesquisa Origem/Destino 2010. [S.l.], 2010. Disponível

em: <https://www.joinville.sc.gov.br/wp-content/uploads/2018/09/ Joinville-Cidade-em-Dados-2018-Mobilidade.pdf>.

KIRKPATRICK, C.; DAHLQUIST, J.Technical Analysis:: The Complete Resource for

Financial Market Technicians. [S.l.]: FT Press, 2006.

LIMA, G. C. L. S. et al.Transporte público e COVID-19:: O que pode ser feito? Rio

de Janeiro, 2020.

LOPES, C. A. Qualidade de vida no trabalho em atividades de serviços de transporte por aplicativos. Monografia (Administração) — Universidade Federal de

Ouro Preto, Mariana, MG, 2017.

MENEZES, G. M. C. HTILDE-RT: Um algoritmo de aprendizado de árvores de regressão de lógica de primeira ordem para fluxos de dados relacionais.

Dissertação (Mestrado) — Universidade Federal do Rio de Janeiro, 2011.

NTU. Brasília, DF, 2019. Disponível em: <www.ntu.org.br/novo/upload/Publicacao/ Pub637110488381579841.pdf>.

NTU. Anuário NTU: 2019 - 2020. Brasília, DF, 2020. Disponível em: <https:

//www.ntu.org.br/novo/upload/Publicacao/Pub637375719747836003.pdf>.

OPPENHEIM, N.Urban travel demand modeling. New York: John Wiley Sons, 1995.

480 p.

ORTEGA, Z.; ROCIO, L.Estimativa da radiação solar global pelos modelos de Hargreaves e aprendizado de máquina em 11 regiões de São Paulo /Brasil.

Dissertação (Mestrado) — Universidade Estadual Paulista, 2020.

ORTIZ, A. et al. Úberes e títeres: mentalidades, posições públicas e a crise dos taxistas na cidade do rio de janeiro. São Paulo, SP, 2016.

DIOS ORTUZAR, J. de; WILLUMSEN, L. G.Modelling transport. 4. ed. New Jersey:

John Wiley Sons, 2011. 607 p.

PEDREGOSA, F. et al. Scikit-learn: Machine learning in Python.Journal of Machine Learning Research, v. 12, p. 2825–2830, 2011.

PYTHON 3.9.4. [S.l.], 2021. Disponível em: <www.python.org>.

RODRIGUES, S. C. A.Modelo de Regressão Linear e suas Aplicações. Dissertação

(Mestrado) — Universidade da Beira Interior, Covilhã, Portugal, 2012.

RUAS, G. I. S. et al.Previsão de demanda de energia elétrica utilizando Redes Neurais Artificiais e Support Vector Regression. Curitiba, PR: [s.n.], 2004.

RUSSELL, S.; NORVIG, P.Inteligência artificial. 3. ed. Rio de Janeiro: Elsevier

Editora Ltda., 2013. 988 p.

SALANOVA, J. M. et al. A review of the modeling of taxi services. 2011.

SANTOS SENNA, L. A. dos. Economia e planejamento dos transportes. Rio de

SILVA, T. et al. Planejamento cirúrgico de estrabismo horizontal utilizando regressores de múltiplas saídas. In: Anais do XVII Workshop de Informática Médica. Porto

Alegre, RS: SBC, 2017. Disponível em: <https://sol.sbc.org.br/index.php/sbcas/article/ view/3714>.

TAN, P.-N.; STEINBACH, M.; KUMAR, V.Introduction to data mining. Boston, EUA:

Pearson Education, 2006. 769 p.

TIBURCIO, F. S. Uma aplicação de redes neurais artificiais para previsão da demanda de passageiros no transporte público da cidade de Joinville.

Monografia (Engenharia de Transportes e Logística) — UFSC, Joinville, SC, 2018. VAPNIK, V.The Nature of Statistical Learning Theory. Berlin: Springer, 1995.

VASCONCELOS, L. P. et al. Uma comparação de técnicas de regressão para a previsão de consumo de energia residencial no cenário nacional. Blumenau, SC, 2017. VUCHIC, V. R.Urban Transit : operations, planning, and economics. New Jersey: John

Wiley Sons, 2005. 644 p.

WRI BRASIL. São Paulo, SP, 2020. Disponível em: <https://wribrasil.org.br/pt/tags/ grupo-de-benchmarking>.

Documentos relacionados