Al´em das informac¸˜oes disponibilizadas visualmente pela matriz origem-destino, muitas outras funcionalidades podem ser oferecidas atrav´es da an´alise da pr´opria matriz e/ou dos dados de base disponibilizados.
Atrav´es da an´alise direta do grafo da Figura 32, foram identificadas as 50 maiores ligac¸˜oes entre as regi˜oes da cidade sem cobertura direta por alguma linha existente. Dentre estas 50 maiores, aquela que possui maior afluˆencia de usu´arios ´e a ligac¸˜ao entre a Prac¸a Tiradentes (no centro de Curitiba) com o Terminal S´ıtio Cercado (no sul da cidade), ver Figura 33-a. De fato, a titulo de exemplo, buscando no Google Maps as alternativas que interconectem estes dois pontos por meio de transporte coletivo, n˜ao existe nenhuma opc¸˜ao direta, conforme mostrado na Figura 33-b.
Figura 32: As cinquenta maiores ligac¸˜oes origem-destino observadas sem cobertura direta por alguma linha j´a existente.
(a) (b)
Figura 33: (a) Ligac¸˜ao entre Prac¸a Tiradentes (quadrado amarelo) e o Terminal S´ıtio Cercado (quadrado verde), um poss´ıvel eixo bastante utilizado pelos usu´arios sem cobertura direta por nenhuma linha atual; (b) Exemplo de resposta no Google Maps para um trajeto entre estes dois pontos utilizando transporte p ´ublico (nenhuma proposta direta de conex˜ao com uma linha direta ´e apresentada).
Al´em do mais, durante um semin´ario realizado nas instalac¸˜oes da URBS no final de maio de 2017, a URBS confirmou que exatamente esta ligac¸˜ao estaria sendo o foco de obras para melhoria de evoluc¸˜ao da rede. Logo, as conclus˜oes obtidas neste trabalho sugerem uma consonˆancia com os estudos internos da URBS.
De fato, as ligac¸˜oes mais utilizadas pelos usu´arios possuem alguma ligac¸˜ao direta entre elas atrav´es de linhas j´a existentes. Isto evidencia uma boa cobertura e organizac¸˜ao da rede atual de ˆonibus da cidade comparada `a necessidade de mobilidade dos usu´arios. Novamente, vale ressaltar que possuir uma linha direta ligando dois pontos nem sempre ´e a melhor soluc¸˜ao do ponto de vista tempo ou distˆancia a ser percorrida. No entanto, n˜ao deixa de ser um ponto de alerta interessante para ser analisado com maior profundidade.
Al´em da constatac¸˜ao sobre a coerˆencia e cobertura da rede atual frente `a real demanda dos usu´arios, outro servic¸o conectado interessante seria a estimativa de ocupac¸˜ao dos ˆonibus, atrav´es da an´alise dos dados obtidos com a construc¸˜ao da matriz origem-destino.
A Figura 34 mostra o exemplo desta proposta obtido atrav´es da an´alise da linha 461. Esta linha (Santa B´arbara-Prac¸a Rui Barbosa) foi escolhida por se tratar de uma linha coberta sempre pelo mesmo tipo de veiculo (micro-ˆonibus convencional) e cujo modo de pagamento
´e unicamente atrav´es do cart˜ao de transporte. Logo, pode-se extrapolar a quantidade de passageiros total no ˆonibus por simples proporcionalidade considerando a porcentagem de cart˜oes utilizada na an´alise (cart˜oes utilizados apenas uma ou duas vezes ao dia, conforme apresentado na Figura 23).
Os tipos de ˆonibus e suas respectivas capacidades podem ser encontradas no Anexo L. Observa-se que o micro-ˆonibus convencional possui capacidade para 40 passageiros. Logo, pela an´alise da Figura 34, verifica-se que em alguns momentos do dia a quantidade m´edia de passageiros embarcando na linha supera este limite.
A granularidade da an´alise apresentada aqui ´e ao n´ıvel de hora. Ela representa a m´edia de embarques e desembarques durante o per´ıodo deste estudo. Logo, apesar de dar bons ind´ıcios sobre o grau de ocupac¸˜ao dos ˆonibus, n˜ao ´e poss´ıvel saber precisamente se dentro do per´ıodo de uma determinada hora o ˆonibus atingiu, de fato, a sua capacidade m´axima.
Para isto, seria preciso fazer uma an´alise por dia espec´ıfico, por minuto, por exemplo. A t´ıtulo de informac¸˜ao, a Tabela 10 apresenta um resumo estat´ıstico dos valores estimados e calculados referente `a permanˆencia m´edia dos usu´arios desta linha. Em m´edia os passageiros ficam em torno de quinze minutos dentro do ˆonibus (naturalmente, isso depende muito do hor´ario ao longo do dia).
Figura 34: Estimativa do grau de utilizac¸˜ao da linha 461, coberta unicamente por micro-ˆonibus com capacidade para 40 passageiros. M´edia das quantidades totais de subida (linha azul) e descida (linha vermelha) de passageiros na linha ao longo do dia.
Min. 1◦Quartil Mediana M´edia 3◦Quartil M´aximo 00:02:01 00:07:21 00:13:54 00:15:19 00:22:05 00:55:49 Tabela 10: Dispers˜ao do tempo m´edio de permanˆencia dos passageiros na linha 461.
Da mesma forma se pode identificar os hor´arios onde o ˆonibus estaria mais ou menos ocupado, tamb´em ´e poss´ıvel identificar, ainda usando o exemplo da linha 461, quais os pontos
de ˆonibus mais utilizados para embarque e desembarque. Conforme mostrado na Figura 35, utilizando a mesma estrat´egia de visualizac¸˜ao apresentada na Sec¸˜ao 4.5, pode-se produzir mapas de calor indicando visualmente os pontos de maior afluˆencia de pessoas nesta linha.
(b)
(a)
Figura 35: (a) Regi˜oes com maior densidade de passageiros desembarcando na linha 461; (b) Regi˜oes com maior densidade de passageiros embarcando na linha 461.
ˆonibus, trˆes diferentes servic¸os conectados podem ser vislumbrados: cerca eletrˆonica, alerta de velocidade e de manutenc¸˜ao preventiva.
O servic¸o de cerca eletrˆonica ´e mostrado aqui atrav´es do exemplo do ve´ıculo DC852. Durante os dias observados, este ve´ıculo realizou as seguintes linhas: Z03, 464, 467, 489, 308 e 461. O trajeto oficial destas linhas esta detalhado na Figura 36-a.
De maneira simples, todos os momentos onde este ve´ıculo emitiu posic¸˜oes GPS fora de alguns destes trac¸ados, um alerta poderia ser levantado. No entanto, em algumas situac¸˜oes, o ve´ıculo estava voltando para a garagem, ap´os o final do per´ıodo de cobertura da linha. Nestes casos, o ˆonibus deve emitir como informac¸˜ao de linha a sigla “REC”. A Figura 36-b mostra todos os pontos emitidos por este ve´ıculo com a sigla “REC” como sendo a linha em execuc¸˜ao. Portanto, tais pontos seriam teoricamente sem problemas e n˜ao deveriam levantar nenhum alerta por n˜ao se sobreporem a nenhum dos trajetos das linhas previstas.
No entanto, todos os pontos apresentados em 36-c mereceriam alguma atenc¸˜ao pois o ˆonibus estava configurado para realizar uma das linhas citadas anteriormente. As causas podem ser diversas: o motorista n˜ao alterou o c´odigo da linha ou o sistema pode estar apresentando algum erro, por exemplo. De qualquer forma, este fato deveria emitir algum alerta ao gestor da frota em quest˜ao (ou a pr´opria URBS) para que as medidas cab´ıveis pudessem ser tomadas.
Idealmente este servic¸o deveria ser oferecido em tempo-real. Isto ´e absolutamente fact´ıvel haja visto que as informac¸˜oes de posicionamento s˜ao disponibilizadas a cada dois minutos. O prop´osito aqui ´e principalmente mostrar a capacidade e simplicidade em prover um servic¸o conectado de alto valor agregado para a gest˜ao da atividade da frota de ˆonibus, atrav´es da utilizac¸˜ao de dados j´a disponibilizados pela URBS.
O alerta de velocidade tamb´em pode ser proposto apenas com base nas informac¸˜oes de GPS j´a dispon´ıveis. A Figura 37 apresenta os valores calculados para o ve´ıculo DC852 ao longo dos dias observados. A ideia aqui tamb´em seria alertar em tempo-real algum eventual excesso de velocidade desenvolvido por algum ˆonibus.
De maneira geral, observa-se que os valores de velocidade medidos est˜ao majoritariamente abaixo dos 80 km/h. No entanto, encontram-se alguns picos acima dos 120 km/h, por exemplo.
Ali´as, um outro ponto merece uma certa atenc¸˜ao no que diz respeito a altos valores de velocidade. Conforme a Tabela 11, analisando as velocidades de todos os ve´ıculos na rede observa-se alguns valores aberrantes. Apesar de representarem apenas 0,3% do total dos valores calculados (com velocidade acima de 150 km/h), um ponto importante foi novamente
evidenciado: a confiabilidade das informac¸˜oes de GPS disponibilizadas.
Na verdade, estes valores exorbitantes de velocidade (chegando a um m´aximo de 25.000 km/h) devem-se a um erro na identificac¸˜ao do momento de envio das mensagens GPS. Em algumas poucas situac¸˜oes, duas posic¸˜oes GPS a princ´ıpio coerentes s˜ao enviadas. Por´em, o hor´ario contido neste envio diferencia de alguns poucos segundos apenas (enquanto na realidade deveria ser de cerca de dois minutos). Como o c´alculo da velocidade ´e realizado a partir deste valor da etiqueta temporal da mensagem, obt´em-se uma distˆancia na casa de algumas centenas de metros percorrida em poucos segundos, resultando em valores gigantescos de velocidade. Novamente, tais aberrac¸˜oes s˜ao bastante raras, n˜ao invalidando de forma alguma o conceito proposto.
Provavelmente, em um futuro pr´oximo, os ˆonibus ser˜ao capazes de emitir a informac¸˜ao de velocidade (a mesma que ´e apresentada no veloc´ımetro do ve´ıculo). Desta forma ser´a poss´ıvel aumentar a robustez deste tipo de servic¸o conectado.
Al´em disso, como exemplo de melhoria neste servic¸o de alerta de velocidade, seria poss´ıvel comparar a velocidade desenvolvida pelo ˆonibus com a velocidade autorizada na pista onde ele trafega emitindo, eventualmente, um alerta em caso de excesso de velocidade.
Min. 1◦Quartil Mediana M´edia 3◦Quartil M´aximo
0,00 0,00 0,09 9,77 13,39 25050,00
Tabela 11: Resumo geral das velocidades (em km/h) calculadas para todos os ve´ıculos durante o per´ıodo observado. Valores de m´aximo exorbitantes devem-se a algumas poucas incoerˆencias nas etiquetas de “hora:minuto:segundo” das mensagens GPS emitidas.
Tamb´em ´e poss´ıvel explorar a quest˜ao das velocidades m´edias das linhas de maneira geral. A Figura 38 apresenta uma comparac¸˜ao das velocidades m´edias de algumas linhas de diferentes tipos ao longo das horas do dia (independentemente dos locais por onde tais linhas passam). Como era de se esperar, pelo pr´oprio perfil da linha, o Ligeir˜ao tem uma m´edia de velocidade maior do que as outras linhas.
Em paralelo, a Figura 39 apresenta um exemplo de duas linhas comparando a velocidade m´edia em cada trecho da linha ao longo de um dia completo.
Naturalmente, ambos os efeitos poderiam ser combinados conforme a necessidade. Por exemplo, pode haver interesse em conhecer a evoluc¸˜ao da velocidade m´edia em um trecho de uma certa linha nos per´ıodos que antecedem a hora do rush, por exemplo.
Por fim, o ´ultimo servic¸o proposto refere-se ao c´alculo da quilometragem total percorrida por cada ve´ıculo na rede. A Figura 40 mostra os dez ve´ıculos que teriam mais
rodado, segundo os resultados desta an´alise. A soma de todos os ve´ıculos chega-se a cerca de 280 mil km por dia ´util. Este valor ´e muito pr´oximo do valor oficial divulgado pela URBS de 320 mil km por dia ´util3.
Vale ressaltar que existe um erro intr´ınseco ao modo de c´alculo da distˆancia entre duas informac¸˜oes GPS. Isto se deve ao fato de que as distˆancias entre dois pontos ´e calculada em linha reta, o que nem sempre est´a correto. No entanto, o custo computacional e a complexidade necess´arios para corrigir este fato n˜ao se justifica perante o que se pretende demonstrar.
Os dez ve´ıculos apresentados na Figura 40 realizaram 16 linhas distintas durante o per´ıodo observado. Somando a quilometragem total realizada por todos os ve´ıculos nos 8 dias de semana observados chega-se a um total de mais de dois milh˜oes de quilˆometros rodados.
O foco principal deste servic¸o seria indicar automaticamente ao gestor da frota o momento de encaminhar alguns ve´ıculos para manutenc¸˜ao com base somente na quilometragem rodada. No entanto, o servic¸o poderia ser muito mais rico se considerasse tamb´em informac¸˜oes como relevo, regi˜oes, tipos de vias utilizadas pelo ˆonibus (informac¸˜oes diretamente relacionadas `as linhas realizadas). Bem como informac¸˜oes mais detalhadas sobre panes el´etricas, carga total, n´ıvel dos pneus etc. No futuro pr´oximo vislumbra-se que os ˆonibus certamente ser˜ao capazes de fornecer tais informac¸˜oes, ampliando a gama e a eficiˆencia dos servic¸os conectados poss´ıveis.
(c)
(b)
(a)
Figura 36: Exemplo de servic¸o de cerca eletrˆonica utilizando o caso do ve´ıculo DC852: (a) Trajeto das linhas realizadas por este ve´ıculo nos dias observados; (b) Posic¸˜oes emitidas pelo ve´ıculo quando este estava voltando para a garagem (c´odigo da linha era “REC”); (c) Pode-se notar casos fora do trajeto esperado onde o ˆonibus supostamente deveria estar realizando alguma linha espec´ıfica (n˜ao estaria voltando pra garagem).
Figura 37: Velocidades observadas/calculadas para o ve´ıculo DC852 durante os dias considerados (majoritariamente abaixo dos 80 km/h).
Figura 38: Velocidade m´edia (em km/h) calculada agregando dados de todos os dias observados. Aqui s˜ao comparadas diferentes linhas de diferentes tipos: Convencional (linha 461), Interbairros (linha 40), Expresso (linha 203), Ligeirinho (linha 256), Alimentador (linha 225), Troncal (linha 372) e Ligeir˜ao (linha 550). Consiste na velocidade m´edia calculada para toda a linha por hora, independente da posic¸˜ao geogr´afica de cada ˆonibus da linha naquela hora.
(a) (b)
Figura 39: Velocidade m´edia (em km/h) calculada durante todos os dias observados, para cada trecho da linha (agregando todas as horas do dia). (a) Linha 040: Interbairros IV; (b) Linha 550: Ligeir˜ao - Pinheirinho / C. Gomes.
5 CONCLUS ˜OES
Atrav´es da an´alise dos dados disponibilizados livremente pela cidade foi poss´ıvel obter resultados relevantes e de grande valor agregado sobre a forma como o sistema de transporte ´e utilizado pela populac¸˜ao de Curitiba. Al´em de evidenciar e propor `a URBS alguns indicadores mais voltados `a utilizac¸˜ao dos ve´ıculos na rede e novos servic¸os telem´aticos a todos os envolvidos na utilizac¸˜ao, gest˜ao e evoluc¸˜ao do sistema de transporte p´ublico.
Para mostrar o potencial oriundo da explorac¸˜ao dos dados abertos da cidade, foram propostos cinco servic¸os telem´aticos oferecendo: uma forma objetiva de avaliar as linhas existentes frente `a real necessidade em mobilidade da populac¸˜ao; uma forma indireta de estimar o n´ıvel de utilizac¸˜ao dos ˆonibus e dos pontos de ˆonibus; o servic¸o de cerca eletrˆonica utilizando os itiner´arios das linhas como limites geogr´aficos para o servic¸o; alertas de velocidade instantˆanea e velocidade m´edia dos ve´ıculos e linhas; lembrete de manutenc¸˜ao dos ˆonibus a partir da quilometragem total percorrida por cada um.
Al´em disso, a fim de obter todos os subs´ıdios para os servic¸os acima mencionados , uma matriz de origem-destino foi produzida a partir dos dados de bilhetagem autom´atica (cart˜oes de transporte) e das coordenadas GPS de cada ˆonibus. Espera-se que este trabalho auxilie as autoridades e respons´aveis a melhor compreenderem o comportamento dos usu´arios com respeito a suas origens e destinos. Tudo isso com custos bastante reduzidos (em dinheiro e em tempo) comparado a sondagens manuais usualmente aplicadas. Algumas alternativas de visualizac¸˜ao dos dados tamb´em foram brevemente apresentadas.
Foi necess´ario um ´arduo trabalho de compreens˜ao e limpeza dos dados at´e que estes estivessem realmente prontos para utilizac¸˜ao. A falta de elementos essenciais tais como: descric¸˜ao de cada um dos atributos das bases disponibilizadas; utilizac¸˜ao de um mesmo campo para informac¸˜oes diferentes (no caso do COD URBS para tubos e terminais); informac¸˜oes conflitantes entre os diversos web-services; oscilac¸˜ao na presenc¸a de informac¸˜oes GPS para todos os ve´ıculos; ausˆencia de informac¸˜oes como sentido ou ID de cada viagem entre outros, tornou esta etapa crucial ainda mais cr´ıtica.
Ainda assim, grac¸as ao suporte e disponibilidade de todos os interlocutores, tais obst´aculos puderam ser superadas e por diversas vezes compartilhados em eventos dedicados a este fim unindo a UTFPR e a URBS.
A maneira como a metodologia foi implementada, principalmente no que tange as operac¸˜oes em SQL, podem certamente ser melhoradas. Por diversas vezes, o modo escolhido faz uso de operac¸˜oes bastante custosas computacionalmente (como cross join), levando bastante tempo para serem finalizadas. Este fato, unido a uma s´erie de intervenc¸˜oes manuais e de troca de ambientes e linguagens (SQL, Python e R) dificulta uma eventual automatizac¸˜ao do processo como um todo.
Independentemente disto, espera-se ter mostrado com bastante clareza o potencial que os dados abertos do transporte p´ublico de Curitiba possuem. Unir estes dados e conclus˜oes a outras bases (j´a dispon´ıveis ou n˜ao) da cidade poderiam certamente conduzir a um melhor entendimento sobre o funcionamento da mesma.