• Nenhum resultado encontrado

Composição probabilística de tempos de deslocamento em rota de transporte público urbano

N/A
N/A
Protected

Academic year: 2021

Share "Composição probabilística de tempos de deslocamento em rota de transporte público urbano"

Copied!
68
0
0

Texto

(1)

1

UNIVERSIDADE FEDERAL FLUMINENSE – UFF

ESCOLA DE ENGENHARIA

DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO

COMPOSIÇÃO PROBABILÍSTICA DE TEMPOS DE DESLOCAMENTO EM ROTA DE TRANSPORTE PÚBLICO URBANO

PEDRO DE OLIVEIRA MIGNOT DE CARVALHO

ORIENTADOR DO TRABALHO Prof. Dr. JOSÉ KIMIO ANDO

NITERÓI JULHO / 2017

(2)

2

PEDRO DE OLIVEIRA MIGNOT DE CARVALHO

COMPOSIÇÃO PROBABILÍSTICA DE TEMPOS DE DESLOCAMENTO EM ROTA DE TRANSPORTE PÚBLICO URBANO

Projeto Final apresentado para o curso de Graduação em Engenharia de Produção da Universidade Federal Fluminense, como requisito parcial para obtenção do Grau de Engenheiro de Produção.

ORIENTADOR: Prof. Dr. JOSÉ KIMIO ANDO

Niterói 2017

(3)
(4)

4

PEDRO DE OLIVEIRA MIGNOT DE CARVALHO

COMPOSIÇÃO PROBABILÍSTICA DE TEMPOS DE DESLOCAMENTO EM ROTA DE TRANSPORTE PÚBLICO URBANO

Projeto Final apresentado para o curso de Graduação em Engenharia de Produção da Universidade Federal Fluminense, como requisito parcial para obtenção do Grau de Engenheiro de Produção.

Aprovado em 18 de Julho de 2017.

BANCA EXAMINADORA

_____________________________________________ Prof. Dr.José Kimio Ando (Orientador) – UFF

_____________________________________________ Prof. Dr. Artur Alves Pessoa – UFF

_____________________________________________ Prof.ª Dr.ª. Níssia Carvalho Rosa Bergiante – UFF

Niterói 2017

(5)

5

RESUMO

O presente estudo formula um modelo probabilístico para a determinação do tempo de viagem total de uma determinada rota na cidade de Niterói. Tais dados foram obtidos para catorze pontos consecutivos junto a uma empresa local prestadora desse serviço. O período dos dados coletados foi de quatro meses consecutivos ao longo dos dias úteis da semana. Inicialmente foram feitas análises preliminares de outliers para validar a qualidade dos dados obtidos. Então, foram feitos ajustes de funções de densidade de probabilidade pré-estabelecidas para cada par de pontos através da maximização da função de verossimilhança. Após isto, foi feita uma análise da qualidade dos ajustes através do teste de Cramer von Mises. Para as funções que melhor se ajustaram foi realizada a operação de convolução e encontrada uma função que representa o tempo total de viagem do caminho. Para a soma dos tempos foi feito o mesmo tratamento de dados, ajuste de função de densidade de probabilidade e validação do ajuste. Por fim, comparou-se a função obtida da convolução com a função de densidade de probabilidade resultante do ajuste à soma dos tempos. Esta comparação serviu para validar o modelo proposto.

Palavras-chave: função densidade de probabilidade, teste de Cramer von Mises, ajuste probabilístico, redes de transporte

(6)

6

ABSTRACT

A stochastic model was developed to define the total network time travel in a specified road traffic network of public transportation in the city of Niterói. The presented model was based only on density functions of a given data set. The data was obtained for fourteen consecutive bus stops from a local company of public transportation during four consecutive months (considering the workdays). Then a preliminary analysis was made to check the quality of the data set. After this first analysis, the pre-selected density distributions were fitted for each pair of bus stops. The adjust of density functions was executed by the maximum likelihood function. Once the adjusts were done, the Cramer von Mises test assured their quality and for those functions with the best fitting a convolution was generated. The result of this convolution represents the whole path. The same procedure was executed for the sum of the collected data, obtaining the density function which better fitted their sums. Finally, the convolution function was compared to the density function from the sum of the data set. It was then possible to validate the chosen model.

Keywords: probability density function, likelihood function, Cramer von Mises test, probabilistic fit, transport network

(7)

7 SUMÁRIO

1 Introdução... 10

1.1 O Problema ... 10

1.1.1 Formulação da Situação Problema ... 11

1.1.2 Questões e/ou Hipóteses ... 11

1.2 Objetivos ... 12 1.3 Organização do Estudo ... 12 2 Revisão da literatura ... 14 2.1 Grafos ... 14 2.1.1 Definição de um caminho ... 14 2.1.2 Classificações de grafos... 15 2.1.3 Tipos de grafos ... 16 2.2 Redes ... 17 2.2.1 Redes de transporte ... 17

2.3 Determinação dos tempos ... 18

2.4 Identificação de tempos outliers ... 18

2.5 Funções densidade de probabilidade ... 19

2.5.1 Distribuição de densidade Gama ... 19

2.5.2 Distribuição de densidade Lognormal ... 21

2.5.3 Distribuição de densidade Exponencial ... 22

2.5.4 Distribuição de densidade Weibull ... 23

2.6 Ajuste de dados pela função de verossimilhança ... 24

2.7 Soma de variáveis aleatórias ... 25

2.8 Convolução de funções ... 25

2.9 Ajuste da função densidade de probabilidade no R Open Source ... 26

2.9.1 Teste de hipótese e p-valor ... 27

(8)

8

3 Metodologia ... 30

3.1 Obtenção de Dados ... 30

3.2 Grafo das rotas de ônibus ... 30

3.3 Definição dos eventos limitantes à tecnologia ... 32

3.3.1 Desenvolvimento das premissas incorporadas ... 33

3.4 Tratamento dos dados e remoção dos outliers ... 33

3.5 Distribuições de probabilidade para cada par de pontos ... 34

3.6 Convolução das funções densidade de probabilidade ... 34

3.7 Função de densidade de probabilidade com base na soma dos tempos ... 35

3.8 Comparação entre o modelo proposto e a função densidade de probabilidade do tempo total de viagem ... 35

4 Aplicação da metodologia e seus resultados ... 36

4.1 Obtenção de dados ... 36

4.2 Grafos das rotas... 40

4.3 Tratamento dos dados e remoção de outliers ... 41

4.4 Distribuições de probabilidade de cada par de pontos ... 43

4.5 Convolução das funções densidade de probabilidade ... 51

4.6 Função de densidade de probabilidade com base na soma dos tempos ... 56

4.7 Comparação entre o modelo proposto e a função densidade de probabilidade do tempo total de viagem ... 58

5 Considerações finais ... 61

(9)

9 LISTA DE TABELAS

Tabela 1: p-valores para w² ... 28

Tabela 2: Ônibus 1 e 4 - Março e Abril ... 37

Tabela 3: Ônibus 1 e 4 - Maio e Junho ... 37

Tabela 4: Ônibus 2 e 5 - Março e Abril ... 38

Tabela 5: Ônibus 2 e 5 - Maio e Junho ... 38

Tabela 6: Ônibus 3 e 6 - Março e Abril ... 39

Tabela 7: Ônibus 3 e 6 - Maio e Junho ... 39

Tabela 8: Estatísticas para identificação de outliers – Origem até nó 7 ... 42

Tabela 9: Estatísticas para identificação de outliers – nó 7 até Destino ... 42

Tabela 10: Parâmetros das funções densidade - nós O até 7 ... 44

Tabela 11: Valores de ω² e p-valor para cada função e par de pontos – nós O-7 ... 46

Tabela 12: Valores de ω² e p-valor para cada função e par de pontos – nós 7-D ... 46

Tabela 13: Melhor função densidade ajustada para cada par de nós ... 47

Tabela 14: Parâmetros das convoluções das funções de densidade de probabilidade Gama ... 53

Tabela 15: Parâmetros das convoluções das funções de densidade de probabilidade Lognormal ... 53

Tabela 16: Parâmetros da Convolução 8 ... 54

Tabela 17: Parâmetros da convolução das funções Weibull e a resultante da Convolução 8 .. 55

Tabela 18: Estatísticas para identificação de outliers – tempo total... 56

(10)

10 LISTA DE FIGURAS

Figura 1: Exemplo de caminho ... 15

Figura 2: Função densidade Gama - 𝛼=4; 𝛽 =20 ... 21

Figura 3: Distribuição log-normal - 𝜇=2 e 𝜎= 0,2 ... 22

Figura 4: Função densidade de probabilidade exponencial - =0,5 ... 23

Figura 5: Função densidade de probabilidade Weibull - 𝛼=2 e 𝛽=0,33... 24

Figura 6: Representação de trechos distintos das linhas A e B no OpenStreetMap ... 31

Figura 7: Grafo de parte do caminho divergente entre linhas A e B ... 32

Figura 8: Itinerário da linha de ônibus A - Parte 1 ... 40

Figura 9: Itinerário da linha de ônibus A - Parte 2 ... 40

Figura 10: Itinerário da linha de ônibus B ... 41

Figura 11: Grafo simplificado do caminho analisado ... 41

Figura 12: Exemplo de ajuste de distribuições para par de nós O-1 ... 43

Figura 13: Exemplo de teste de Cramer von Mises para par de nós O-1 ... 45

Figura 14: Histograma e função densidade - nós O-1 – Lognormal (=1,15281; =0,14429) 47 Figura 15: Histograma e função densidade - nós 1-2 – Gama (=20,23342; 1/=4,18730) ... 47

Figura 16: Histograma e função densidade - nós 2-3 – Lognormal (=2,32691; =0,22806) 48 Figura 17: Histograma e função densidade - nós 3-4 – Weibull (=5,57712; 1/=3,29806) .. 48

Figura 18: Histograma e função densidade - nós 4-5 – Gama (=102,48506; 1/=49,57064) 48 Figura 19: Histograma e função densidade - nós 5-6 – Lognormal (=0,48831; =0,09461) 49 Figura 20: Histograma e função densidade - nós 6-7 – Lognormal (=1,17880; =0,09856) 49 Figura 21: Histograma e função densidade - nós 7-8 – Weibull (=5,55145; 1/=7,01678) .. 49

Figura 22: Histograma e função densidade - nós 8-9 – Gama (=129,88733; 1/=50,75691) 50 Figura 23: Histograma e função densidade - nós 9-10 – Gama (=82,52985; 1/=42,85676) 50 Figura 24: Histograma e função densidade - nós 10-11 – Gama (=181,01813; 1/=112,91509) ... 50

Figura 25: Histograma e função densidade - nós 11-12 – Weibull (=4,92650; 1/=3,55510) ... 51

Figura 26: Histograma e função densidade - nós 12-D – Weibull (5,54793;3,14058)... 51

Figura 27: Convolução dos pares de nós 1-2 e 4-5... 52

Figura 28: Função densidade de probabilidade - convolução do caminho total ... 55

(11)

11

Figura 30: Código em R do teste de Cramer von Mises para duas amostras e p-valor ... 59 Figura 31: Histograma e função ajustada (vermelho) da soma dos tempos e função convolução (azul) ... 60

(12)

10

1 INTRODUÇÃO

1.1 O Problema

A padronização no fluxo de redes urbanas de transporte pode ser vista como um resultado de dois mecanismos competitivos entre si: os usuários e a não utilização dos transportes. No caso do primeiro, existe a constante tentativa de fazer roteamentos de forma que minimize o tempo alocado e a taxa de não utilização dos transportes. Por outro lado, a não utilização destes transportes não está associada a um objetivo fixo, mas é dependente do quanto o sistema de transportes é utilizado (SHEFFI, 1985).

Sistemas de transporte público são serviços essenciais para a sociedade e cidades como um todo. Ao longo dos anos, o planejamento de transporte mudou seu foco da mobilidade de carros para outras formas de transporte que possam desempenhar esse papel de forma a promover um desenvolvimento sustentável e social. Essa mudança trouxe à tona um paradigma entre os operadores de transporte público: trabalhar em melhorias no serviço de transporte para que novos clientes e usuários sejam atraídos e os antigos sejam retidos. Tais melhorias são amplamente suportadas por diferentes escalas do governo ao redor do mundo (JABAREEN, 2006).

No passado recente brasileiro, os sistemas de transporte público têm ocupado lugar de destaque, na medida em que se tornaram o foco de debates acadêmicos e políticos. Tais debates tratam da recente piora na qualidade do serviço prestado pelas empresas. Esta piora deve-se às condições ruins de deslocamento aumento no tempo de deslocamento (PAULA e BARTELT, 2016).

Dessa forma, as agências de trânsito em conjunto com as empresas de transporte público têm o desafio de não só melhorar, mas prover um serviço de transporte público eficiente, produtivo e confiável. Além disso, é óbvio que ao promover um serviço com estas características, há um incremento da fidelidade (para os casos em que existem opções) ou aumento da satisfação dos usuários (VUCHIC, 2005).

Isso significa que tal situação não beneficiaria apenas as agências de transporte público, mas também os usuários, causando uma situação de ganho-ganho para as diferentes perspectivas (DIAB, BADAMI e EL-GENEIDY, 2005).

(13)

11 1.1.1 Formulação da Situação Problema

Uma análise dos tempos de redes de transporte é o foco do estudo apresentado. No caso de redes de transporte o tempo de deslocamento é um fator importante para o usuário. Incertezas são inevitáveis em muitos processos decisórios. Além disso, as fontes de variabilidade no tempo de deslocamento podem ser endógenas ou exógenas (CAMBRIDGE SYSTEMATICS, 2003). Os tempos de deslocamento entre dois pontos normalmente exibem distribuições assimétricas, com longas caudas probabilísticas e a possibilidade de não recorrência de tempos. Dito isso, as variabilidades no tempo de deslocamento podem ser entendidas como um risco que o passageiro decide correr ao escolher um determinado caminho ou linha de ônibus em detrimento de outra (ZHOU, 2008).

Assim, a necessidade de conhecer esse tempo de deslocamento e sua variabilidade é importante para o usuário. Porém, nem sempre é viável instalar um sistema de comunicação ao vivo com os passageiros para auxiliar suas tomadas de decisões, seja por questões de custos elevados ou ausência desse tipo de serviço. Nesse caso, um ponto que merece extremo destaque é a dificuldade na interpretação dos tempos obtidos em cada intervalo do dia pelas empresas de ônibus, seja através de fiscais (funcionários que ficam em pontos de ônibus regulando tempos de chegada e saída) ou softwares mais especializados com tecnologia GPS.

Para suprir tal necessidade, o presente estudo propõe que, a partir de medições prévias de tempos de deslocamento, seja possível construir uma representação do comportamento do tempo de viagem e suas variabilidades. Esse comportamento foi traduzido para funções densidade de probabilidade a partir de ajustes e testes estatísticos.

Algumas características das redes estudadas para a realização do trabalho em questão merecem destaque, sendo a primeira delas a limitação de ferramentas para medição dos tempos de deslocamento, a segunda é a indisponibilidade pública de dados sobre esses tempos e por último a assimetria dos dados obtidos.

1.1.2 Questões e/ou Hipóteses

Este estudo busca responder a duas questões principais considerando uma determinada rede de transporte da cidade de Niterói: (i) quanto tempo o passageiro deve dedicar para se locomover de um ponto da rede até outro e (ii) se é possível estabelecer um modelo matemático

(14)

12

que represente bem esse tempo de viagem, considerando amostras conhecidas dos tempos entre todos os pontos de ônibus consecutivos desta rede. Para solucionar o problema desenvolvido na metodologia, foi utilizado o R Open Source, em sua versão 3.3.1, gratuitamente disponibilizada.

1.2 Objetivos

O principal objetivo do trabalho é desenvolver um modelo probabilístico para representação do tempo de deslocamento entre os nós inicial e final de uma dada rede de transporte da cidade de Niterói. Para tanto, devem ser conhecidas as distribuições probabilísticas dos tempos entre cada par de pontos X e Y quaisquer pertencentes à rede analisada. Além disto, é mandatório que todos os pontos da rede estejam interligados. Tal objetivo facilita a organização de frotas e roteirização das linhas, já que promove a representação dos tempos de viagem baseada em medições previamente conhecidas.

1.3 Organização do Estudo

O primeiro capítulo é um capítulo introdutório com algumas considerações feitas sobre a elaboração do estudo e a comprovação de que o tema vem se tornando cada vez mais relevante. O segundo capítulo apresenta uma introdução teórica, identificando as técnicas matemáticas mais abordadas na literatura e as que são mais adequadas para modelos de rede de transporte público e cada um de seus componentes. A estruturação desse capítulo parte dos elementos mais simples a serem apresentados (grafos) até o teste de Cramer von Mises, principal ferramenta do estudo apresentado.

No terceiro capítulo, apresenta-se a metodologia utilizada, relativa à forma com que os tempos foram analisados e coletados, o desdobramento das premissas de medições de tempo implícitas no estudo e os fundamentos da análise dentro do software utilizado.

No capítulo quatro, é feita a aplicação da metodologia desenvolvida e apresenta-se com maior detalhamento a forma como os dados foram analisados dentro do ambiente de programação do R Open Source. Ainda neste capítulo, há um teste sobre a efetividade da metodologia empregada e posteriormente uma breve análise desse teste.

(15)

13

Por fim, é realizada a conclusão sobre o que foi apresentado e desenvolvido, bem como as possíveis aplicações futuras. Algumas propostas para estudos futuros que abordem este mesmo tema também são sugeridas.

(16)

14

2 REVISÃO DA LITERATURA

Neste tópico serão apresentados brevemente os conceitos de grafos, redes, redes de transportes, confiabilidade em redes centrada no tempo de deslocamento, variáveis aleatórias, funções densidade de probabilidade, soma de variáveis aleatórias e convolução de funções. É indicado, ainda, um modelo para determinação dos tempos de deslocamentos entre os pontos de ônibus.

Esses conceitos são essenciais para a posterior análise dos itinerários dos ônibus, uma vez que cada ponto de ônibus é representado por um nó e cada rua ou conjunto de ruas entre dois pontos é uma aresta. Dessa maneira, o conjunto de pontos de ônibus e ruas pertencentes ao itinerário de determinada linha de ônibus é um grafo propriamente dito.

2.1 Grafos

Um grafo G é um trio ordenado (V(G), A(G), (G)) de um conjunto não vazio de vértices (V(G)), um conjunto A(G) de arestas ou arcos (disjunto de V(G), isto é: V(G) ∩ A(G) = ∅) e uma função incidente (G) que associa cada aresta ou arco de G a um par não ordenado, porém não necessariamente disjunto de vértices de G. Além disto, os grafos são representados por figuras em que cada vértice é ligado a outro através de uma aresta (BONDY e MURTY, 1982).

2.1.1 Definição de um caminho

Um caminho é formado por um conjunto sequencial de arestas distintas A’(G) e vértices sequenciais também distintos V’(G), tal que V’(G)  V(G) e A’(G)  A(G) dado um grafo G((V(G), A(G), (G)). Um exemplo de caminho é mostrado na Figura 1 (A – C – D – E) (JURKIEWICZ, 2009):

(17)

15

Figura 1: Exemplo de caminho

2.1.2 Classificações de grafos

Cada grafo pode possuir classificações diferentes de acordo com seus elementos e como se relacionam: número e disposição de vértices e arestas e a função responsável por ligar cada par ordenado de vértices através de uma aresta (WILSON, 1996).

a) Multigrafos e grafos simples

Multigrafos são grafos nos quais verifica-se que pelo menos um dos vértices possui incidência de um laço ou quando algum par de arestas ligar o mesmo par de vértices, isto é, as arestas são paralelas. Quando nenhum desses casos ocorra, o grafo é dito simples.

b) Completos e nulos

Um grafo é considerado completo quando todos os seus pares de vértices são ligados por uma aresta, ou seja, o grau de cada vértice será o número de elementos do conjunto V(G) menos um (ele mesmo), dado um grafo G(V(G), A(G), (G)). Portanto, o grau deste grafo, caso completo, será 𝑣. (𝑣 − 1), em que 𝑣 é o número de vértices de V(G). Por outro lado, caso não existam arestas no grafo G(V(G), A(G), (G)) ou {A(G)} = 0 tal grafo é definido como nulo. Neste caso, o grau de cada vértice é 0 e grau do grafo G é nulo. A C D E B

(18)

16

c) Regulares

Um grafo G((V(G), A(G), (G)) é regular se, e somente se, todos os seus vértices têm o mesmo grau. O grau do grafo pode ser escrito como k-regular ou k{V(G)}, em que k é o grau de cada um de seus vértices.

2.1.3 Tipos de grafos

Grafos podem ser entendidos como a representação esquemática de uma determinada realidade, desta maneira quando retratam fluxos de transporte, por exemplo, é interessante e muitas vezes fundamental saber se uma rua leva de um ponto A até outro ponto B e vice-versa ou se é composta apenas por um sentido. A partir desta necessidade surge a conceituação de três tipos de grafos: dirigidos, não dirigidos e misto (WEST, 2001).

a) Grafos dirigidos

Este tipo de grafo pode ser formalmente definido a partir de um dado grafo G(V(G), A(G), (G)) como D(V(D), A(D), ’(D)) em que V(D)  V(G), A(D)  A(G) e ’(D) é a restrição que faz com que a função (G) seja direcionada em apenas um ou dois sentidos. Estes grafos também podem ser chamados de digrafos.

b) Grafos não dirigidos

Os grafos indiretos ou não dirigidos são definidos como qualquer grafo G(V(G), A(G), (G)) desde que não exista um subgrafo D(V(D), A(D), ’(D)) com uma função restritiva ’(D) para cada par de vértices de V(G). Em outras palavras, nenhuma das arestas possui sentido.

c) Grafos mistos

Esta tipologia de grafos ocorre quando existe, para um dado grafo G(V(G), A(G), (G)), um subgrafo D(V(D), A(D), ’(D)) cuja função não é, necessariamente, restritiva para todos os vértices pertencentes ao conjunto V(G). Desta forma, existe

(19)

17

pelo menos uma aresta dirigida e uma não dirigida (com sentido definido e sem sentido, respectivamente).

2.2 Redes

Uma rede é uma representação gráfica e simplificada de uma determinada realidade, de forma a estabelecer relações entre pontos distintos. Um exemplo claro de seu uso ocorre quando se vislumbra um fluxo produtivo cujo ponto fundamental de geração de custos são os transportes dos produtos de seus centros de distribuição até os pontos de vendas. Além disso, o conceito de rede como um digrafo simples junto com uma estrutura adicional pode ser usado para estudar qualquer tipo de transporte, dentre elas as redes de transporte urbano. Porém, é preciso fazer certa correspondência entre os elementos de um grafo e os elementos de uma rede. As arestas passam a ser chamadas de arcos, enquanto os vértices são denominados nós (BONDY e MURTY, 1982).

Desta maneira, a definição formal de rede é um digrafo D composto de dois conjuntos disjuntos e não vazios de vértices X e Y, uma função não negativa c (cujos valores são inteiros, chamada capacidade do arco) e um conjunto A de arcos (BONDY e MURTY, 1982).

2.2.1 Redes de transporte

Uma rede de transporte pode ser definida de acordo com algumas de suas características, sendo as duas últimas derivadas da primeira (ZHOU, 2008):

a) Tempos de viagem: o tempo entre a origem e o destino pode ser estocástico ou determinístico;

b) Preferência de escolha: a escolha pode ser feita levando-se em conta um determinado nível de atraso;

c) Nível de congestionamento: diretamente associado ao tempo de viagem, este fator é visto como uma função incremental do número de veículos e utilizadores da rede.

2.2.1.1 Redes de transporte com tempos probabilísticos

Dentro de uma rede de transporte, o tempo de viagem pode ser afetado por fatores endógenos ou exógenos. Os primeiros podem ser definidos como flutuações de acordo com a

(20)

18

demanda diária, enquanto o último está ligado a fatores como obras ao longo da rodovia ou condições adversas de direção (CAMBRIDGE SYSTEMATICS, 2003).

Desta forma, as variabilidades, tanto endógenas quanto exógenas, trazem um grau de incerteza para o passageiro na medida em que não se sabe ao certo o tempo de deslocamento entre dois pontos. Esta incerteza, então, é considerada como um risco quando se verifica que os passageiros estão interessados em não somente chegar o mais rápido possível em determinado local, mas também com um risco aceitável definido pelo próprio usuário (ABDEL-ATY, KITAMURA, et al.).

2.3 Determinação dos tempos

A prática de estudos sobre tempos de viagem entre diferentes caminhos mostrou que a utilização de distribuições de tempos baseadas apenas na média e na variância desses tempos pode não ser suficiente para uma adequada modelagem (CAMBRIDGE SYSTEMATICS, 2003).

Os tempos de deslocamento entre nós são altamente dependentes de condições de trânsito, físicas e ambientais. Para estimar a probabilidade de um determinado caminho são utilizadas funções de densidade de probabilidade, que empregam o tempo como variável aleatória e servem de entrada para o desenvolvimento desses modelos (KHAROUFEH e GAUTAM, 2004).

Uma vez introduzidas as principais metodologias e os conceitos teóricos de redes de transporte e modelos estocásticos associados, surge a necessidade de uma pesquisa relacionada às ferramentas e conceitos estatísticos que foram utilizados no desenvolvimento do estudo.

2.4 Identificação de tempos outliers

Outliers são observações consideradas incongruentes dentro de um determinado conjunto

de dados. Tecnicamente são observações raras que podem deteriorar a qualidade dos dados estudados e por isso sua identificação é de suma importância para validação dos dados coletados. Para a sua identificação eles (os dados) são divididos em quatro intervalos da seguinte forma (WALPOLER, MYERS, et al., 2012):

(21)

19

a) Q1: os primeiros 25% valores, ou seja, um quarto dos resultados obtidos encontra-se

nesse quartil, em que 𝑄1̅̅̅̅ é o maior valor de Q1

b) Q2: os valores entre os 25% primeiros e os 50% primeiros

c) Q3: os valores entre os 50% primeiros resultados obtidos e os últimos 25%, , em que 𝑄3

̅̅̅̅ é o maior valor de Q3

d) Q4: os últimos 25% resultados obtidos

Para definir os limites inferior e superior dos dados é realizado o seguinte cálculo: Inferior: 𝑄1̅̅̅̅ – 1,5*(𝑄3̅̅̅̅-𝑄1̅̅̅̅)

Superior: 𝑄3̅̅̅̅ + 1,5*(𝑄3̅̅̅̅-𝑄1̅̅̅̅)

Os valores encontrados abaixo do limite inferior ou acima do limite superior são considerados os outliers.

Conforme mencionado anteriormente, dentro do contexto de redes de transporte, os tempos de viagem são entendidos como variáveis aleatórias pertencentes a funções de densidade de probabilidade e, para entendê-los, é preciso realizar um apanhado teórico sobre estas funções de densidade.

2.5 Funções densidade de probabilidade

Para a representação dos tempos de deslocamentos entre pontos especificados dentro de uma rede urbana a literatura apresenta diferentes propostas. Enquanto alguns autores sugerem que a melhor função densidade de probabilidade a ser utilizada é a distribuição Lognormal (RICHARDSON e TAYLOR, 1978; RAKHA, EL-SHAWARBY, et al., 2006; PU, 2010; AREZOUMANDI, 2011), outros entendem que a função Weibull se adequa melhor (AL-DEEK e EMAM, 2006), ou até mesmo a função Gama (POLUS, 1979).

2.5.1 Distribuição de densidade Gama

A distribuição Gama é amplamente utilizada para estudos de previsões, desde índices de precipitação de chuva até aplicações na neurociência (FUNK, MICHAELSEN e HUSAK, 2006). Sua vantagem em relação às outras é que dependendo dos valores de seus parâmetros ela pode aproximar-se das distribuições exponencial, Weibull e Lognormal. (FAN e NIE, 2006).

(22)

20

Dessa maneira, a principal distribuição considerada para o estudo em questão foi a distribuição Gama.

Dados os respectivos parâmetros de forma 𝛼e taxa 𝛽 a distribuição de densidade Gama

é definida pela Equação (1) :

𝑓(𝑥) =𝛽−𝛼𝑥𝛼−1𝑒−𝑥/𝛽 Γ(𝛼) , ∀ Γ(𝛼) ≥ 0, ∀ x ≥ 0 (1) Onde: Γ(α) = ∫ ℯ∞ −𝑥𝑥𝛼, 0 ∀ α ≥ 1 (2) 2.5.1.1 Parâmetros e notação

A média, o desvio padrão, a notação e o gráfico ilustrativos são representados pela Equação (3), Equação (4) e Equação (5), respectivamente.

Média: 𝛼𝛽 (3) Desvio padrão: 𝛽√𝛼 (4) Notação: 𝑥~𝐺𝑎𝑚𝑎(𝛼, 𝛽) (5) 2.5.1.2 Representação gráfica

Na Figura 2 é apresentado um gráfico de uma função Gama com parâmetros 𝛼=4 e 𝛽=20.

(23)

21

Figura 2: Função densidade Gama - 𝛼=4;𝛽 =20

2.5.2 Distribuição de densidade Lognormal

A função Lognormal é uma função comum para estudo de tempos de falhas de materiais, como semicondutores ou diodos, mas também pode ser utilizada para ajustes de tempos de deslocamento de transporte. Outro ponto importante é que, diferentemente de uma distribuição Normal, essa distribuição pode assumir apenas valores positivos (CLARK e WATLING, 2005) .

Uma função é dita Lognormal se dada uma variável aleatória x seu logaritmo for normalmente distribuído. Ela possui a seguinte função densidade, representada pela Equação (6), abaixo (BROWN e AITCHISON, 1957).

𝑓(𝑥) = 1

𝑥𝜎√2𝜋exp [

−(log(𝑥)−𝜇)²

2𝜎² ] , ∀ x ≥ 0, −∞ ≥ 𝜇 ≥ +∞ (6)

2.5.2.1 Parâmetros e notação

A média, desvio padrão e notação mais usual estão representados respectivamente a seguir na Equação (7), Equação (8) e Equação (9).

Média:

exp (𝜇 + 1

𝜎2) (7)

Desvio padrão:

(24)

22

Notação:

ℯ𝑥~𝑙𝑜𝑔𝑛𝑜𝑟𝑚𝑎𝑙(𝜇, 𝜎) (9)

2.5.2.2 Representação gráfica

Na Figura 3 é apresentado um gráfico de uma função de distribuição de probabilidade log-normal com 𝜇=2 e 𝜎= 0,2.

Figura 3: Distribuição log-normal - 𝜇=2 e 𝜎= 0,2

2.5.3 Distribuição de densidade Exponencial

A função de densidade exponencial é normalmente utilizada pela literatura para descrever a ocorrência de eventos constituídos por pequenos atrasos e altas probabilidades. Desta maneira, sua utilização pode resultar numa boa representatividade dos tempos de deslocamento de uma rede de transportes. Além disto, ela nada mais é do que uma especificação da distribuição Gama, quando 𝛼 é igual a 1. (NOLAND e SMALL, 1995).

Esta função pode ser definida conforme a Equação (10):

𝑓(𝑥) =ℯ−𝑥 , ∀ 𝑥 ≥ 0, ∀  ≥ 0 (10)

2.5.3.1 Parâmetros e notação

A média e desvio padrão, notação mais usual e gráfico ilustrativo estão representados respectivamente a seguir na Equação (11) e Equação (12) e.

Média e desvio padrão:

(25)

23

Notação:

𝑥~𝐸𝑥𝑝() (12)

2.5.3.2 Representação gráfica

Na Figura 4 é apresentado um gráfico de uma função de distribuição de probabilidade exponencial com =0,5.

Figura 4: Função densidade de probabilidade exponencial - =0,5

2.5.4 Distribuição de densidade Weibull

A função densidade de Weibull é conhecida pela literatura como uma referência na representação da confiabilidade de equipamentos ou materiais. Por outro lado, pode-se encontrar também essa função como uma boa representação de tempos de viagem utilizando comparações com outros modelos de distribuições estocásticas (GUESSOUS, ARON, et al., 2014).

Esta função pode ser definida através dos parâmetros 𝛼 e 𝛽 como na distribuição Gama pela Equação (13) a seguir (WEIBULL, 1951):

𝑓(𝑥) = 𝛼 𝛽𝛼𝑥 𝛼−1𝑒𝑥𝑝 [− (𝑥 𝛽) 𝛼 ] , ∀ 𝑥 ≥ 0 (13) 2.5.4.1 Parâmetros e notação

Seus principais parâmetros são: média e desvio padrão. Estes parâmetros estão expressados na Equação (14) e Equação (15), respectivamente. Sua notação mais usual é representada pela Equação (16).

(26)

24 Média: 𝛽 Γ [1 + (1 𝛼)] (14) Desvio padrão: 𝛽 {Γ [1 + (2 𝛼)] − Γ[1 + (1 + 𝛼)]²} 1/2  (15) Notação: 𝑥~𝑊𝑒𝑖𝑏𝑢𝑙𝑙(𝛼, 𝛽) (16) 2.5.4.2 Representação gráfica

Na Figura 5Figura 4 é apresentado um gráfico de uma função de distribuição de probabilidade Weibull - 𝛼=2 e 𝛽=0,33.

Figura 5: Função densidade de probabilidade Weibull - 𝛼=2 e 𝛽=0,33

2.6 Ajuste de dados pela função de verossimilhança

A seguir são apresentados conceitos intrínsecos às funções utilizadas no R Open Source para a resolução dos problemas posteriormente apresentados. Os principais conceitos utilizados pelo programa, suas funções e pacotes no estudo em questão são: função de verossimilhança, convolução de funções, teste de hipóteses e teste de Cramer von Mises.

A função de verossimilhança é uma probabilidade condicional. Dado um conjunto X de parâmetros conhecidos de uma função de densidade de probabilidade 𝑓, um conjunto de dados

(27)

25

D, com 𝑛 elementos 𝑑𝑖, (em que 𝑑𝑖 representa o i-ésimo elemento) a função de verossimilhança é definida pela Equação (17):

𝐿(𝑋, 𝑑1, 𝑑2, 𝑑3 … 𝑑𝑛) = ∏𝑛𝑖=1𝑓(𝑑𝑖, 𝑋) (17)

Essa função depende apenas dos parâmetros X e a função de densidade de probabilidade 𝑓, de modo que os parâmetros da função 𝑓 devem ser aqueles que maximizem o valor da Equação 17 (COUSINEAU, BROWN e HEATHCOTE, 2004).

2.7 Soma de variáveis aleatórias

Em uma rede de transporte composta por elementos consecutivos, ou seja, nós consecutivos, o tempo total de deslocamento de um ponto de origem O para um ponto de destino D pode ser calculado pela justaposição dos tempos entre cada par de nós do caminho percorrido. Desta forma, entende-se que o tempo total de viagem é a soma de todos os tempos de deslocamento e eventuais atrasos entre os nós da rede (WU e JUSTIN, 2014).

2.8 Convolução de funções

A fim de encontrarmos uma expressão geral para a distribuição de probabilidade do tempo de viagem total é feita a operação de convolução entre as distribuições de densidade de probabilidade de cada trecho do percurso em análise (HOFLEITNER, HERRING e BAYEN, 2012).

Convolução de funções é um tema amplamente abordado ao tratar de emissões sonoras, no sentido em que um determinado pulso apresenta sinais indesejados. Este conceito serve para acrescentar ou remover determinados espectros de frequências, cujas funções geradoras são distintas. A técnica consiste em alterações tanto no domínio quanto na imagem da função resultante da convolução de outras duas funções. Matematicamente, esta propriedade pode ser definida conforme a Equação (18) (STRICHARTZ, 1994):

(28)

26

onde f e g são duas funções conhecidas, x é uma variável aleatória e t é a nova variável de interesse.

Uma propriedade importante da convolução é que, por se tratar de uma integral, é possível aplicar a associatividade, ou seja, realizar esse processo independe da ordem em que as funções são alocadas (BARCHINSKI, 2016). Além disto, a convolução de duas funções de densidade de probabilidade Gama é uma nova função Gama com parâmetros diferentes, assim como a convolução de distribuições Lognormal é uma nova Lognormal e a de distribuições Exponenciais é também uma nova Exponencial (COBB e RUMÍ, 2012; MOSCHOPOULOS, 1984; AKKOUCHI, 2008). Por outro lado, para as distribuições Weibull, esse cálculo é extremamente difícil e não é tão preciso (BESSATE e BOUANANI, 2017). Para funções densidade de probabilidade distintas, a convolução nem sempre resulta numa função de densidade conhecida ou com parâmetros estimáveis. Portanto, para o processo de convolução entre funções de densidades diferentes é preciso realizar uma convolução numérica, isto é, são simulados uma quantidade de valores suficientes (pelo menos 2.000 valores) a partir de uma distribuição A dada, e outros tantos valores suficientes para uma distribuição B a fim de que a soma destes valores possa representar a convolução (KNILL, 2009).

2.9 Ajuste da função densidade de probabilidade no R Open Source

Ajustar uma função densidade de probabilidade de um determinado conjunto de dados é simplesmente identificar a função matemática que representa da melhor forma possível uma variável aleatória. Estatisticamente, este é um problema bem comum, quando um estatístico decide, por exemplo, testar se uma determinada amostra de estudo se encaixa numa determinada distribuição de probabilidade com seus parâmetros conhecidos (BATES, 2001).

Desta forma, para a identificação de cada distribuição de densidade de probabilidade de cada intervalo de nós os seguintes passos devem ser seguidos:

a) Escolher uma função densidade de probabilidade como hipótese para o conjunto de dados;

b) Estimar os seus parâmetros principais;

c) Avaliar a qualidade dos parâmetros obtidos e a função densidade encontrada para aqueles dados através de algum teste estatístico

(29)

27

Para a realização dos passos acima descritos, alguns conceitos e testes devem ser especificados. A seguir são apresentados: o teste de hipótese e suas interpretações, bem como o teste de Cramer von Mises e o conceito de p-valor.

2.9.1 Teste de hipótese e p-valor

Quando deseja-se testar uma determinada hipótese a respeito de um conjunto de variáveis utiliza-se o teste de hipótese como ferramenta para este processo. Primeiro define-se uma hipótese inicial, chamada de hipótese nula (Ho), e então uma hipótese complementar, chamada de hipótese alternativa (Ha ou H1).

A fim de verificar qual das duas hipóteses é verdadeira, utiliza-se muitas vezes o critério do p-valor. Esse método consiste em quantificar o quanto de evidências é necessário para rejeitar a hipótese nula (Ho). Em outras palavras, o p-valor pode ser entendido como a probabilidade de a estatística testada ter valores mais extremos que os observados, dado que a hipótese nula é verdadeira (SWEENEY, WILLIAMS e ANDERSON, 2013).

2.9.2 Teste de Cràmer von Mises

Quando se trata de testes de verificação da qualidade dos ajustes, normalmente é medida a discrepância entre a função densidade de probabilidade hipotética 𝐹(𝑥) e os valores empíricos x. O teste de Cramer von Mises não depende de um valor particular de F(x), mas baseia-se

numa estatística de interesse 𝜔² e na função de densidade sendo testada 𝐹𝑛(𝑥). Essa estatística

de teste é calculada de acordo com a Equação (19) (STEPHENS, 1970):

𝜔2 = n ∫ {𝐹

𝑛(𝑥) − 𝐹(𝑥)}2

+∞

−∞ 𝑑𝐹(𝑥) (19)

Para a validação ou não do teste é preciso seguir os seguintes passos:

a) Estabelecer que a função F(x) segue determinada distribuição de probabilidade com parâmetros pré-determinados como hipótese nula (Ho);

b) Calcular a estatística de interesse 𝜔² de acordo com a equação (19); c) Verificar o p-valor de acordo com a Tabela 1

(30)

28

Tabela 1: p-valores para w²

Fonte: Adaptado de CSORGO e FARAWAY, 1996

d) Rejeitar ou não a hipótese nula de acordo com o seguinte critério:

𝑝 − 𝑣𝑎𝑙𝑜𝑟 > 0,05 − 𝑎𝑐𝑒𝑖𝑡𝑎 𝐻0 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 0,05 − 𝑟𝑒𝑗𝑒𝑖𝑡𝑎 𝐻0

Para o caso da comparação de ajustes de diferentes funções densidade de probabilidade, a função a ser escolhida é a que melhor se ajusta e que, portanto, possui maior p-valor.

2.9.2.1 Teste de Cràmer von Mises para duas funções de densidade

O teste de Cramer von Mises para duas funções de densidade possui interpretação análoga ao teste para uma função de densidade. Nesse caso, é considerado um outro conjunto empírico de dados para comparação com o primeiro.

Sejam dados dois conjuntos amostrais independentes de populações X e Y com 𝑚 e 𝑛

elementos sequenciais, respectivamente. Para estas duas amostras 𝑥𝑖 representa o i-ésimo termo do conjunto proveniente de X e 𝑦𝑖 o i-ésimo termo do conjunto proveniente de Y de forma que cada elemento seja único e maior que o anterior. As funções de distribuição de X e Y são F(x) e G(y), respectivamente. Assume-se então Fm(x) e Gn(y) como as duas funções densidade de

(31)

29

probabilidade empíricas e toma-se como hipótese nula o fato de F(x)=G(x) para qualquer valor de x. Desta forma, na hipótese alternativa tem-se que F(x)≠G(x) (XIAO, GORDON e YAKOVLEV, 2006).

Assim sendo, define-se a estatística de interesse segundo a Equação (20)

𝜔2 = 𝑚𝑛

(𝑚+𝑛)²{∑ [𝐹𝑚(𝑥𝑖) − 𝐺𝑛 𝑛

1 (𝑥𝑖)]² − ∑ [𝐹𝑚(𝑦𝑖) − 𝐺𝑛𝑛1 (𝑦𝑖)]²} (20)

A partir da estatística de interesse calculada acima, utiliza-se a Tabela 1 para identificar o p-valor correspondente.

(32)

30

3 METODOLOGIA

A metodologia apresentada a seguir baseia-se na obtenção de um modelo representativo dos tempos de deslocamento entre catorze nós consecutivos, sendo onze deles pertencentes a uma dada linha de ônibus A e os três restantes a uma outra linha de ônibus B. Estes tempos foram obtidos ao longo de determinado intervalo de tempo sobre as mesmas circunstâncias.

Para cada par de nós foi atribuída uma função densidade de probabilidade e através da convolução destas funções obteve-se uma função representativa do itinerário desenvolvido. Esta função resultante foi comparada e validada com a função densidade de probabilidade obtida através dos tempos resultantes da soma dos tempos de cada par de nós consecutivos.

3.1 Obtenção de Dados

Para a efetivação do estudo, os dados foram obtidos através de roteiros pré-estabelecidos junto a uma empresa prestadora do serviço de transporte público em Niterói. Os dados de tempos de deslocamentos entre pontos consecutivos e o tempo de deslocamento total foram obtidos para catorze pontos consecutivos.

Os tempos medidos foram calculados durante um intervalo de 1 hora ao longo da manhã de cada dia útil durante quatro meses consecutivos (março de 2016 até junho de 2016) para seis ônibus distintos (três para a linha A: veículos 1, 2 e 3; e três para a linha B: veículos 4, 5 e 6), começando no primeiro ponto (origem) das 8:00h até cerca de 9:00h no último ponto (destino) para seis ônibus da empresa, cada um saindo aproximadamente 10 minutos após o outro. Desta maneira foi possível obter os tempos de deslocamento entre os pontos contemplados pelos roteiros pré-estabelecidos.

3.2 Grafo das rotas de ônibus

Para a representação das rotas de ônibus, foi utilizado o programa open source

OpenStreetMap. O estudo foi realizado em Niterói, região metropolitana do estado do Rio de

Janeiro. As linhas A e B saem de dois pontos iniciais distintos (ambos no bairro de São Francisco) em direção a um mesmo ponto final (centro da cidade de Niterói), passando por um ponto em comum às duas rotas antes do destino.

(33)

31

Este ponto é o décimo primeiro nó e é o cerne da possibilidade de criação de uma nova rota a partir dos itinerários já existentes das linhas A e B. A partir desta interseção é possível verificar, probabilisticamente, quanto tempo deve ser dedicado pela empresa de ônibus para que um ônibus cubra uma primeira parte do caminho segundo o roteiro da linha A e a segunda parte do caminho segundo o roteiro da linha B, realizando essa concatenação dos itinerários.

A seguir observa-se o exemplo apenas do trecho em que as rotas dessas duas linhas de ônibus divergem, representado pelo OpenStreetMap na

Figura 6:

Figura 6: Representação de trechos distintos das linhas A e B no OpenStreetMap

(34)

32

Figura 7: Grafo de parte do caminho divergente entre linhas A e B

3.3 Definição dos eventos limitantes à tecnologia

Para melhor compreensão dos dados analisados, alguns eventos devem ser definidos, conforme a seguir:

a) Chegada: evento em que o ônibus emparelha junto ao meio fio em determinado intervalo de 40m ao redor do ponto de ônibus com velocidade nula, de acordo com o GPS utilizado;

b) Saída: evento em que o ônibus começa a deixar a posição emparelhada ao meio fio em determinado intervalo de 40m ao redor do ponto de ônibus com velocidade diferente de zero, de acordo com o GPS utilizado;

c) Trânsito entre pontos: evento caracterizado pela saída de um ponto de ônibus ou nó 1 e pela chegada num ponto de ônibus ou nó 2 consecutivo, ou seja, é o tempo efetivo em que o ônibus está se deslocando;

d) Tempo de carregamento/descarregamento: tempo necessário para que os passageiros de determinado ponto entrem no ônibus e os passageiros do ônibus desçam em determinado ponto;

e) Tempo de deslocamento entre pontos: esse tempo é medido de forma que o tempo de deslocamento do nó 1 para o nó 2 contemple o tempo em trânsito mais o tempo de carregamento ou descarregamento de usuários do nó anterior (nesse caso nó 1).

(35)

33 3.3.1 Desenvolvimento das premissas incorporadas

A fim de garantir a coesão dos eventos junto às medições estipuladas, quatro premissas são fundamentais:

a) A primeira delas é a de que os tempos de carregamento/descarregamento dos ônibus estão contemplados nos tempos de deslocamento dos ônibus. Isso significa que o tempo de carregamento/descarregamento de passageiros de um ponto A está contabilizado no tempo de deslocamento do ponto de ônibus A para o ponto de ônibus B imediatamente seguinte;

b) A segunda consiste na ideia de que a função resultante da convolução entre as funções de distribuição de probabilidade dos tempos de deslocamento de qualquer par de nós consecutivos deve ser convergente;

c) A terceira premissa consiste na ideia de que as funções obtidas a partir das convoluções entre a função resultante da convolução entre as funções de distribuição de probabilidade dos tempos de deslocamento de qualquer par de nós consecutivos e as funções de densidade de probabilidade dos tempos de deslocamento entre o par de pontos seguintes seja convergente. Essa premissa é um desdobramento da segunda, a fim de manter a coesão matemática do problema;

d) Por fim, assumiu-se que as bibliotecas de módulos matemáticos utilizadas no R

Open Source são confiáveis, bem como os resultados por elas expressos.

A partir da incorporação das premissas apresentadas, foi iniciada a análise dos tempos de deslocamento nas linhas de ônibus através da identificação de outliers, definição das distribuições de probabilidade para cada par de pontos, convolução dessas funções, cálculo da função densidade com o somatório dos tempos e comparação entre esta e a função obtida da convolução.

3.4 Tratamento dos dados e remoção dos outliers

O tratamento estatístico inicial dos dados com identificação dos outliers é importante para validação da qualidade dos dados analisados. Para esse tratamento foram medidos os seguintes parâmetros: mediana, média, tempo máximo, mínimo, maior valor do primeiro quartil e maior valor do terceiro quartil. Foram considerados úteis todos os dados compreendidos entre o intervalo correspondente a Q1-1,5x(Q3-Q1) e Q3+1,5x(Q3-Q1), em que Q1 é o maior valor do

(36)

34

primeiro quartil (em que estão 25% dos dados, em ordem crescente) e Q3 o maior valor do terceiro quartil (em que estão 75% dos dados em ordem crescente).

3.5 Distribuições de probabilidade para cada par de pontos

A definição da função de densidade de probabilidade de cada par de pontos de ônibus consecutivos foi realizada a partir de quatro funções de densidade de probabilidade pré-estabelecidas, Exponencial, Gama, Weibull e Lognormal. A partir dessas quatro funções foi realizado o ajuste da melhor função que se assemelhou aos dados introduzidos. Esse ajuste foi realizado considerando do método de máxima verossimilhança. O programa testou diferentes parâmetros para então definir aqueles que maximizaram a função de verossimilhança.

Após este primeiro ajuste, para cada função densidade de probabilidade (quatro por cada par de nós) encontrada foi aplicado o teste de Cramer von Mises e o cálculo da estatística de

interesse 𝜔 utilizando o software R Open Source. Com essa estatística, o próprio software

calculou o p-valor para cada um dos ajustes realizado e a distribuição que obteve maior p-valor foi escolhida como o melhor ajuste.

3.6 Convolução das funções densidade de probabilidade

A próxima etapa foi a convolução das funções de densidade de probabilidade associadas a cada par de nós a fim de gerar uma função que represente bem o caminho como um todo. Cada uma das convoluções considerou conjuntos de 10.000 elementos, variando de 0.1 em 0.1 unidades desde 1 até 1.000. Após cada convolução foi realizado o ajuste de distribuições de probabilidade, utilizando a maximização da função de verossimilhança e o teste de Cramer von Mises para cada função estimada.

Nesse momento foi utilizada a propriedade associativa para facilitar o processo de convolução. Isso significa que, para as funções Gama e Lognormal, o teste de Cramer von Mises não foi necessário, já que a função resultante é conhecida como Gama e Lognormal, respectivamente.

(37)

35 3.7 Função de densidade de probabilidade com base na soma dos tempos

A definição de uma função densidade de probabilidade associada aos tempos resultantes da soma dos tempos de cada par de nós foi encontrada da mesma forma que as funções para cada par de nós. Neste caso, em vez de utilizar os tempos para um par de nós, como foi feito até então, foram utilizadas as somas dos tempos de cada par de nós.

Com esses tempos, foi realizado o ajuste pela maximização da função de verossimilhança para as quatro funções de densidade consideradas e conseguinte teste de Cramer von Mises para determinar qual delas foi melhor ajustada.

3.8 Comparação entre o modelo proposto e a função densidade de probabilidade do tempo total de viagem

Para esta comparação, foram associados dois conjuntos com valores sequenciais dentre os tempos mínimo e máximo a partir das duas funções encontradas ao final da convolução e do ajuste da soma dos tempos, já que o teste de Cramer von Mises só aceita valores de dados sequenciais. Foram criados conjuntos com cerca de 2.000 valores cada, de acordo com a capacidade de processamento da função utilizada.

Estes dois conjuntos foram confrontados pelo teste de Cramer von Mises para duas amostras a fim de identificar se os dois fazem parte de uma mesma população. Isso permitiu identificar se a função densidade calculada pela convolução pode ser considerada equivalente a função da soma dos tempos. Caso positivo, pode-se constatar que o ajuste matemático para descrever o caminho todo a partir das funções de densidade de cada par de nós foi bem-sucedido. Tal constatação permitiria então, uma precisa identificação dos tempos de deslocamento e suas variabilidades sem a necessidade do uso de tecnologias GPS.

(38)

36

4 APLICAÇÃO DA METODOLOGIA E SEUS RESULTADOS

As informações disponibilizadas pela empresa foram constituídas por intervalos de cerca de 1h para cada dia útil da semana ao longo dos meses de março de 2016 até junho de 2016, desconsiderando o mês de julho. Foram considerados 6 ônibus para o estudo, veículos 1, 2 e 3 da linha A e veículos 4, 5 e 6 da linha B. Dessa forma, foram gerados aproximadamente 3300 tempos, sendo cerca de 250 para cada par de nós. Os veículos foram agrupados da seguinte forma a fim de completar o caminho proposto: 1-4, 2-5 e 3-6. Desta forma, os tempos analisados contemplaram todos os pares de nós pré-estabelecidos de forma consecutiva.

4.1 Obtenção de dados

Os tempos (em minutos) recebidos para cada par de pontos estão representados nas tabelas de 2 até 7. A desconsideração dos tempos do mês de Julho foi realizada devido às intensas mudanças nos fluxos de ônibus por causa de férias escolares na região analisada. Tal sugestão, surgiu a partir de observação empírica da empresa.

(39)

37

Tabela 2: Ônibus 1 e 4 - Março e Abril

Tabela 3: Ônibus 1 e 4 - Maio e Junho

Data O-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12 12-D 07/03/2016 3,21 4,66 10,75 2,78 1,78 1,64 3,73 7,12 2,46 2,04 1,57 2,24 3,58 47,56 08/03/2016 2,88 4,84 8,76 3,02 1,94 1,71 3,49 5,45 2,42 1,98 1,65 3,42 3,61 45,17 09/03/2016 2,57 6,66 8,31 3,82 1,89 1,52 3,65 8,56 2,40 1,62 1,70 4,10 2,77 49,57 10/03/2016 3,53 4,95 9,33 2,33 2,38 1,57 3,10 6,47 2,87 2,01 1,73 3,38 2,47 46,12 11/03/2016 2,74 6,53 11,48 2,17 1,80 1,54 3,73 4,50 2,22 1,97 1,69 3,58 2,68 46,64 14/03/2016 4,19 6,27 15,46 2,13 2,00 1,40 2,84 7,72 2,56 1,93 1,51 3,93 2,85 54,79 15/03/2016 3,01 4,03 14,54 3,40 2,04 1,40 3,40 6,51 2,45 2,25 1,50 2,98 3,90 51,40 16/03/2016 3,39 4,58 11,53 2,47 2,14 1,65 3,32 8,17 2,21 1,70 1,62 3,12 2,69 48,60 17/03/2016 3,27 4,02 11,20 2,12 2,40 1,79 3,55 4,48 2,20 1,70 1,63 3,42 3,13 44,91 18/03/2016 3,64 5,66 11,39 3,96 2,48 1,37 3,62 7,60 2,40 1,86 1,77 3,87 2,28 51,91 21/03/2016 4,03 5,17 8,31 2,94 1,92 1,52 2,84 7,25 2,61 2,04 1,44 3,78 2,77 46,62 22/03/2016 3,39 7,29 9,30 4,08 1,80 1,73 3,61 8,36 2,40 2,11 1,55 3,16 2,30 51,08 23/03/2016 2,55 5,38 8,95 3,81 1,96 1,36 3,55 4,23 2,38 1,86 1,76 2,58 3,52 43,89 24/03/2016 3,63 6,53 14,73 3,35 2,08 1,80 2,82 5,34 2,61 2,01 1,42 3,31 2,92 52,56 25/03/2016 4,18 4,30 8,54 3,03 1,83 1,67 2,76 6,21 2,53 1,91 1,68 3,38 3,11 45,13 28/03/2016 3,39 3,48 13,50 2,89 2,00 1,69 2,85 6,08 2,81 2,15 1,50 3,60 2,07 48,01 29/03/2016 2,73 3,92 9,09 4,11 2,25 1,88 2,98 7,61 2,56 2,18 1,68 2,66 2,42 46,08 30/03/2016 3,94 5,66 11,79 2,89 2,42 1,39 3,11 8,15 2,77 1,85 1,77 4,20 2,19 52,13 31/03/2016 3,25 6,02 7,82 2,99 2,22 1,42 2,94 4,11 2,72 1,81 1,53 3,29 2,18 42,30 01/04/2016 2,94 3,38 8,81 2,02 2,16 1,52 3,27 6,71 2,86 2,21 1,79 3,92 3,92 45,52 04/04/2016 3,46 3,77 10,72 2,83 2,19 1,37 3,71 7,07 2,84 1,66 1,79 3,36 2,08 46,85 05/04/2016 2,86 3,68 10,61 3,16 2,13 1,85 3,12 7,54 2,61 1,77 1,65 2,46 2,45 45,89 06/04/2016 2,93 4,36 8,78 2,07 2,21 1,47 3,45 4,46 2,29 2,19 1,43 2,09 3,03 40,76 07/04/2016 3,26 6,69 10,02 3,22 2,08 1,82 2,94 6,33 2,74 2,21 1,73 3,49 3,17 49,71 08/04/2016 3,16 5,14 11,95 3,04 1,82 1,54 2,98 5,47 2,87 2,07 1,72 3,39 3,47 48,62 11/04/2016 2,82 3,61 12,43 4,08 2,16 1,55 3,04 6,24 2,96 1,76 1,50 4,53 2,31 49,00 12/04/2016 4,18 4,78 9,73 2,60 1,89 1,87 2,79 6,10 2,76 1,81 1,57 2,43 2,55 45,05 13/04/2016 2,54 5,19 6,52 2,64 1,91 1,67 3,10 4,34 2,42 1,98 1,52 4,52 2,35 40,70 14/04/2016 2,54 5,21 9,43 2,64 2,02 1,45 2,94 8,50 2,92 1,90 1,58 2,25 3,13 46,50 15/04/2016 2,78 7,00 8,33 3,68 1,91 1,82 2,79 7,31 2,74 2,01 1,62 2,82 2,04 46,85 18/04/2016 2,63 4,13 8,96 3,27 2,07 1,60 3,22 6,94 2,52 2,19 1,60 4,05 2,95 46,13 19/04/2016 3,90 4,22 9,20 4,17 2,22 1,41 3,32 7,15 2,27 1,78 1,70 3,22 3,34 47,90 20/04/2016 3,31 6,88 9,43 4,04 2,05 1,45 3,60 7,12 2,54 2,03 1,60 4,06 3,03 51,14 21/04/2016 2,69 5,47 12,10 2,39 2,04 1,76 3,43 5,83 2,45 1,66 1,76 4,20 2,47 48,24 22/04/2016 4,06 5,53 9,74 3,77 1,78 1,67 3,79 6,66 2,77 2,13 1,49 2,52 2,37 48,28 25/04/2016 3,11 3,73 10,36 2,34 1,90 1,40 3,06 4,80 2,25 2,21 1,67 2,39 3,27 42,49 26/04/2016 2,74 3,25 13,17 2,10 1,92 1,85 3,29 7,99 2,26 1,98 1,42 4,55 2,49 49,01 27/04/2016 2,87 4,11 11,39 3,92 2,07 1,64 2,78 7,06 2,79 1,71 1,41 3,62 2,50 47,87 28/04/2016 4,19 3,65 8,16 3,48 2,40 1,62 3,09 6,41 2,58 2,08 1,55 2,26 3,73 45,20 29/04/2016 2,73 5,15 8,61 3,21 1,82 1,72 3,46 7,95 2,40 1,86 1,75 4,60 3,04 48,30 Tempo total A B Data O-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12 12-D 02/05/2016 3,04 4,00 12,02 3,52 2,43 1,82 3,55 7,08 2,56 1,59 1,68 3,06 2,26 48,62 03/05/2016 3,17 5,00 7,66 2,83 2,06 1,70 2,82 4,78 2,54 1,69 1,76 3,08 3,15 42,25 04/05/2016 3,59 4,70 6,31 4,21 2,04 1,57 3,10 7,69 2,93 2,09 1,72 4,70 2,55 47,20 05/05/2016 3,67 5,20 10,16 3,82 1,96 1,67 3,70 5,69 2,73 1,81 1,41 4,60 2,31 48,73 06/05/2016 3,72 4,25 10,88 3,27 2,05 1,88 3,11 6,36 2,46 1,61 1,49 2,28 3,68 47,04 09/05/2016 3,85 5,39 7,67 3,67 1,80 1,66 3,06 6,66 2,36 2,08 1,57 3,45 3,05 46,28 10/05/2016 2,92 5,08 6,59 3,20 1,85 1,67 3,88 7,41 2,32 1,93 1,71 2,97 3,88 45,41 11/05/2016 4,21 5,43 11,74 2,78 2,13 1,82 3,06 7,45 2,45 2,09 1,56 4,55 3,21 52,47 12/05/2016 2,72 3,89 7,65 3,08 2,05 1,50 3,25 7,99 2,70 1,86 1,51 4,53 2,32 45,06 13/05/2016 3,51 4,64 11,60 2,10 1,99 1,78 2,80 4,75 2,56 1,75 1,56 4,05 2,67 45,76 16/05/2016 3,55 5,04 12,42 2,77 1,97 1,87 2,78 5,38 2,68 2,09 1,48 3,45 3,14 48,62 17/05/2016 2,69 5,47 8,42 2,48 1,87 1,87 3,25 4,46 2,86 1,77 1,80 4,23 3,68 44,85 18/05/2016 2,85 4,29 9,31 3,61 1,89 1,44 2,81 6,92 2,38 1,63 1,41 3,45 3,05 45,04 19/05/2016 2,76 4,17 10,37 2,26 2,36 1,57 3,09 5,18 2,19 1,63 1,46 3,51 2,23 42,79 20/05/2016 2,61 4,27 6,37 2,08 1,99 1,55 3,73 5,13 2,44 2,13 1,56 2,27 2,57 38,69 23/05/2016 2,81 5,98 7,53 2,15 2,03 1,81 3,52 8,21 2,81 2,03 1,78 2,82 4,03 47,51 24/05/2016 3,28 5,58 8,11 2,48 2,16 1,81 3,34 7,97 2,55 2,09 1,42 3,44 3,26 47,50 25/05/2016 3,98 3,47 14,35 2,37 2,07 1,61 2,94 7,07 2,92 1,76 1,41 4,12 2,68 50,75 26/05/2016 3,00 5,43 10,72 3,51 2,04 1,41 2,82 7,69 2,45 1,66 1,78 4,35 2,20 49,06 27/05/2016 3,26 5,13 7,86 2,34 1,80 1,80 3,46 9,20 2,30 2,13 1,66 2,04 3,62 46,59 30/05/2016 4,17 3,09 9,36 4,06 2,24 1,83 3,73 5,91 2,45 1,95 1,78 3,72 2,87 47,15 31/05/2016 3,39 5,13 9,50 3,35 2,36 1,74 3,20 8,79 2,42 1,99 1,41 2,40 2,59 48,28 01/06/2016 3,00 3,46 9,15 4,20 1,84 1,53 3,83 7,81 2,23 1,67 1,70 4,18 3,23 47,84 02/06/2016 3,02 3,42 10,77 3,18 1,80 1,61 3,74 6,93 2,37 1,94 1,45 2,53 3,46 46,21 03/06/2016 2,81 5,95 11,04 2,82 1,91 1,76 3,22 8,78 2,41 1,82 1,80 4,58 3,63 52,53 06/06/2016 3,08 6,06 12,74 3,07 2,30 1,74 3,05 4,46 2,66 1,70 1,50 3,05 2,69 48,10 07/06/2016 3,03 4,01 10,63 3,63 2,35 1,66 3,40 5,67 2,86 1,94 1,56 2,88 3,92 47,54 08/06/2016 4,10 3,04 6,34 3,00 2,38 1,62 3,17 6,45 2,25 1,74 1,56 4,07 2,09 41,80 09/06/2016 3,10 6,02 11,19 3,88 1,78 1,74 3,42 7,30 2,22 1,71 1,43 4,05 2,97 50,81 10/06/2016 3,02 4,18 10,82 2,42 2,44 1,54 2,97 6,06 2,52 1,75 1,76 3,64 3,18 46,30 13/06/2016 2,85 4,25 10,13 2,19 1,81 1,82 3,62 6,62 2,59 1,93 1,46 2,43 2,88 44,58 14/06/2016 3,18 3,48 8,82 3,02 2,13 1,81 2,84 6,15 2,23 1,60 1,42 3,98 2,58 43,24 15/06/2016 4,00 5,50 13,75 3,92 2,42 1,81 2,95 7,21 2,61 2,25 1,66 3,07 2,10 53,25 16/06/2016 3,18 3,54 13,26 2,76 2,10 1,65 3,75 4,81 2,84 1,60 1,56 3,47 2,05 46,57 17/06/2016 2,50 3,14 11,25 3,11 1,91 1,72 3,32 5,61 2,77 2,04 1,44 2,63 3,40 44,84 20/06/2016 2,97 6,62 10,75 2,44 2,16 1,61 3,38 7,91 2,61 1,62 1,69 3,61 4,00 51,37 21/06/2016 3,24 4,32 10,00 2,07 2,36 1,50 3,43 6,84 2,63 1,63 1,77 3,73 2,38 45,90 22/06/2016 3,44 6,00 8,84 3,78 2,13 1,75 3,23 7,23 2,52 1,62 1,47 3,63 2,80 48,43 23/06/2016 3,20 4,97 7,65 2,77 1,80 1,82 3,74 6,46 2,93 1,99 1,78 2,70 3,94 45,75 24/06/2016 2,98 5,83 8,82 3,75 1,98 1,48 3,69 7,25 2,90 2,26 1,77 4,14 3,41 50,26 27/06/2016 2,89 4,14 10,24 3,96 1,82 1,70 3,88 4,95 2,27 1,77 1,50 2,20 3,83 45,15 28/06/2016 2,53 5,94 8,86 3,19 2,20 1,54 3,01 6,65 2,47 2,01 1,60 4,38 4,00 48,38 29/06/2016 2,60 4,64 10,77 2,58 1,89 1,59 3,34 7,49 2,58 2,31 1,58 3,23 3,51 48,11 30/06/2016 2,98 4,26 11,12 3,00 1,99 1,82 3,37 7,90 2,41 2,21 1,73 2,27 2,87 47,93 Tempo total A B

(40)

38

Tabela 4: Ônibus 2 e 5 - Março e Abril

Tabela 5: Ônibus 2 e 5 - Maio e Junho

Data O-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12 12-D 07/03/2016 3,10 4,10 12,81 3,42 1,77 1,56 3,66 7,05 2,28 1,69 1,57 3,32 3,29 49,62 08/03/2016 3,01 3,60 8,35 2,25 2,18 1,81 2,99 8,53 2,34 1,68 1,57 3,65 2,05 44,01 09/03/2016 3,51 7,29 9,82 3,59 1,94 1,76 3,56 7,00 2,35 1,71 1,65 3,32 2,38 49,88 10/03/2016 3,27 5,00 9,82 3,42 1,84 1,54 3,08 7,29 2,33 1,85 1,57 4,32 2,23 47,56 11/03/2016 3,95 3,98 13,42 2,67 2,13 1,51 3,42 6,72 2,74 1,71 1,63 2,30 3,14 49,33 14/03/2016 3,94 5,70 9,63 2,91 1,77 1,39 2,86 5,83 2,86 2,03 1,56 2,40 3,73 46,61 15/03/2016 2,63 4,61 6,76 2,00 2,01 1,82 2,88 7,87 2,89 1,91 1,54 2,45 2,20 41,56 16/03/2016 2,79 5,29 7,94 2,18 2,44 1,54 3,54 5,40 2,39 1,58 1,46 2,10 2,91 41,56 17/03/2016 2,82 6,29 11,81 3,48 2,14 1,42 3,16 6,27 2,32 1,68 1,50 2,33 3,29 48,51 18/03/2016 3,28 4,48 9,21 3,40 1,85 1,79 2,80 5,95 2,69 2,23 1,50 3,26 2,90 45,34 21/03/2016 3,57 4,71 14,80 2,26 2,31 1,54 3,11 5,01 2,55 1,76 1,47 3,63 2,68 49,40 22/03/2016 3,88 5,41 14,84 3,04 2,32 1,77 3,69 7,86 2,31 2,08 1,63 4,02 3,26 56,11 23/03/2016 4,17 4,70 8,06 2,21 2,11 1,40 3,34 6,34 2,25 1,78 1,50 2,45 2,87 43,17 24/03/2016 3,61 5,58 15,01 2,07 2,36 1,57 3,10 8,99 2,53 1,68 1,48 3,17 2,02 53,17 25/03/2016 2,87 5,24 9,43 4,17 1,77 1,66 3,64 4,47 2,23 2,25 1,42 3,09 3,54 45,78 28/03/2016 2,62 5,18 7,59 3,18 2,39 1,64 3,44 5,11 2,53 1,78 1,42 4,36 2,05 43,28 29/03/2016 2,56 6,03 7,62 3,56 2,29 1,81 3,20 6,49 2,81 2,28 1,67 3,05 2,43 45,80 30/03/2016 3,10 5,08 8,72 2,10 1,87 1,47 2,76 7,39 2,26 1,62 1,80 3,14 3,84 45,15 31/03/2016 3,27 3,88 9,03 3,08 1,98 1,52 3,70 7,53 2,53 1,59 1,76 3,53 3,64 47,04 01/04/2016 3,32 4,46 8,40 2,92 2,06 1,84 3,71 8,68 2,55 1,92 1,43 2,25 2,09 45,64 04/04/2016 2,84 4,50 15,84 3,26 2,16 1,78 2,80 7,06 2,70 1,84 1,43 2,16 2,95 51,33 05/04/2016 3,69 5,92 11,17 2,43 1,95 1,82 2,90 7,57 2,80 2,21 1,47 4,52 3,00 51,44 06/04/2016 3,23 5,31 14,88 3,60 1,84 1,53 3,08 4,35 2,46 1,73 1,55 3,53 2,18 49,27 07/04/2016 3,64 3,92 10,65 2,15 2,38 1,37 2,98 5,07 2,83 1,80 1,52 2,12 3,72 44,14 08/04/2016 3,12 4,16 13,42 3,10 1,92 1,80 3,74 6,19 2,66 2,12 1,70 3,20 3,32 50,45 11/04/2016 3,69 4,91 9,48 2,04 1,82 1,59 2,86 7,49 2,48 1,74 1,76 2,21 2,80 44,87 12/04/2016 2,75 4,28 8,79 3,51 2,24 1,63 3,18 8,73 2,52 2,16 1,68 4,00 2,50 47,96 13/04/2016 4,00 3,10 8,09 4,00 2,14 1,73 3,68 8,55 2,84 1,80 1,50 3,05 3,67 48,15 14/04/2016 3,29 3,40 8,03 2,30 2,10 1,54 3,27 6,22 2,52 1,97 1,62 3,35 2,03 41,63 15/04/2016 2,55 3,98 14,58 3,20 1,92 1,78 3,49 5,11 2,30 1,94 1,41 2,55 2,23 47,04 18/04/2016 3,15 5,96 8,06 3,41 2,24 1,73 3,43 7,67 2,64 1,64 1,70 2,25 2,29 46,17 19/04/2016 2,77 4,21 7,74 3,09 2,22 1,82 3,03 6,38 2,28 1,77 1,45 2,26 2,18 41,20 20/04/2016 3,49 3,20 7,78 3,19 2,16 1,57 3,03 4,11 2,66 1,69 1,67 3,55 2,59 40,70 21/04/2016 3,57 4,86 13,26 2,73 2,46 1,65 3,71 6,95 2,48 1,96 1,75 4,09 3,57 53,04 22/04/2016 2,55 5,51 13,93 3,15 2,31 1,36 3,42 5,75 2,41 1,69 1,81 3,44 3,04 50,38 25/04/2016 2,66 4,23 11,19 2,44 2,16 1,50 2,95 5,70 2,38 1,88 1,59 4,13 3,51 46,33 26/04/2016 4,06 6,90 9,03 3,29 2,25 1,81 3,73 8,19 2,29 1,95 1,63 3,23 2,02 50,38 27/04/2016 3,03 7,08 13,25 3,11 1,99 1,70 3,88 6,39 2,86 2,27 1,56 3,82 2,72 53,65 28/04/2016 3,71 5,91 14,46 2,95 1,89 1,83 3,25 6,05 2,79 1,85 1,78 3,29 2,17 51,93 29/04/2016 2,74 5,53 14,71 3,19 1,93 1,87 3,06 4,89 2,58 1,94 1,42 3,67 2,14 49,67 Tempo total A B

(41)

39

Tabela 6: Ônibus 3 e 6 - Março e Abril

Tabela 7: Ônibus 3 e 6 - Maio e Junho

Data O-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12 12-D 02/05/2016 3,05 5,39 6,57 2,01 2,38 1,88 2,79 7,93 2,28 1,84 1,62 2,36 2,62 42,71 03/05/2016 3,71 4,93 11,51 2,76 1,77 1,66 2,84 8,34 2,79 2,30 1,52 4,47 2,14 50,74 04/05/2016 2,90 4,45 9,90 2,70 1,95 1,61 3,78 8,19 2,92 2,31 1,56 3,57 3,12 48,95 05/05/2016 2,72 4,34 15,71 2,55 1,88 1,71 2,77 8,91 2,92 2,18 1,70 2,44 2,06 51,89 06/05/2016 3,39 5,86 15,84 2,10 1,76 1,55 3,88 4,06 2,34 2,17 1,44 2,40 3,48 50,27 09/05/2016 3,17 4,32 6,57 2,86 2,16 1,55 3,83 8,34 2,84 2,29 1,66 2,75 3,55 45,89 10/05/2016 3,46 5,07 11,88 3,04 2,39 1,89 3,35 5,46 2,77 2,19 1,76 3,95 2,90 50,11 11/05/2016 4,02 4,48 10,12 2,53 2,38 1,62 2,81 7,92 2,65 1,84 1,76 2,22 2,61 46,95 12/05/2016 3,14 3,78 13,21 2,56 1,89 1,73 3,17 5,80 2,96 1,68 1,41 2,60 3,50 47,43 13/05/2016 2,58 4,42 6,81 2,53 1,76 1,79 2,97 7,48 2,89 2,05 1,75 4,42 2,42 43,87 16/05/2016 3,44 4,07 11,79 3,46 2,46 1,61 3,10 7,66 2,55 2,09 1,76 3,91 2,10 50,00 17/05/2016 3,21 4,53 6,95 3,73 1,76 1,50 3,15 5,07 2,20 2,13 1,57 3,67 2,07 41,54 18/05/2016 3,16 5,92 12,88 2,27 2,42 1,87 3,82 4,66 2,27 2,19 1,80 4,70 3,19 51,14 19/05/2016 3,06 4,68 10,31 2,89 2,03 1,67 3,02 8,14 2,52 1,80 1,75 2,20 3,11 47,18 20/05/2016 4,15 4,04 9,42 2,20 2,00 1,71 2,77 6,29 2,38 2,31 1,66 3,21 2,47 44,61 23/05/2016 2,93 5,42 7,85 3,23 2,26 1,59 3,23 5,92 2,49 2,23 1,59 4,02 3,17 45,93 24/05/2016 2,70 3,08 8,89 2,67 2,08 1,79 2,78 6,63 2,38 1,99 1,55 3,25 2,23 42,03 25/05/2016 2,61 6,64 7,52 3,44 2,16 1,87 2,92 5,87 2,68 1,97 1,44 2,90 2,36 44,38 26/05/2016 4,05 3,67 8,50 2,52 1,86 1,69 3,20 4,24 2,87 2,31 1,75 3,96 3,88 44,50 27/05/2016 3,73 3,34 10,33 2,36 1,76 1,47 3,82 5,41 2,64 2,00 1,57 2,29 2,03 42,75 30/05/2016 2,55 4,30 12,42 3,10 1,89 1,75 2,77 5,32 2,41 1,91 1,79 3,54 3,92 47,68 31/05/2016 3,00 3,34 6,52 3,58 2,07 1,79 2,82 8,23 2,44 1,77 1,61 4,57 3,94 45,68 01/06/2016 2,75 7,38 8,04 3,01 1,89 1,58 2,92 7,11 2,32 1,71 1,61 2,44 2,20 44,96 02/06/2016 3,64 3,16 9,91 2,45 2,25 1,59 3,57 7,08 2,35 1,85 1,75 4,06 3,31 46,97 03/06/2016 3,19 5,09 11,63 3,20 1,82 1,38 3,69 7,22 2,66 1,80 1,57 2,24 2,97 48,46 06/06/2016 3,21 6,38 9,52 2,10 2,36 1,37 3,31 4,07 2,25 2,17 1,60 2,50 3,88 44,72 07/06/2016 3,11 5,10 10,97 4,15 2,27 1,49 3,77 6,35 2,93 1,70 1,51 4,72 3,72 51,79 08/06/2016 2,65 4,97 15,42 4,10 1,79 1,40 3,60 7,61 2,69 2,15 1,59 2,15 3,39 53,51 09/06/2016 2,54 4,68 7,47 2,57 2,26 1,42 3,34 8,29 2,58 1,78 1,77 2,67 3,91 45,28 10/06/2016 2,95 3,71 10,65 2,40 1,90 1,89 3,54 6,83 2,39 2,24 1,73 2,75 3,80 46,78 13/06/2016 3,23 5,09 15,88 3,44 2,35 1,41 3,54 5,24 2,64 1,94 1,69 2,11 3,21 51,76 14/06/2016 3,06 3,75 13,05 2,23 1,83 1,63 3,68 8,89 2,39 2,25 1,76 2,51 3,34 50,37 15/06/2016 3,23 6,10 7,69 2,56 1,96 1,42 3,26 4,26 2,74 2,18 1,49 3,53 4,03 44,45 16/06/2016 3,01 3,06 9,61 2,61 2,05 1,69 3,16 4,36 2,69 1,74 1,42 2,33 3,06 40,79 17/06/2016 3,23 3,88 13,05 2,10 1,82 1,88 3,60 6,03 2,25 2,09 1,55 2,16 3,34 46,98 20/06/2016 2,59 4,23 10,68 4,00 2,14 1,76 3,10 8,48 2,38 1,75 1,43 3,26 2,02 47,82 21/06/2016 2,97 3,61 12,33 3,71 1,91 1,89 3,04 6,12 2,53 1,80 1,62 2,92 3,54 47,98 22/06/2016 3,47 5,18 7,42 2,69 2,13 1,64 2,96 5,89 2,70 1,88 1,66 2,92 2,41 42,96 23/06/2016 3,21 5,64 9,29 4,18 1,94 1,78 3,51 6,32 2,68 1,77 1,59 3,52 3,27 48,70 24/06/2016 4,20 3,49 13,20 3,08 1,82 1,81 2,89 7,61 2,39 1,98 1,42 3,07 2,09 49,05 27/06/2016 2,69 5,17 14,85 2,29 1,95 1,48 3,05 4,62 2,31 2,05 1,44 4,65 3,00 49,54 28/06/2016 2,57 3,15 11,07 3,73 2,06 1,36 3,40 8,23 2,74 2,24 1,63 4,33 2,02 48,54 29/06/2016 3,36 3,48 10,52 2,60 1,96 1,52 3,49 4,14 2,36 1,65 1,65 2,05 2,33 41,11 30/06/2016 4,15 4,11 12,72 2,51 2,00 1,57 3,16 9,08 2,19 1,60 1,43 3,30 2,58 50,41 Tempo total A B

(42)

40 4.2 Grafos das rotas

Os pontos em estudo pontos foram mapeados no software open source OpenStreetMap a fim de propor um modelo gráfico de grafos simplista. Seguem em traços diferenciados os pontos de cada linha de ônibus, sendo o décimo primeiro comum às duas, nas seguintes figuras: Figura 8, Figura 9 e Figura 10.

Figura 8: Itinerário da linha de ônibus A - Parte 1

(43)

41

Para melhor entendimento da rota representada pelas figuras acima, definiu-se o grafo da nova rota com as seguintes características: simples, regular e dirigido. Este grafo e suas características são evidenciadas na Figura 11.

Figura 11: Grafo simplificado do caminho analisado

4.3 Tratamento dos dados e remoção de outliers

A partir dos dados coletados acima, foi possível realizar uma análise estatística dos dados, obtendo-se mediana, média, tempo máximo e mínimo para cada par de nós. Essas estatísticas

9 8 7 6 5 3 2 4 1 O 12 D 11 10 B A

(44)

42

de interesse foram utilizadas para identificação e remoção dos dados considerados outliers. Nas duas tabelas abaixo (Tabela 8 e Tabela 9) estão expressas tais estatísticas, sendo todas em minutos.

Tabela 8: Estatísticas para identificação de outliers – Origem até nó 7

Tabela 9: Estatísticas para identificação de outliers – nó 7 até Destino

A partir desta primeira análise percebeu-se que, para cada par de nós, os valores máximos eram maiores que os limites superiores e os valores mínimos eram maiores que os limites inferiores. Isto tornou viável o uso de todos os dados e o estudo foi realizado contemplando todos esses tempos coletados.

O-1 1-2 2-3 3-4 4-5 5-6 6-7 Máximo 4,21 7,38 15,88 4,21 2,48 1,89 3,88 Q3+1,5(Q3-Q1) 4,60 7,94 17,18 4,91 2,73 2,17 4,36 Q3 3,53 5,58 12,03 3,48 2,22 1,78 3,54 Média 3,20 4,83 10,51 3,05 2,07 1,64 3,27 Mediana 3,11 4,76 10,24 3,08 2,05 1,64 3,23 Q1 2,82 4,01 8,60 2,53 1,89 1,52 3,00 Q1-1,5*(Q3-Q1) 1,75 1,65 3,45 1,11 1,39 1,13 2,19 Mínimo 2,50 3,00 6,31 2,00 1,76 1,36 2,76

Estatísticas básicas de interesse Linha A 7-8 8-9 9-10 10-11 11-12 12-D Máximo 9,20 2,96 2,31 1,81 4,72 4,03 Q3+1,5(Q3-Q1) 10,64 3,29 2,62 2,00 5,58 4,78 Q3 7,51 2,74 2,09 1,70 3,78 3,34 Média 6,47 2,56 1,93 1,60 3,26 2,90 Mediana 6,47 2,55 1,92 1,59 3,26 2,90 Q1 5,42 2,38 1,74 1,50 2,58 2,38 Q1-1,5*(Q3-Q1) 2,28 1,84 1,22 1,20 0,78 0,94 Mínimo 4,06 2,19 1,58 1,41 2,04 2,02 Linha B Estatísticas básicas de interesse

Referências

Documentos relacionados

Na experiência em análise, os professores não tiveram formação para tal mudança e foram experimentando e construindo, a seu modo, uma escola de tempo

Para se buscar mais subsídios sobre esse tema, em termos de direito constitucional alemão, ver as lições trazidas na doutrina de Konrad Hesse (1998). Para ele, a garantia

Esta definição poderá servir-nos aqui de ponto de partida para algumas reflexões liminares, em que não pretendo mais do que dar um contributo para a busca

O Ministério do Reino, aler- tado para a situação, ordena ao administrador-geral do distrito de Évora a inventa- riação e a guarda da referida livraria 58 e, em resposta,

A versão reduzida do Questionário de Conhecimentos da Diabetes (Sousa, McIntyre, Martins &amp; Silva. 2015), foi desenvolvido com o objectivo de avaliar o

Fugiu – forma verbal do verbo “fugir”, no Pretérito Perfeito do Indicativo, na 3.ª pessoa do singular. Forma afirmativa: Eu

Quero ir com o avô Markus buscar a Boneca-Mais-Linda-do-Mundo, quero andar de trenó, comer maçãs assadas e pão escuro com geleia (17) de framboesa (18).... – Porque é tão

Este estudo, que tem como objetivo a investigação do imaginário de estudantes de Psicologia sobre o primeiro atendimento clínico, insere-se num