Encaminhamento de pacotes em redes orientadas a conteúdo

(1)

Instituto de Computa¸

c˜

ao

Departamento de Ciˆ

encia da Computa¸

c˜

ao

Ian Vilar Bastos

Victor Costa Macedo Sousa

ENCAMINHAMENTO DE PACOTES EM REDES

ORIENTADAS A CONTE ´

UDO

Niter´

oi-RJ

2015

(2)

ii IAN VILAR BASTOS

VICTOR COSTA MACEDO SOUSA

ENCAMINHAMENTO DE PACOTES EM REDES ORIENTADAS A CONTE ´UDO

Trabalho submetido ao Curso de Bacharelado em Ciência da Computa¸cão da Universidade Federal Fluminense como requisito parcial para a obten¸cão do t´ıtulo de Bacharel em Ciência da Computa¸cão.

Orientador: Prof. Igor Monteiro Moraes

Niter´oi-RJ 2015

(3)

Ficha Catalográfica elaborada pela Biblioteca da Escola de Engenharia e Instituto de Computação da UFF

B327 Bastos, Ian Vilar

Encaminhamento de pacotes em redes orientadas a conteúdo / Ian Vilar Bastos, Victor Costa Macedo Sousa. – Niterói, RJ : [s.n.], 2015.

60 f.

Trabalho (Conclusão de Curso) – Departamento de Computação, Universidade Federal Fluminense, 2015.

Orientador: Igor Monteiro Moraes.

1. Arquitetura de redes de computador. 2. Rede orientada a

conteúdo. 3. Internet. I. Sousa,Victor Costa Macedo. II. Título.

CDD 004.6

(4)

(5)

`

(6)

v

Agradecimentos

Primeiramente, eu, Ian, gostaria de agradecer aos meus pais, Vilma e Roberto, por todo apoio e carinho que sempre me concederam, por estarem sempre presentes, de-monstrando interesse e participando dos meus estudos além de oferecer todas as bases necessárias para minha forma¸cão pessoal e profissional. Em toda sua dedica¸cão nunca foram poupados esfor¸cos para que esse momento pudesse ser realizado, e como esse tra-balho é o resultado de toda essa dedica¸cão, gostaria principalmente de compartilhar essa conquista com eles.

Gostaria de fazer também um agradecimento especial aos meus avós, Maria das Neves, Dulcinéa e Jovino e a toda fam´ılia, que sempre deram muito suporte e conselhos durante todo o curso, o que fez me manter focado e motivado até o fim dessa jornada.

Aos amigos, Humberto, Murilo, Vinicius e Cássio, que compartilhei muitos mo-mentos desses quatro anos e meio. Nossas conversas, fossem elas de questões acadêmicas ou não, sempre foram fundamentais para refletir, passar pelas dificuldades e rir para ter um pouco de descontra¸cão.

Eu, Victor, gostaria de agradecer primeiramente a meus pais, Marcos e Ana, irm˜ao, Allan, e toda a minha familia pelo amor, incentivo e apoio que sempre me deram e a capacidade de acreditar em mim e investir em mim mesmos nos momentos dif´ıceis.

Aos amigos, Leandro, Olavo, Giulio, Matheus, Fabio e Gabriel, companheiros de trabalhos e irmãos na amizade que fizeram parte da minha forma¸cão e que vão continuar presentes em minha vida com certeza.

Ao professor Igor Moraes, por ter se disponibilizado a nos orientar e cumprir sua fun¸cão com toda competência que possui. Agredecemos muito a todos os conselhos, revisões e reuniões, sua dedi¸cão não só nos mostrou a dire¸cão correta para resolver os problemas que surgiram, como teve grande contribui¸cão em nossa evolu¸cão profissional.

(7)

de nossa banca.

Aos professores do instituto de computa¸cão, que, em sua maioria, foram sempre sol´ıcitos e dedicados exercendo sua profissão com grande paixão. Sem dúvidas seus ensina-mentos, dentro e fora da sala de aula, foram de grande importância para o conhecimento adquirido ao longo desses anos.

Aos funcionários do IC/UFF como um todo, assim como os alunos e funcionários do laboratório M´ıdiaCom que nos forneceram grande aux´ılio nesse último semestre.

Por fim, ao CNPq, CAPES, FAPERJ, Proppi/UFF, TBE/ANEEL e CELESC/ANEEL por todos os recursos disponibilizados para que esse trabalho pudesse ser realizado.

(8)

vii

Resumo

Atualmente, os usuários da Internet estão mais interessados em obter conteúdos de interesse independentemente de onde estejam localizados e de quem envie esses conteúdos. Mais de 60% do tráfego atual da Internet são de aplica¸cões com essa caracter´ıstica. O interesse pelo conteúdo independentemente da sua localiza¸cão é a principal premissa para a proposta de novas arquiteturas para Internet, chamadas de Redes Orientadas a Conteúdo. Uma da arquiteturas propostas é a Content Centric Networking (CCN). Nessa arquitetura, os conteúdos são requisitados e encaminhados através de seus nomes, dife-rentemente da Internet atual em que o encaminhamento é baseado no endere¸co IP. Além disso, os elementos da rede realizam armazenamento temporário (caching) dos conteúdos ao encaminharem os conteúdos em dire¸cão a quem os requisitou. Na presen¸ca de uma enorme estrutura distribu´ıda de caching, a localiza¸cão, assim como a disponibilidade dos conteúdos é dinâmica ao longo do tempo, devido à forma na qual os conteúdos estarão dis-tribu´ıdos através da rede. Assim, pode-se argumentar que um mecanismo que investigue a rede por conteúdos armazenados em caches de nós vizinhos em um determinado instante de tempo é mais apropriado do que descobrir e manter uma rota para os produtores de tais conteúdos. Na segunda abordagem, o aumento da disponibilidade só ocorrerá na rota predefinida entre quem requisita e quem produz o conteúdo.

Com isso em mente, esse trabalho propõe uma estratégia de encaminhamento de pacotes para a CCN. A proposta usa a técnica de aprendizado por refor¸co, cuja ideia prin-cipal é realizar um balan¸co entre explorar novos caminhos e se aproveitar da informa¸cão adquirida durante explora¸cões anteriores. As interfaces de um nó da rede são classificadas com base no tempo de recupera¸cão dos conteúdos e todo interesse com o mesmo prefixo para um conteúdo já encaminhado é enviado pela interface com o menor tempo de recu-pera¸cão médio. A explora¸cão é realizada probabilisticamente, na qual cada nó envia o mesmo interesse para a interface melhor classificada e também para uma outra interface

(9)

escolhida aleatoriamente. O objetivo é fazer com que o conteúdo seja entregue pelo me-lhor caminho encontrado até o momento e ao mesmo tempo explorar cópias que possam ter sido armazenadas em caches ainda mais próximos recentemente. Os resultados de simula¸cão mostram que a estratégia proposta reduz o número de saltos cerca de 28% em cada nó e 80% a carga de interesses também por nó em determinados cenários quando comparada às outras estratégias de encaminhamento propostas para a CCN.

Palavras-chave: Redes Orientadas a Conte´udo, CCN, Encaminhamento, Aprendizado por Refor¸co.

(10)

ix

Abstract

Internet users are currently more interested in obtaining contents regardless of where these contents are located or who provides them. More than 60% of the Internet traffic is from applications with these characteristics. The interest in contents regardless of its location is the main assumption of a set of architectures proposed to the Future Internet, called Information Centric Networks (ICN). The Content Centric Networking (CCN) is one of these new architectures. In CCN data is requested and forwarded by using named contents differently from the current Internet architecture, where forwarding is based on IP addresses. Furthermore, core nodes store content replicas after forwar-ding the requested contents to the users. In the presence of such a highly distributed caching infrastructure, content availability and location can vary over the time because of temporary replicas spread across the network. Thus, we argue that a mechanism that investigates the network looking for content replicas stored in cache of neighbor nodes is more appropriate than mechanisms that discover and mantain routes to the location or domain of content producers. In this case, growth of availability will only occur en-route of those who requests and produces the content. With that in mind, this work proposes a packet forwarding strategy for CCN. Our proposal is based on reinforcement learning techniques and aims at balancing the exploration of new paths and data acquired from previous exploitations. The output interfaces of a node are classified according to the content retrieval time and all interests that share the same prefix with contents previ-ously forwarded are sent through the interface with the lowest mean retrieval time. The path exploration is probabilistic. Each node sends the same interest through the best interface and through another interface chosen at random simultaneously. The goal is to retrieve the content by using the best path found until present moment and at the same time explore copies that are recently stored in the cache of nearest nodes. Simulation results shows that the proposed strategy reduces up to 28% the number of hops traversed

(11)

by received contents and up to 80% the interest load per node in comparison to other forwarding strategies.

(12)

Sum´

ario

Resumo vii

Abstract ix

Lista de Figuras xiv

1 Introdu¸c˜ao 1

1.1 Motiva¸c˜ao . . . 3

1.2 Objetivo . . . 5

1.3 Organiza¸c˜ao do Texto . . . 5

2 Redes Orientadas a Conte´udo 6 2.1 Motiva¸c˜ao . . . 6

2.2 Vis˜ao Geral da CCN . . . 8

2.2.1 Nomea¸c˜ao de Conte´udos . . . 9

2.2.2 Processo de Requisi¸cão e Obten¸cão de Conteúdos . . . 11

3 Encaminhamento na Arquitetura CCN 16 3.1 Trabalhos Relacionados . . . 16

3.2 O Problema das M´aquinas Ca¸ca-N´ıqueis . . . 19

3.3 M´etodo A¸c˜ao-Valor . . . 21

3.4 Implementa¸c˜ao Incremental . . . 21

3.5 Rastreando um Problema N˜ao-Estacion´ario . . . 23

3.6 Estrat´egia de Encaminhamento como um Problema das M´aquinas Ca¸ca-N´ıqueis . . . 24

3.6.1 Constru¸c˜ao da Tabela de Encaminhamento . . . 25

3.6.2 O Processo de Encaminhamento e Explora¸c˜ao . . . 26 xi

(13)

4 Modelo de Simula¸c˜ao 29

4.1 Funcionamento B´asico do ndnSIM . . . 29

4.2 A Topologia de Rede Utilizada . . . 31

4.3 Comportamento dos N´os da Rede . . . 31

4.3.1 Publicadores de Conte´udo . . . 32

4.3.2 Consumidor . . . 32

4.3.3 Roteadores . . . 33

5 Resultados 34 5.1 Defini¸cão dos Parâmetros da Estratégia de Encaminhamento Proposta MAB 35 5.2 Compara¸cão das Estratégias de Encaminhamento . . . 37

6 Conclusão 41 6.1 Trabalhos Futuros . . . 42 Referências Bibliográficas 43

(14)

Lista de Figuras

1.1 As dez aplica¸cões que geraram mais tráfego na América Latina em 2014 [1]. 2 2.1 Porcentagem de tráfego downstream em per´ıodo de pico na América do

Norte por aplica¸c˜ao [2]. . . 7

2.2 Compara¸c˜ao da pilha de protocolos TCP/IP e CCN [3]. . . 10

2.3 Nome hier´arquico estruturado [3]. . . 11

2.4 Formato do cabe¸calho dos pacotes na CCN [3]. . . 11

2.5 Estrutura dos mecanismos de um n´o CCN. . . 13

2.6 Processo de encaminhamento de pacotes dos interesse [4]. . . 14

2.7 Processo de encaminhamento dos pacotes de dados [4]. . . 14

2.8 Recupera¸c˜ao de pacotes de dados. . . 15

3.1 M´aquina Ca¸ca-N´ıquel. . . 20

3.2 Entrada da tabela de encaminhamento. . . 25

3.3 Processo decis´orio ao encaminhar um pacote de interesse. . . 26

4.1 A arquitetura do ndnSIM [5]. . . 30

4.2 A Topologia Rocketfuel. . . 32

5.1 Atraso médio por nó em fun¸cão de α. . . 36

5.2 Desvio Padr˜ao. . . 36

5.3 Atraso médio por nó em fun¸cão de ε. . . 37

5.4 Desvio Padr˜ao. . . 37

5.5 M´edia de interesses satisfeitos e interesses recebidos por n´o. . . 37

5.6 Média do número de saltos por nó em fun¸cão da quantidade de consumidores. 38 5.7 Atraso médio por nó em fun¸cão da quantidade de consumidores. . . 38

(15)

5.8 Média da quantidade de pacotes de dados recebidos por nó em fun¸cão da quantidade de consumidores . . . 38 5.9 Média da quantidade de pacotes de interesse recebidos por nó em fun¸cão

da quantidade de consumidores . . . 38 5.10 Média da quantidade de pacotes de dados recebidos por nó para cada cenário. 39 5.11 Média da quantidade de pacotes de interesse recebidos por nó para cada

cenário. . . 39 5.12 Média do número de saltos por nó para cada cenário. . . 40 5.13 Atraso médio por nó para cada cenário. . . 40

(16)

Cap´ıtulo 1

Introdu¸

c˜

ao

No in´ıcio do desenvolvimento da Internet na década de 1970, os principais desafios estavam em torno do compartilhamento de recursos e comunica¸cão eficiente entre siste-mas finais [3]. Esta¸cões interconectadas realizavam troca de informa¸cões, basicamente textuais, como ocorrem nos protocolos de acesso remoto e de correio eletrônico, e com-partilhavam recursos de equipamentos que possu´ıam um alto custo na época e eram de grande importância para os usuários, como impressoras e sistemas de arquivos remotos. Desta forma, a Internet foi desenvolvida em um modelo denominado Cliente-Servidor, no qual um sistema final que queira usar algum tipo de servi¸co, deve requisitar este servi¸co a um outro sistema final espec´ıfico que o forne¸ca e possa atender a essa requisi¸cão. Para tanto, é preciso conhecer a priori o endere¸co de rede do sistema final que hospeda esse servi¸co.

Atualmente, tecnologias de rede empregadas no n´ucleo da rede e em redes de acesso `

a Internet experimentam um aumento significativo de suas capacidades ao mesmo tempo em que o custo de acesso para os usuários finais é reduzido. Assim, há uma populariza¸cão do acesso à Internet, o que permite que novas aplica¸cões e servi¸cos sejam desenvolvidos, como as redes par-a-par (peer-to-peer - P2P) para compartilhamento de arquivos e siste-mas de publica¸cões de v´ıdeos [6]. O uso dessas aplica¸cões acabou se mostrando de grande sucesso. Dados comprovam que 60% do tráfego em 2014 na Internet teve como origem as redes de compartilhamento e de distribui¸cão de conteúdos [1]. A Figura 1.1 mostra que aplica¸cões como YouTube e BitTorrent são l´ıderes de tráfego compartilhado na América Latina. Dessa forma, é poss´ıvel observar uma mudan¸ca nas necessidades dos usuários que utilizam a Internet nesse processo de evolu¸cão, em que se afasta cada vez mais do

(17)

modelo de sistema de informa¸cão textual e se caminha para um modelo multim´ıdia, no qual dados, servi¸cos e aplica¸cões são consumidos como conteúdos [7]. Essa mudan¸ca de perfil enfatiza que o interesse dos usuários está no conteúdo em si, independente da sua localiza¸cão ou de quem o provê.

Figura 1.1: As dez aplica¸cões que geraram mais tráfego na América Latina em 2014 [1]. Uma tentativa de atender às necessidade que surgiram devido à nova caracteriza¸cão da Internet são as redes de distribui¸cão de conteúdos (Content Distribution Network -CDN) [6]. Entretanto, os protocolos utilizados para realizar a distribui¸cão de conteúdos são os mesmos propostos no in´ıcio do desenvolvimento da Internet, ou seja, orientados à arquitetura TCP/IP. Além disso, o princ´ıpio básico de funcionamento da rede continua o mesmo, em que o núcleo se responsabiliza somente por encaminhar as informa¸cões geradas até seus destinos através do endere¸co IP (Internet Protocol ) e a borda possui toda complexidade de gera¸cão e manuten¸cão das conexões. Dessa forma, para muitos pesquisadores, a utiliza¸cão de aplica¸cões voltadas para as redes P2P e CDN em uma arquitetura orientada à conexão torna a Internet de hoje uma “colcha de retalhos” [7].

Uma alternativa ao modelo de comunica¸cão atual da Internet são as Redes Orienta-das a Conteúdo (ROCs) [7, 8]. As ROCs são um novo paradigma de comunica¸cão em que a recupera¸cão dos conteúdos não importando sua origem é destaque. As ROCs utilizam conceitos que divergem do modelo de comunica¸cão atual, como conteúdos e encaminha-mento baseados em nomes, seguran¸ca aplicada ao próprio conteúdo ao invés do canal de comunica¸cão estabelecido entre sistemas finais e a atribui¸cão de uma nova

(18)

responsabi-3 lidade aos roteadores pertencentes ao núcleo da rede, o armazenamento temporário dos conteúdos. [3]. Quando comparadas com a arquitetura atual as ROCs apresentam muitos benef´ıcios em potencial, como maior eficiência na distribui¸cão e localiza¸cão de conte´ u-dos, aumento de sua disponibilidade e menor tempo de resposta percebido pelo usuário final [7]. Contudo, sua implanta¸cão traz inúmeros desafios, dentre eles o encaminhamento baseado em nomes. Nas ROCs todos os elementos da rede potencialmente armazenam as informa¸cões que encaminham com o objetivo de servir requisi¸cões futuras para o mesmo conteúdo.

Como vários caminhos são possivelmente conhecidos para um certo conteúdo, uma nova camada na pilha de protocolos denominada camada de estratégia fica responsável por selecionar uma ou mais interfaces de próximo salto entre o conjunto de possibilidades. A camada de estratégia é o módulo responsável por realizar as retransmissões assim como selecionar quais e quantas das várias interfaces de sa´ıda serão utilizadas para encaminhar as requisi¸cões [3]. Nós intermediários no caminho escolhido podem dispor de cópias arma-zenadas em cache do conteúdo requisitado. Logo, a disponibilidade das diferentes réplicas armazenadas depende de diversos fatores, como a popularidade dos conteúdos e a pol´ıticas de reposi¸cão nos caches, e esses fatores são diretamente influenciados pela estratégia de encaminhamento adotada [9].

1.1 Motiva¸

c˜

ao

Podemos encontrar na literatura relacionada às ROCs duas abordagens coexisten-tes que podem ser exploradas para tratar da requisi¸cão e encaminhamento de informa¸cões. Em longo prazo, protocolos associados ao plano de controle [10, 11, 12] distribuem infor-ma¸cões de disponibilidade dos conteúdos através da rede no intuito de alcan¸car réplicas permanentes que se encontram nos elementos responsáveis por sua produ¸cão ou que pos-suam baixo grau de volatilidade. No modelo atual, em que o foco é a conexão entre sistemas finais, o plano de controle é frequentemente relacionado aos protocolos de rotea-mento como o RIP (Routing Information Protocol ) e o OSPF (Open Shortest Path First ) que especificam como roteadores interagem entre si ao disseminar informa¸cões de estado de vizinha¸ca, possibilitando a escolha de rotas entre dois nós da rede [13]. Em curto prazo nas ROCs, estratégias de encaminhamento no plano de dados [4, 14, 15] se baseiam em

(19)

informa¸cões locais dispon´ıveis em cada nó separadamente, como tempo de recupera¸cão de um conteúdo, quantidade de retransmissões e até mesmo a impossibilidade de utilizar alguma interface de sa´ıda devido a uma falha na rede, o que permite uma rea¸cão rápida `

as constantes mudan¸cas de conectividade e de disponibilidade dos conteúdos encontrados na rede. É poss´ıvel perceber a diferen¸ca no uso do plano de dados entre os paradigmas, já que, a abordagem utilizada atualmente realiza a escolha de por qual interface encaminhar os dados recebidos ao consultar informa¸cões previamente disponibilizadas pelos algorit-mos presentes no plano de controle após os roteadores convergirem para a mesma visão topológica.

Um protocolo de roteamento baseado em nome ideal necessitaria endere¸car todas as réplicas temporárias de todos os conteúdos a fim de encaminhar a requisi¸cão dos usuários na dire¸cão da “melhor” réplica dispon´ıvel se baseando em alguma métrica, como mais próxima ou com menor tempo de resposta. Entretanto, um mecanismo como esse descrito é claramente inviável por três principais razões: a escala da rede, a volatilidade nos caches e a explosão da tabela de encaminhamento [9]. O paradigma proposto pelas ROCs se aplica aos conteúdos de diversas aplica¸cões e não foi projetado para operar em regiões pequenas e controladas. Réplicas temporárias armazenadas pelos elementos da rede são altamente voláteis e, dessa forma, a sobrecarga de sinaliza¸cão frequente para atualiza¸cão de rotas seria imenso. Além disso, é poss´ıvel considerar uma preocupa¸cão simplesmente endere¸car os conteúdos que ficam armazenados nos elementos que os produzem antes mesmo de cogitar as réplicas temporárias armazenadas em cache. A quantidade de endere¸cos IP está na casa dos bilhões enquanto que a quantidade de URLs indexadas pelo Google já está na casa do trilhões [16].

Seguindo a abordagem de uma estratégia de encaminhamento no plano de dados é poss´ıvel localizar eficientemente réplicas temporárias sem a necessidade de ficar sujeito à sobrecarga de sinaliza¸cão expl´ıcita para descobrir sua localiza¸cão. Para alcan¸car tal obje-tivo, realizar uma explora¸cão restrita na rede com o intuito de ajustar o encaminhamento conforme o estado momentâneo da rede pode reduzir o tamanho das tabelas de enca-minhamento com o custo de uma comunica¸cão um pouco mais intensa, mas que poderá beneficiar terceiros com o aumento da disponibilidade dos conteúdos em nós vizinhos.

(20)

5

1.2 Objetivo

O objetivo desse trabalho é propor e analisar uma estratégia de encaminhamento baseada na técnica de aprendizado por refor¸co denominada ε − greedy. Na estratégia pro-posta, explora-se probabilisticamente caminhos alternativos em busca da melhor interface de sa´ıda de acordo com o tempo de resposta. Esse tempo é definido como o que leva para obter o conteúdo assim que o interesse por ele é enviado na rede. A finalidade dessa abordagem é localizar as réplicas temporárias mais próximas e, assim, reduzir o tempo de entrega dessas réplicas percebido pelo usuário final.

1.3 Organiza¸

c˜

ao do Texto

O restante deste trabalho está organizado como descrito a seguir. Os aspectos e caracter´ısticas básicas do funcionamento da CCN são discutidos no Cap´ıtulo 2. O Cap´ı-tulo 3 apresenta os trabalhos relacionados, introduz os conceitos estudados do problema das máquinas ca¸ca-n´ıqueis e os contextualiza com as redes CCN e a implementa¸cão da estratégia proposta. O Cap´ıtulo 4 discute os parâmetros e cenários de simula¸cão e o Ca-p´ıtulo 5 os resultados obtidos. Finalmente, o CaCa-p´ıtulo 6 conclui o trabalho realizado e mostra dire¸cões para trabalhos futuros.

(21)

Cap´ıtulo 2

Redes Orientadas a Conte´

udo

2.1 Motiva¸

c˜

ao

A populariza¸cão da Internet permitiu que a comunica¸cão ultrapassasse barreiras que, na época da cria¸cão da rede de computadores, eram imposs´ıveis de serem previstas. Em 1967, teve in´ıcio o desenvolvimento da ARPANET, a primeira rede baseada na técnica de comuta¸cão de pacotes e que é considerada o embrião da Internet. O objetivo da AR-PANET era basicamente interconectar sistemas de computa¸cão para permitir o trabalho cooperativo de grupos de pesquisa espalhados geograficamente e o compartilhamento de recursos cient´ıficos e militares.

Desde a sua cria¸cão, a Internet segue o princ´ıpio básico de funcionamento em que o núcleo da rede possui como principal responsabilidade encaminhar as mensagens geradas pelas aplica¸cões com base no endere¸co de destino anexado a elas, e toda complexidade da gera¸cão e manuten¸cão da troca de informa¸cões sendo mantida nas bordas. Os roteadores empregam a pol´ıtica do melhor esfor¸co, em que não é realizada qualquer distin¸cão ou garantia da entrega dos dados que recebem para encaminhar, resultando em varia¸cões na latência e uma entrega não confiável dos dados. Todas as modifica¸cões que foram introduzidas ao longo dos anos para acomodar o crescente uso da Internet, como por exemplo o NAT (Network Address Translation), DNS (Domain Name System) e o SSL (Secure Sockets Layer ) continuam atuando em elementos como roteadores de borda e sistemas finais [13, 7].

Mesmo não havendo modifica¸cões nos conceitos originais de funcionamento, o perfil dos usuários e das aplica¸cões utilizadas na Internet mudou radicalmente. E poss´ıvel´

(22)

7 perceber que a própria exibi¸cão de uma página Web em um navegador representa uma mudan¸ca de paradigma. A inser¸cão de Web caches na rede permite que a requisi¸cão de uma página possa ser atendida por qualquer elemento que possua essa página armazenada, não sendo mais estritamente necessário efetuar uma conexão fim-a-fim com o servidor Web. Consequentemente, exibir uma página Web passa a ser visto como a entrega de um bloco de dados nomeado e identificado por um endere¸co de recurso (Uniform Resource Locator - URL) [17].

Atualmente, a Internet é utilizada principalmente para gera¸cão, compartilhamento e recupera¸cão de conteúdos [6, 18]. Navega¸cão Web, chamadas de voz e v´ıdeo, sistemas de publica¸cão de v´ıdeos e sistemas de compartilhamento de arquivos ilustram esse novo perfil. Estudos estimam que a soma de tráfego de todas as formas de distribui¸cão de v´ıdeo (e.g. TV, v´ıdeo sob demanda (VoD), Internet e P2P) estará no intervalo de 80% a 90% do tráfego global consumido em 2018 [19], sendo que aplica¸cões como o BitTorrent são as mais comumente utilizadas para obter esses tipos de conteúdo que possuem como forte caracter´ıstica a obten¸cão dos dados não importando a sua origem.

Figura 2.1: Porcentagem de tráfego downstream em per´ıodo de pico na América do Norte por aplica¸cão [2].

Apesar da arquitetura atual da Internet suportar muitas aplica¸cões com essas ca-racter´ısticas de compartilhamento e recupera¸cão de conteúdos (e.g. Netflix, BitTorrent e YouTube), se faz necessária uma arquitetura que realize de forma mais eficiente a

(23)

distri-bui¸cão de conteúdos, aumente sua disponibilidade e dê suporte intr´ınseco de seguran¸ca [7]. Para esse fim, surgiram então, diversas propostas de arquiteturas de redes orien-tadas a conteúdo (ROCs) na literatura, todas com o mesmo objetivo: propor um arqui-tetura de rede que busca satisfazer os critérios de eficiência e seguran¸ca na entrega de conteúdos [7, 8]. Mesmo com algumas diferen¸cas de implementa¸cão, todas as arquiteturas defendem três princ´ıpios fundamentais: (i) recupera¸cão de conteúdos através de requisi¸cão e resposta, (ii) armazenamento temporário de conteúdos em todos os nós da rede e (iii) seguran¸ca aplicada no próprio conteúdo [20].

A proposta deste novo paradigma muda o foco da conexão fim-a-fim para os con-teúdos. Na próxima se¸cão serão explicados detalhadamente os conceitos utilizados na arquitetura Content-Centric Networking1 _{[3]. Em raz˜}_{ao de ser a arquitetura com maior}

número de trabalhos propostos desde sua cria¸cão, além de possuir a organiza¸cão de um consórcio conjunto entre universidades e a indústria no intuito de promover um desenvol-vimento mais acelerado de seus procolos [21], foi a arquitetura escolhida para realiza¸cão deste trabalho.

2.2 Vis˜

ao Geral da CCN

A CCN (Content-Centric Networking - CCN) [3] é uma arquitetura de rede pro-jetada com base no paradigma das ROCs. Quando um usuário, na Internet atual, deseja obter uma informa¸cão de interesse, ele precisa requisitá-la diretamente ao servidor em que está armazenada utilizando um URL ou através de seu endere¸co IP. Diferentemente do modelo de comunica¸cão utilizado hoje, a CCN permite que usuários, também chamados de consumidores, possam requisitar um conteúdo através de seu nome, sem se preocupar onde os conteúdos estão armazenados e de onde serão recuperados. Dessa forma, a infra-estrutura da rede fica responsável por localizar e entregar tal conteúdo ao usuário que o requisitou.

Para aumentar a disponibilidade dos conteúdos, além de proporcionar uma maior eficiência em sua recupera¸cão, os elementos intermediários da CCN, denominados rotea-dores de conteúdo, mantém temporariamente em cache os conteúdos que são previamente encaminhados por ele. Assim, requisi¸cões futuras para o mesmo conteúdo podem ser

(24)

9 didas e recuperadas pelo cache mais próximo, reduzindo o tempo de resposta percebido pelo usuário e o consumo de largura de banda no núcleo da rede [22].

A estrutura adotada pela CCN apresenta algumas diferen¸cas em rela¸cão à arquite-tura TCP/IP, como pode ser visto na Figura 2.2. É poss´ıvel observar que a “cintura fina” na pilha CCN passa a ser os fragmentos ou partes dos próprios conteúdos, os chunks, e não mais o protocolo IP, visto na arquitetura atual. Essa caracter´ıstica evidencia a im-portância do conteúdo. Outra diferen¸ca é uma camada espec´ıfica para seguran¸ca. Visto que os dados podem ser recuperados a partir de qualquer elemento da rede, sendo eles confiáveis ou não, é necessário garantir a autenticidade e integridade do conteúdo obtido, mas sem a obriga¸cão de assegurar que essas mesmas propriedades sejam satisfeitas em toda infraestrutura da rede. E, por último, outra caracter´ıstica de destaque é a inclusão da camada de estratégia na pilha CCN.

A ausência de loops na CCN possibilita que várias interfaces sejam selecionadas ao mesmo tempo para que os pacotes sejam encaminhados, dispondo de qualquer tecnologia dispon´ıvel, como Ethernet, Bluetooth, 3G, IEEE 802.11, dentre outras. Como encaminhar os pacotes através de todas as interfaces dispon´ıveis pode levar a um uso inadequado dos recursos da infraestrutura de rede, os roteadores podem adotar diferentes estratégias de encaminhamento para decidir quais interfaces serão escolhidas para propagar a requisi-¸cão pelos conteúdos. Este trabalho aborda o uso de uma estratégia de encaminhamento baseada em uma técnica de aprendizado de máquina por refor¸co [23], batizada de MAB (Multi-Armed Bandits), e será detalhada nas Se¸cões 3.6.1 e 3.6.2. Uma caracter´ıstica interessante é que mesmo adotando diferentes paradigmas de comunica¸cão, a CCN pode coexistir com o protocolo IP, permitindo que essa arquitetura seja implantada de forma incremental na Internet.

2.2.1 Nomea¸

c˜

ao de Conte´

udos

Os nós pertencentes à CCN realizam o encaminhamento de pacotes utilizando o nome do conteúdo presente nos próprios pacotes para decidir quais interfaces devem ser selecionadas. A fim de que informa¸cões relevantes possam ser extra´ıdas dos nomes e aproveitadas na consulta da tabela de encaminhamento, os nomes necessitam de uma estrutura que possa ser reconhecida pelos nós da rede. Para esse objetivo, a CCN adota uma estrutura de nomea¸cão muito semelhante à empregada nos URLs.

(25)

Figura 2.2: Compara¸c˜ao da pilha de protocolos TCP/IP e CCN [3].

Os nomes são compostos por um conjunto variável de componentes que são separa-dos entre si pelo caractere “/” indicando uma posi¸cão hierárquica dentro da estrutura [3]. Os nomes que são concedidos aos conteúdos não possuem nenhum significado semântico para os roteadores, sua fun¸cão para os elementos centrais da rede está na hierarquia atri-bu´ıda, de forma a instruir como o encaminhamento deve ser realizado. Consequentemente, os publicadores de conteúdo podem adotar um padrão de nomea¸cão que lhes seja mais conveniente, desde que a estrutura hierárquica seja respeitada. Por exemplo, se os alunos ou futuros alunos da Universidade Federal Fluminense desejam assistir o v´ıdeo de apre-senta¸cão da universidade, a institui¸cão pode disponibilizá-lo em sua página Web principal com o seguinte nome /br.uff/video/intro.avi.

´

E importante notar que na ausência de motores de busca, os usuários deverão ter conhecimento do nome e, portanto, da estrutura hierárquica dos conteúdos que pretendem requisitar. Dessa forma, é fundamental que os nomes sejam boas representa¸cões dos conteúdos e de sua posi¸cão hierárquica.

O uso desse modelo de nomea¸cão facilita a composi¸cão de relacionamentos entre os chunks pertencentes ao mesmo conteúdo, ilustrado na Figura 2.3. Por exemplo, o quarto chunk da primeira versão do v´ıdeo “intro.avi” poderia ser nomeado como “/br.uff” sendo o dom´ınio da institui¸cão, no qual os pacotes de interesse serão encaminhados caso nenhum roteador intermediário possua uma cópia do conteúdo requisitado. Os compo-nentes “/video/intro.avi” sendo a estrutura hieráquica organizacional em que os diferentes conteúdos do publicador deste dom´ınio poderão ser disponibilizados e encontrados. E,

(26)

11 por fim, os componentes “/1/4” representam que o consumidor deseja o quarto chunk da primeira versão do conteúdo. Assim, uma requisi¸cão à intro.avi utilizando o nome /br.uff/video/intro.avi poderia fazer referência ao primeiro chunk deste conteúdo e atra-vés de informa¸cões contidas em seu cabe¸calho, a aplica¸cão utilizada pelo consumidor seria capaz de requisitar os demais chunks.

Figura 2.3: Nome hier´arquico estruturado [3].

2.2.2 Processo de Requisi¸

c˜

ao e Obten¸

c˜

ao de Conte´

udos

A CCN possui somente dois tipos de pacotes, os pacotes de interesse (interest packets) que são utilizados para requisitar um conteúdo, e os pacotes de dados (data packets) que são utilizados para recuperar um conteúdo. O cabe¸calho que compõe cada um dos pacotes é ilustrado na Figura 2.4. O processo de recupera¸cão de um conteúdo na CCN é baseado no modelo Requisi¸cão-Resposta, semelhante ao modelo usado no procolo HTTP, no qual entidades, denominadas publicadores, providenciam conteúdos na rede e os usuários, denominados consumidores, requisitam tais conteúdos.

Figura 2.4: Formato do cabe¸calho dos pacotes na CCN [3].

(27)

conteúdos trafegados na rede e reduzir o seu tempo de recupera¸cão observado pelos usu´ a-rios finais. Dessa forma, a CCN estabelece que cada nó da rede, incluindo os roteadores, realizem cache de conteúdos. Assim, ao receber um pacote de dados, o nó o armazena em uma estrutura chamada armazém de conteúdos (Content Store - CS). Consequentemente, requisi¸cões futuras a esse mesmo conteúdo podem ser atendidas de forma imediata, sem que o pacote de interesse necessite ser encaminhado até a entidade que o publicou.

Os nós da CCN contam com mais duas outras importantes estruturas além do CS, conhecidas como tabela de interesses pendentes (Pending Interest Table - PIT) e a base de informa¸cões para encaminhamento (Forwarding Information Base - FIB).

A PIT possui como responsabilidade manter uma indexa¸cão entre os prefixos en-caminhados pelo nó e todas as interfaces de entrada por onde pacotes de interesse de um mesmo conteúdo foram recebidos. Essa indexa¸cão facilita a agrega¸cão dos nomes dos conteúdos no encaminhamento dos pacotes de dados, aumentando o desempenho da co-munica¸cão. Gra¸cas ao mecanismo da PIT, todo roteador, ao encaminhar um pacote de interesse, possui a garantia que o pacote de dados correspondente irá passar por ele no caminho de volta até o consumidor que o requisitou.

A FIB é a tabela encarregada pela decisão de qual ou quais interfaces de sa´ıda serão selecionadas para encaminhar um pacote de interesse. As tabelas de encaminhamento na rede CCN relacionam dom´ınios roteáveis na forma de prefixos de nome a um conjunto de interfaces de sa´ıda, muito diferente das entradas na tabela das redes IP, no qual endere¸cos IP são associados à uma única interface. Para evitar que loops sejam formados pelo encaminhamento de um mesmo pacote de interesse via múltiplas interfaces, esses pacotes possuem um número único gerado aleatoriamente (nonce) que é usado para distinguir interesses recém recebidos de interesses previamente encaminhados.

Em vista das estruturas e mecanismos mencionados, conforme mostrado na Figura 2.5, o processo de recupera¸cão de um conteúdo ocorre da seguinte maneira. Para requisitar um conteúdo, o consumidor envia um pacote de interesse à rede com no m´ınimo o prefixo do conteúdo desejado. Ao receber o interesse, o roteador CCN extrai o prefixo do conteúdo e faz uma busca em seu CS por uma correspondência exata. Caso possua o conteúdo correspondente, o roteador gera um pacote de dados e o encaminha pela interface de chegada do interesse. Caso contrário, o roteador procura por uma entrada na PIT que contenha o prefixo. Em caso afirmativo, o roteador verifica se o nonce do interesse recebido

(28)

13

Figura 2.5: Estrutura dos mecanismos de um n´o CCN.

já está presente na entrada indicando que este já foi previamente encaminhado e deve ser descartado. Caso contrário, o roteador agrega a interface de recep¸cão do interesse à entrada da PIT. Caso nenhuma entrada da PIT seja encontrada, o roteador realiza uma busca de maior prefixo em sua FIB, com o objetivo de encontrar nós vizinhos que possam atender tal requisi¸cão. Se nenhuma interface de sa´ıda é encontrada para o prefixo do conteúdo, o pacote de interesse é então descartado e um NACK (negative acknowledgment ) é enviado indicando a impossibilidade de atender e encaminhar o interesse. Se uma ou mais interfaces estiverem dispon´ıveis, o roteador recorre à camada de estratégia para decidir por quais interfaces encaminhar o interesse. O processo está ilustrado na Figura 2.6.

Quando o pacote de dados ´e recebido por um roteador, ele verifica se na PIT existem um ou mais interesses pendentes para o conte´udo contido no pacote de dados.

(29)

Figura 2.6: Processo de encaminhamento de pacotes dos interesse [4].

Caso exista, a entrada da PIT é removida, o conteúdo é armazenado na CS para atender a futuros pacotes de interesses, e o pacote de dados é enviado para todas as interfaces que requisitaram aquele conteúdo anteriormente. Caso contrário, o pacote de dados é descartado. A Figura 2.7 ilustra o processo.

Figura 2.7: Processo de encaminhamento dos pacotes de dados [4].

Caso nenhum roteador, que o interesse tenha percorrido, possua uma cópia do conteúdo requisitado armazenado em seu cache, o pacote de interesse é encaminhado pelos nós da rede até que o seu publicador seja encontrado. O publicador, na CCN o nó responsável por disponibilizar os conteúdos aos consumidores, então reconhece que o

(30)

15 pacote de interesse é referente a um conteúdo o qual ele provê e, assim, monta o pacote de dados que é enviado pela mesma interface no qual o pacote de interesse foi recebido. Por exemplo, na Figura 2.8 o nó “br.uff” é o publicador de conteúdo que deve atender a uma requisi¸cão do Cliente1. Note que a partir do instante 3 o conteúdo já se encontra nos caches dos roteadores e quando Cliente2 envia um pacote de interesse para o mesmo conteúdo que o Cliente1 tinha enviado anteriormente o roteador C é capaz de satisfazer a requisi¸cão sem precisar encaminhar o interesse até o publicador de conteúdos.

(31)

Cap´ıtulo 3

Encaminhamento na Arquitetura

CCN

Os nós na CCN encaminham os conteúdos ao extrair o prefixo de nome contido no cabe¸calho do pacote de interesse ao invés de usar a localiza¸cão do nó publicador e, assim, desassocia-se conteúdo e seu local de recupera¸cão [3]. Devido aos roteadores pertencentes ao núcleo da rede realizarem armazenamento temporário de conteúdos, abre-se um leque de atraentes possibilidades que podem ser empregadas na estratégia de encaminhamento para essa arquitetura. Nas redes IP, o roteamento determina o menor caminho entre origem e destino enquanto que o encaminhamento, a cada roteador, transfere o pacote da interface de entrada para a interface de sa´ıda que faz parte desse menor caminho. Na CCN os roteadores podem dinamicamente selecionar múltiplas interfaces de sua FIB para encaminhar o mesmo pacote de interesse além de poder recuperar o conteúdo de múltiplas fontes diferentes, sejam elas publicadores ou roteadores [3]. Em vista disso, um mecanismo que explore essas múltiplas possibilidade pode se encaixar melhor no perfil da arquitetura, do que simplesmente manter rotas de menor caminho do consumidor até um produtor de conteúdos.

3.1 Trabalhos Relacionados

Pesquisas anteriores sobre encaminhamento em ROCs progrediram em duas di-re¸c˜oes diferentes. Por um lado protocolos de roteamento operando no plano de con-trole [11, 10, 12] possuem a finalidade de disseminar as informa¸c˜oes contidas na FIB

(32)

17 que endere¸cam réplicas permanentes. O protocolo de roteamento baseado em nomes OSPFn [10] realiza anúncio dos prefixos de nomes de conteúdos permanentes, que po-dem ser obtidos com os interesses encaminhados até o produtor que detém as réplicas permanentes.

Na outra dire¸cão, trabalhos com o foco em estratégias de encaminhamento no plano dos dados [14, 4, 15] possuem como finalidade a recupera¸cão de réplicas voláteis seguindo alguma métrica, como a mais próxima ou a com o menor tempo de resposta. A principal vantagem dessa abordagem em rela¸cão à anterior é a possibilidade de recuperar réplicas temporárias sem a necessidade de ficar sujeito à sobrecarga de sinaliza¸cão expl´ıcita para descobrir sua localiza¸cão. Dessa forma, realizar uma explora¸cão restrita na rede no intuito de ajustar o encaminhamento conforme o estado momentâneo da rede pode reduzir o tamanho das tabelas de encaminhamento [9] em troca de uma comunica¸cão um pouco mais intensa, mas que poderá beneficiar terceiros com o aumento da disponibilidade dos conteúdo com réplicas armazenadas em nós vizinhos.

Em particular, Chiocchetti et al. 2012 evidenciam que usar somente o primeiro chunk de um conteúdo em um mecanismo de explora¸cão reduz o tempo de recupera¸cão dos conteúdos requisitados pelos consumidores e permite que réplicas temporárias ar-mazenadas em caches de nós mais próximos sejam encontradas. Mostram também que uma estratégia de encaminhamento que faz o uso de explora¸cões se beneficia de múltiplos produtores de um mesmo conteúdo [9]. Posteriormente, partindo da ideia de explorar esporadicamente a rede, Chiocchetti et al. 2013 utilizam a técnica Q-learning de apren-dizado por refor¸co distribuidamente em cada nó da rede. A estratégia possui duas fases que ocorrem em momentos distintos, a fase de explora¸cão e a fase de aproveitamento do conhecimento adquirido. Durante a fase de explora¸cão os nós sondam suas interfaces, uma por vez a cada pacote de interesse recebido de forma aleatória, com o objetivo de aprender qual delas retorna a melhor recompensa, ou seja, possui menor tempo de recu-pera¸cão para o conteúdo requisitado. A fase de explora¸cão dura até que um número de chunks predefinido seja alcan¸cado, dando in´ıcio a fase de aproveitamento. Essa fase possui como objetivo utilizar toda a informa¸cão adquirida durante a explora¸cão para minimizar o tempo de recupera¸cão dos conteúdos ao encaminhar os pacotes de interesse somente pela interface que produziu o menor tempo estimado para o espec´ıfico conteúdo. Sua dura¸cão termina quando uma mudan¸ca não desprez´ıvel é identificada no tempo de recupera¸cão a

(33)

partir daquela interface ou quando um número predeterminado de chunks foi enviado por ela. Por fim, entradas da tabela de encaminhamento que não são atualizadas durante um certo tempo, também predefinido, acabam por ser apagadas por estarem obsoletas [14].

Por último, Yi et al. 2012 introduzem uma abordagem dinâmica na qual as inter-faces são sondadas periodicamente e estat´ısticas são coletadas para cada uma delas [4]. Cada prefixo de nome presente em sua FIB possui uma lista de interfaces associadas a três parâmetros, uma estimativa para o tempo de recupera¸cão semelhante à empregada no protocolo TCP (Transmission Control Protocol ), uma taxa limite para envio de pacotes de interesse e uma taxa limite para recebimento de pacotes de dados. Ambas as taxas possuem como objetivo o controle de congestionamento e são calculadas pela razão entre a capacidade da fila da interface e o tamanho médio dos pacotes de dados trafegados por ela, sendo a razão multiplicada por uma constante. Quando uma interface acaba de ser conectada ou uma nova entrada da FIB é criada, o estado dessa interface é atribu´ıdo como amarelo. Outra forma de a interface ser classificada com essa cor ocorre quando sua cor é verde e o tempo estimado para que um pacotes de dados retorne por ela seja estourado. Ela se torna verde quando pacotes de dados são recebidos por ela, e se torna vermelha caso deixa de funcionar, um pacote NACK com uma mensagem “sem caminhos dispon´ı-veis” é recebido ou alguma das taxas limite é ultrapassada. As interfaces de cor verde e amarela são ranqueadas de acordo com a estimativa do tempo de recupera¸cão. Cada novo interesse recebido é enviado utilizando a interface de cor verde melhor ranqueada para o prefixo de nome contido no interesse. Caso não possua interfaces de cor verde, utiliza-se a interface de cor amarela melhor ranqueada. Ao receber interesses retransmitidos, ou seja, seus nonces ainda estão presentes em entradas da PIT, a estratégia de encaminhamento verifica se o tempo estimado para a recupera¸cão do conteúdo pela interface utilizada foi excedido. Em caso afirmativo, encaminha-se o interesse retransmitido pela interface verde ou amarela melhor ranqueada se dispon´ıvel. Quando um NACK por um prefixo de nome é recebido pela interface utilizada, interfaces classificadas com cor amarela são exploradas até que um pacote de dados seja recebido ou seu tempo estimado para a recupera¸cão do conteúdo chega ao fim.

A MAB, estratégia proposta nesse trabalho, apresenta um artif´ıcio para identifi-car que um dado conteúdo está inacess´ıvel por alguma interface de sa´ıda, o que não é encontrado no trabalho realizado por Chiocchetti et al. 2013. A ausência de um

(34)

meca-19 nismo para identifica¸cão de falhas na rede em uma estratégia de encaminhamento que decide a melhor interface de sa´ıda com base no tempo de recupera¸cão dos conteúdos pode prejudicar gravemente seu funcionamento. Não receber um pacote de dados implica na não atualizacão da entrada da tabela de encaminhamento correspondente a interface “de-feituosa” e, no caso de ter sido classificada anteriormente como “melhor” interface, o nó continuará enviando interesses por ela sem que os conteúdos sejam recebidos. O meca-nismo apresentado por Yi et al. 2012 utiliza pacotes NACK para identificar e avisar a ocorrência de falhas na rede. Entretanto, seu modelo de explora¸cão tem como objetivo auxiliar os nós da rede em recuperar seus conteúdos de interesse em momentos de conges-tionamento da rede, mas não explora caminhos alternativos que possam levar a réplicas mais próximas. A estratégia proposta realiza explora¸cões probabilisticamente ao invés de usar a fase de explora¸cão e esperar uma certa convergência como em Chiocchetti et al. 2013, mas aproveita a ideia dos autores de utilizar uma única interface de sa´ıda quando não está explorando e duas interfaces de sa´ıda quando está. Também realiza deteçcão de falhas na rede ao usar um limiar de retransmissões, diferentemente de Yi et al. 2012 que usam um pacote de controle. Esses mecanismos da estratégia de encaminhamento serão detalhados nas Se¸cões 3.6.1 e 3.6.2.

3.2 O Problema das M´

aquinas Ca¸

ca-N´ıqueis

Considere o seguinte problema de aprendizado. Você está repetidamente diante de uma escolha entre n diferentes op¸cões, ou a¸cões. Depois de cada escolha, recebe uma recompensa numérica que é atribu´ıda através de uma distribui¸cão de probabilidade e depende da a¸cão selecionada. O objetivo é maximizar a recompensa total esperada durante um per´ıodo ou instantes de tempo.

Essa é a forma original do problema das máquinas ca¸ca-n´ıqueis (Multi-Armed Ban-dits), nomeado por uma analogia na qual múltiplas máquinas estão dispon´ıveis para serem selecionadas. Cada a¸cão de selecionar é semelhante à puxar a alavanca de uma das m´ a-quinas, e as recompensas são os pagamentos por obter o jackpot. Através de repetidas sele¸cões, pode-se maximar o ganho ao concentrar as a¸cões nas melhores máquinas.

Cada a¸cão de sele¸cão possui uma recompensa média esperada, que pode ser de-nominada o valor dessa a¸cão. Caso o valor de cada a¸cão já fosse conhecido, resolver o

(35)

Figura 3.1: M´aquina Ca¸ca-N´ıquel.

problema das máquinas ca¸ca-n´ıqueis seria trivial, sempre seria escolhida a a¸cão que pro-duzisse o maior valor. Entretanto não é poss´ıvel saber o valor das a¸cões com certeza, mas é poss´ıvel manter estimativas.

Ao manter essas estimativas, em cada instante de tempo existe pelo menos uma a¸cão no qual o valor da estimativa é o maior. Essa a¸cão é chamada de gulosa (greedy). Ao selecionar a a¸cão gulosa, é dito que o conhecimento adquirido ao guardar os valores de cada a¸cão está sendo aproveitado. Caso uma das a¸cões não gulosas seja escolhida, é dito que a¸cões alternativas estão sendo exploradas para que suas estimativas sejam aperfei¸coadas. Dessa forma, a a¸cão gulosa é a melhor escolha a ser feita para maximizar a recompensa esperada em um determinado instante de tempo, entretanto, explorar a¸cões alternativas pode produzir uma maior recompensa acumulada a longo prazo.

No contexto da CCN, as máquinas podem ser associadas às interfaces presentes em cada nó da rede. Toda vez que um interesse é recebido por um nó e o conteúdo não se encontra presente em seu cache, e não possui uma entrada na PIT indicando um encaminhamento anterior para o mesmo interesse, o nó estará diante do mesmo problema que o apostador ao precisar escolher uma ou mais interfaces para encaminhá-lo.

A partir deste ponto, o restante do cap´ıtulo está organizado da seguinte forma. A Se¸cão 3.3 apresenta como as recompensas são coletadas e suas estimativas são calculadas. A Se¸cão 3.4 indica uma reformula¸cão para o cálculo das recompensas esperadas, no qual o m´ınimo de estado é armazenado além de uma computa¸cão com complexidade constante para o cálculo das estimativas. A Se¸cão 3.5 discute como uma pequena mudan¸ca na formu-la¸cão matemática adequa o cálculo das recompensas à um problema não-estacionário. Por fim, a Se¸cão 3.6 introduz a MAB, estratégia de encaminhamento proposta nesse trabalho.

(36)

21

3.3 M´

etodo A¸

c˜

ao-Valor

Nessa se¸cão é apresentado um método simples para estimar os valores das a¸cões e utilizar essas estimativas nos momentos em que a decisão de qual a¸cão deve ser selecionada é tomada. Para efeito de conven¸cão, o verdadeiro valor de uma a¸cão a é denotado por q∗(a), e o seu valor estimado no t-ésimo instante de tempo por Qt(a). Lembrando que o

verdadeiro valor de uma a¸cão é a recompensa recebida depois de a a¸cão a ser selecionada. Desse modo, uma forma de realizar a estimativa de uma a¸cão é simplesmente fazer a média de cada recompensa recebida quando a mesma foi escolhida, ou seja, se no t-ésimo instante de tempo a a¸cão a foi escolhida Ka vezes antes de t, produzindo as recompensas

R1, R2, ..., RKa, ent˜ao seu valor estimado ´e:

Qt(a) =

R1+ R2+ ... + RKa

Ka

(3.1) Caso Ka = 0, define-se um valor padr˜ao para Q1(a). Quando Ka→ ∞, pela lei dos

grandes números, Qt(a) converge para q∗(a). Esse método é denominado de aproxima¸cão

pela média das amostras. A regra mais simples em selecionar uma a¸cão é a de selecionar a que possui o maior valor estimado, isto é, no instante de tempo t escolher a a¸cão gulosa, A∗_t, no qual Qt(A∗t) = maxaQt(a).

Esse método sempre usufrui do conhecimento obtido para maximizar a recompensa imediata, não realizando em momento algum amostragem de a¸cões com valor de recom-pensa inferior. Uma alternativa simples é a de se comportar de forma gulosa na maior parte do tempo, mas de vez em quando, com probabilidade ε, selecionar de forma aleat´ o-ria entre todas as poss´ıveis a¸cões com igual probabilidade, independentemente dos valores de recompensa. Métodos que utilizam essa regra quase gulosa de selecionar a¸cões são denominados ε − greedy. A vantagem destes métodos está em que, no limite em que o número de sele¸cões aumenta, todas as a¸cões serão escolhidas infinitas vezes, garatindo que Ka → ∞ ∀ a, e garantindo assim que todos Qt(a) convirjam para q∗(a).

3.4 Implementa¸

c˜

ao Incremental

O método de a¸cão-valor efetua estimativas ao fazer a média das recompensas ob-servadas. A implementa¸cão mais óbvia deste método está em manter, para cada a¸cão a, o conjunto de todas as recompensas que foram obtidas na sua sele¸cão. Então, quando a

(37)

estimativa da a¸cão a é necessária em um determinado instante de tempo t, ela poderá ser computada de acordo com a Equa¸cão 3.1.

Um grande problema com essa forma de implementa¸cão está em seus requisitos computacionais e de memória. Conforme a quantidade de recompensas adquiridas cresce no decorrer do tempo, a quantidade de estado a ser armazenado em memória e o custo computacional para o cálculo da média se tornam inviáveis. Entretanto, todo esse custo não é realmente necessário. Através de uma fórmula que dispõe de atualiza¸cões incremen-tais é poss´ıvel computar as médias com um custo computacional constante e de memória com a quantidade de bits proporcional à O(log2(k)) a cada nova recompensa recebida,

sendo k o valor que representa a itera¸cão de atualiza¸cão. Para uma determinada a¸cão, assume-se Qk a estimativa para a k-ésima recompensa, ou seja, a média das k - 1 primeiras

recompensas. Dados a média e a k-ésima recompensa desta a¸cão, Rk, então a média de

todas as k recompensas pode ser computada da seguinte maneira

Qk+1 = 1 k k X i=1 Ri = 1 k Rk+ k−1 X i=1 Ri = 1 k Rk+ (k − 1)Qk+ Qk− Qk = 1 k Rk+ kQk− Qk = Qk+ 1 kRk− Qk, (3.2)

que para k = 1, obtém-se Q2= R1para um Q1arbitrário. Essa implementa¸cão incremental

necessita manter em mem´oria apenas os valores de Qk e k, e uma computa¸c˜ao constante

da m´edia (Equa¸c˜ao 3.2) para cada nova recompensa.

A express˜ao Rk− Qk presente na Equa¸c˜ao 3.2 representa o erro da estimativa.

Esse erro é reduzido quando as estimativas e as recompensas recebidas come¸cam a se aproximar. É importante lembrar que as recompensas, uma vez ou outra, estarão acom-panhadas de algum tipo de ru´ıdo. Para estes casos o termo 1_k, muito conhecido como P asso da itera¸cão, será fundamental na atenua¸cão de tais ru´ıdos.

(38)

23

3.5 Rastreando um Problema N˜

ao-Estacion´

ario

O método discutido até o momento é apropriado para problemas estacionários, mas não são apropriados quando os estados se alteram continuamente com o passar do tempo. Para estes casos faz sentido atribuir uma maior importância às recompensas mais recentes do que as de um passado distante. A forma mais popular de realizar tal atribui¸cão é a de manter o parâmetro P asso como uma constante [23]. Por exemplo, a Equa¸cão 3.2 pode ser modificada para que a atualiza¸cão da média das k - 1 recompensas passadas, Qk, passe

a ser

Qk+1 = Qk+ αRk− Qk, (3.3)

onde o parˆametro P asso, α, 0 < α ≤ 1, ´e constante. Esse artif´ıcio resulta em um Qk+1

sendo uma m´edia ponderada das recompensas passasdas e a estimativa inicial Q1:

Qk+1 = Qk+ αRk− Qk = αRk+ (1 − α)Qk = αRk+ (1 − α)[αRk−1+ (1 − α)Qk−1] = αRk+ (1 − α)αRk−1+ (1 − α)2αQk−2 + · · · + (1 − α)k−1_αR 1+ (1 − α)kQ1 = (1 − α)kQ1+ k X i=1 α(1 − α)k−iRi. (3.4)

A Equa¸cão 3.4 é denominada média ponderada incremental devido a soma dos pesos ser (1 − α)k ₊Pk

i=1α(1 − α)

k−i _{= 1. Nota-se que o peso, α(1 − α)}k−i_{, dado}

recompensa Ri depende de quantas recompensas passadas, k − i, foram observadas. Caso

1−α = 0, então todo peso é atribu´ıdo a última recompensa recebida, Rk, dada a conven¸cão

de que 00 _{= 1.}

Denota-se o parˆametro P asso representado por αk(a) usado para processar a

re-compensa recebida após a k-ésima sele¸cão da a¸cão a. Como foi observado anteriormente, a escolha de αk(a) = _k1 é apropriada para problemas estacionários, no qual garante-se

a convergência para o verdadeiro valor das a¸cões através lei dos grande números. Um resultado bem conhecido ne teoria estocástica apresenta duas condi¸cões necessárias para assegurar a convergência com probabilidade 1:

∞ X k=1 αk(a) = ∞ (3.5) ∞ X k=1 α2_k(a) < ∞ (3.6)

(39)

A Equa¸cão 3.5 é necessária para garantir que os passos são grandes o suficiente para superar eventuais condi¸cões iniciais ou flutua¸cões aleatórias. A Equa¸cão 3.6 garante que os passos tornam-se pequenos o suficiente para garantir convergência.

´

E poss´ıvel observar que ambas condi¸cões de convergência são bem definidas para o caso estacionário, onde αk(a) = _k1. Entretanto, isso não acontece para o caso n˜

ao-estacionário, onde αk(a) = α é constante. No último caso, a segunda condi¸cão não é bem

definida, indicando que as estimativas nunca convergir˜ao completamente, mas continuar˜ao a variar em resposta as recompensas recebidas mais recentemente.

Como o problema de encontrar as réplicas de conteúdos nos caches dos nós vizinhos mais próximos é não-estacionário, principalmente em razão da popularidade dos conteúdos e das constantes mudan¸cas da disponibilidade dos conteúdos nos caches, o modelo n˜ ao-estacionário foi o adotado para o cálculo das recompensas esperadas. Este mesmo modelo pode ser encontrado no trabalho feito por Chiocchetti et al. 2013, no qual os autores denominam a constante como taxa de aprendizado.

3.6 Estrat´

egia de Encaminhamento como um

Pro-blema das M´

aquinas Ca¸

ca-N´ıqueis

Nessa se¸cão apresenta-se como os nós da rede fazem a constru¸cão das suas ta-belas de encaminhamento e, descreve também, como selecionam as interfaces utilizadas para encaminhar um conteúdo com base nas recompensas coletadas na estratégia de en-caminhamento proposta, a MAB. Seu objetivo é minimizar o tempo de recupera¸cão de conteúdos observado pelo usuário final, utilizando os artif´ıcios da técnica ε − greedy [23] descrita nas se¸cões anteriores. A ideia principal é descobrir caminhos alternativos que levem a réplicas temporárias de conteúdos sem que nenhuma informa¸cão sobre a locali-za¸cão desses conteúdos se encontre dispon´ıvel a priori. A estratégia proposta modela o encaminhamento como o problema das máquinas ca¸ca-n´ıqueis e desenvolve um algoritmo em que, cada nó explora probabilisticamente suas interfaces de sa´ıda além de entregar o conteúdo de interesse pela interface que obteve o menor tempo de recupera¸cão.

(40)

25

3.6.1 Constru¸

c˜

ao da Tabela de Encaminhamento

Na MAB cada nó constrói sua tabela de encaminhamento ao registrar o tempo de resposta de cada prefixo de nome quando recebe o pacote de dados correspondente por uma das interfaces de próximo salto. A tabela é composta por entradas que indicam o valor de recompensa médio Q em cada nó i para todos os destinos d, Qi(f , d )∀d ∈ interf aces(i),

onde Qi(f , d ) representa o tempo de resposta médio para obter o conteúdo f após o nó

i ter enviado um pacote de interesse via interface que alcan¸ca d. A ilustra¸cão de uma das entrada da tabela pode ser vista na Figura 3.2. A a¸cão de encaminhar realizada por um nó i consiste em selecionar a interface de próximo salto d com a melhor recompensa média Q para um conteúdo f, ou seja, a interface que ao longo do tempo produziu o menor tempo de resposta para que o conteúdo pudesse ser obtido. Para cada pacote de dados recebido de volta pela interface d, o nó i atualiza a recompensa Q em sua tabela de acordo com a Equa¸cão 3.7, onde rtt(f ,d ),k representa o atraso desde o nó i encaminhar

o pacote de interesse pelo conteúdo f até o momento em que i recebe o pacote de dados que contém f.

Figura 3.2: Entrada da tabela de encaminhamento.

Cada nó atualiza sua tabela de encaminhamento independentemente e, ao serem utilizados em conjunto, conseguem identificar o “melhor” caminho dada as condi¸cões mo-mentâneas da rede para encaminhar e recuperar um determinado conteúdo. Para cada conteúdo f ∈ F , conjunto de todos conteúdos disponibilizados, um nó i mantém um con-junto de valores Qi(f , d )∀d ∈ interf aces(i), e são computados e atualizados toda vez que

o n´o i recupera f , seja pela “melhor” interface ou por uma interface explorada, como ser´a descrito a seguir.

(41)

3.6.2 O Processo de Encaminhamento e Explora¸

c˜

ao

A estratégia de encaminhamento proposta supõe que nenhum conhecimento prévio foi adquirido antes de receber o interesse por um conteúdo pela primeira vez. Posto isso, ao receber um pacote de interesse por um conteúdo f que não consta na tabela de encaminhamento, o roteador i irá inundar todas as suas interfaces, exceto a que recebeu o interesse, para inicializar o valor das recompensas Qi(f , d ). O objetivo de tal inunda¸cão

est´a em adquirir conhecimento sobre o estado atual da rede em rela¸c˜ao a f, garantindo ao mesmo tempo a entrega dos pacotes de dados requisitados.

Figura 3.3: Processo decis´orio ao encaminhar um pacote de interesse.

Após essa fase inicial, as interfaces são classificadas de acordo com o tempo trans-corrido para a recupera¸cão dos primeiros pacotes de dados. A partir desse ponto, toda vez que um pacote de interesse com o prefixo de f for recebido por um nó, ele pesquisará em sua tabela de encaminhamento e encaminhará o interesse pela interface que é considerada a melhor classificada para recuperar o conteúdo solicitado por um processo aleatório, que decide com uma probabilidade 1 − ε propagar o pacote de interesse somente pela interface que produziu o menor valor Qi(f , d ) no decorrer do tempo. Ou, com probabilidade ε,

propagar o interesse para a “melhor” interface e também para outra interface escolhida ao acaso diferente da atual “melhor” seguindo uma distribui¸cão uniforme. Através dessa abordagem, garante-se que f será entregue pelo cache mais “próximo” encontrado até o momento enquanto outras cópias que possam ter sido armazenadas por caches ainda mais “próximos” em um passado mais recente possam ser encontradas. As etapas desse processo estão ilustradas na Figura 3.3. A op¸cão de possuir somente uma única interface para explora¸cão foi adotada para limitar a sobrecarga de pacotes de interesse trafegando

(42)

27 na rede.

Da mesma forma, para cada pacote de dados retornado passada a inunda¸cão, os nós atualizarão sua tabela de encaminhamento de acordo com a seguinte equa¸cão:

Qi ,k +1(f , d ) = Qi ,k(f , d ) + α[rtt(f ,d ),k − Qi ,k(f , d )] = αrtt(f ,d ),k + (1 − α)Qi ,k(f , d ) = αrtt(f ,d ),k + (1 − α)[αrtt(f ,d ),k −1 + (1 − α)Qi ,k −1(f , d ) = αrtt(f ,d ),k + (1 − α)αrtt(f ,d ),k −1 + (1 − α)2Qi ,k −1(f , d ) = αrtt(f ,d ),k + (1 − α)αrtt(f ,d ),k −1 + (1 − α)2αrtt(f ,d ),k −2 + · · · + (1 − α)k−1_αrtt (f ,d ),k −1 + (1 − α)kQi ,1(f , d ) = (1 − α)kQi ,1(f , d ) + k X j=1 α(1 − α)k−jrtt(f,d),j. (3.7)

Como a localiza¸cão das réplicas nos caches muda com o passar do tempo, incorpora-se uma atualiza¸cão que leva em conta a não-estacionariedade do problema de encontrar o cache que retorna mais rapidamente o conteúdo requisitado. Fixando o valor de α em uma constante, tal que 0 < α ≤ 1, a Equa¸cão 3.7 mostra que, como 1 − α é menor que 1, o peso atribu´ıdo a rtt(f,d),j diminui à medida que a quantidade de tempos de resposta

intervenientes coletados aumentam. Na verdade, o peso decai exponencialmente de acordo com o expoente 1−α. Consequentemente, a recupera¸cão de um pacote de dados no estado atual da rede sempre possuirá um peso maior no cálculo do tempo de recupera¸cão médio, mas sem que o histórico obtido a partir de uma interface deixe de ser levado em conta, já que o estado corrente pode apresentar uma condi¸cão particular e temporária.

Outro tratamento realizado via recep¸cão de um pacote de dados é a identifica¸cão de uma poss´ıvel queda de enlace. Cada entrada da tabela de encaminhamento possui uma tupla contendo o prefixo de um conteúdo, a interface utilizada na propaga¸cão do interesse, o tempo de recupera¸cão médio e um contador de retransmissões. Assim, sempre que um interesse é enviado, sua entrada correspondente na tabela tem o contador acrescido de uma unidade. Caso esse contador atinja um valor de limiar predefinido T, o valor do tempo de recupera¸cão médio é definido como infinito e, consequentemente, a interface associada a essa entrada deixa de ser utilizada. Como a estratégia de encaminhamento proposta realiza explora¸cões de forma aleatória, eventualmente tal interface que foi classificada como “fora do ar” acaba sendo sondada novamente e, no recebimento de um respectivo pacote

(43)

de dados, todo processo de aquisi¸c˜ao de recompensas associado aos prefixos previamente encaminhados por ela recome¸ca.

(44)

Cap´ıtulo 4

Modelo de Simula¸

c˜

ao

A estratégia de encaminhamento proposta, a MAB, é avaliada através de simula-¸cões. Logo, para que seja poss´ıvel entender melhor os resultados obtidos nesse trabalho, é preciso entender como tais simula¸cões foram realizadas e modeladas. Para avaliar o com-portamento da rede ao aplicar a estratégia de encaminhamento proposta e para poder ter resultados que permitam a melhor parametriza¸cão da proposta, são realizadas simula¸cões utilizando o simulador NS-3 [24], através do módulo ndnSIM [5], que implementa a pilha de protocolos da CCN. Nesse cap´ıtulo, aborda-se o funcionamento do módulo ndnSIM e apresenta-se a maneira como os nós se comportam durante a simula¸cão.

4.1 Funcionamento B´

asico do ndnSIM

O simulador ndnSIM foi implementado de forma modularizada na linguagem C++ com classes abstratas, para definir cada um dos componentes da CCN: a tabela de inte-resses pendentes (PIT), tabela de encaminhamento (FIB), o armazenador de conteúdos (CS), a interface de aplica¸cão, etc. Essa estrutura modular permite que cada componente seja facilmente modificado ou substitu´ıdo sem impactar os outros componentes. Além disso, o ndnSIM já tem implementado geradores de aplica¸cão e classes Helpers, que são facilitadores para cria¸cão dos cenários de testes e seus componentes.

A arquitetura do ndnSIM segue a filosofia que tem como objetivo maximizar a abstra¸cão da implementa¸cão de todos os modelos e componentes. Assim como as pilhas IPv4 e IPv6, o ndnSIM foi arquitetado para ter uma pilha de camadas independentes que possam ser instalados em cada nó da rede durante a simula¸cão. A Figura 4.1 mostra como

(45)

os componentes estão organizados. Como pode ser observado, o L3Protocol no ndnSIM é a unidade central da arquitetura, é o único componente que não oferece alternativas de implementa¸cão. É o componente lógico que agrega todas os canais de comunica¸cão das aplica¸cões com os outros nós da rede e faz a manipula¸cão básica dos pacotes que chegam das Faces a partir de uma estratégia de encaminhamento.

Figura 4.1: A arquitetura do ndnSIM [5].

Além do L3Protocol, o simulador ndnSIM é composto por outros componentes como a Face, uma abstra¸cão que permite uma comunica¸cão com a camada de aplica¸cão AppFace e outros nós da simula¸cão. O ContentStore é um cache para armazenar os pacotes de dados recebidos da rede, conforme uma pol´ıtica de cache. A PIT é uma abstra¸cão para a tabela de interesses requisitados que mantém as Faces de origem dos interesses recebidos, e assim poder encaminhar os pacotes de dados para os nós que o requisitaram. A FIB é uma abstra¸cão para a tabela de encaminhamento, que tem como fun¸cão encaminhar o interesse de acordo com alguma estratégia de encaminhamento. O ForwardingStrategy é o componente responsável por controlar como os pacotes de interesse e dados irão trafegar pela rede, durante a simula¸cão. Todos esses componentes são parametrizados para cada cenário, para melhor se adequar aos objetivos dos testes, por exemplo modificar a pol´ıtica de cache ou o algoritmo de busca na FIB.

(46)

31 Na Figura 4.1 é poss´ıvel observar mais dois componentes conectados ao núcleo do ndnSIM, a APPFace e a NetDeviceFace. São abstra¸cões utilizadas para realizar a comu-nica¸cão entre a camada de rede (L3Protocol ) e as outras camadas da pilha de protocolos. Isto é, caso um nó deseje ser um consumidor, ele deve ser capaz de utilizar uma AppFace para enviar os interesses e receber os dados utilizando a camada de rede da CCN. O Net-DeviceFace é o componente central responsável por entregar os pacotes de dados para a pilha CCN de acordo com o protocolo de enlace utilizado.

O ndnSIM é orientado a eventos, logo os componentes devem implementar fun¸cões de tratamentos para os eventos lan¸cados durante a simula¸cão. Dessa forma, possui uma lógica padrão para tratamento desses eventos. Isso facilita o desenvolvimento de novos componentes, dado que para estender algum componente, basta sobrescrever a implemen-ta¸cão padrão, modificando apenas os métodos de tratamento dos eventos desejados. No desenvolvimento da MAB alteramos o componente ForwardingStrategy, que executa em cada nó da simula¸cão a estratégia de encaminhamento escolhida para aquele cenário, e é responsável por manipular os módulos ContentStore, PIT e FIB, além de tratar os eventos enviados pelos nós. A lista de todos os eventos tratados pelo ForwadingStrategy pode ser vista em [5].

4.2 A Topologia de Rede Utilizada

Para a execu¸cão dos experimentos a topologia usada foi a Rocketfuel, ilustrada na Figura 4.1. Essa topologia é derivada do ISP (Internet Service Provider ) EBONE, obtida através do mapeador de topologias Rocketfuel [25]. A rede conta com 163 nós, dos quais 72 nós são folhas. Esses nós estão conectados entre si através de 366 enlaces com larguras de banda, tamanho da fila das interfaces e o atraso de transmissão heterogêneos. Para a execu¸cão de todas as simula¸cões, foram escolhidos 3 nós folhas, aleatoriamente, para serem os nós produtores.

4.3 Comportamento dos N´

os da Rede

No ndnSIM, existem apenas três tipos diferentes de nós: publicadores de conteúdo, consumidores e roteadores. Estes são detalhados nas próximas sessões.

(47)

Figura 4.2: A Topologia Rocketfuel.

4.3.1 Publicadores de Conte´

udo

Os publicadores de conteúdo implementam todas as camadas da pilha CCN. No contexto do ndnSIM, eles são aplica¸cões que tem o propósito de servir os dados de um ou mais conteúdos identificados pelos seus prefixos.

4.3.2 Consumidor

Assim como os publicadores de conte´udo, os consumidores implementam todas as camadas da pilha CCN. O ndnSIM j´a fornece 4 tipos diferentes de consumidores: Con-sumerCbr, ConsumerZipfMandelbrot, ConsumerBatches, ConsumerWindow. Observa-se