• Nenhum resultado encontrado

Trabalho de Mestrado

N/A
N/A
Protected

Academic year: 2021

Share "Trabalho de Mestrado"

Copied!
6
0
0

Texto

(1)

Caracterizac¸˜ao da carga de trabalho em sistemas de educac¸˜ao

a distˆancia

Trabalho de Mestrado

Jana´ına R. Penedo (Aluno),Morganna Diniz(Orientador) Programa de P´os-Graduac¸˜ao em Inform´atica - PPGI

1Universidade Federal do Estado do Rio de Janeiro - UNIRIO

Av. Pasteur, 296 – Urca – CEP 22290-240 – Rio de Janeiro – RJ – Brazil

{janaina.penedo,morganna}@uniriotec.br

Ano de Ingresso no Programa de Mestrado: 2010 ´

Epoca esperada de conclus˜ao: Fevereiro de 2012

Etapas j´a conclu´ıdas: Avaliac¸˜ao dos Dados e Carga de Trabalho Resumo. ´E crescente o n´umero de instituic¸˜oes que oferecem seus cursos atrav´es de sistemas de educac¸˜ao `a distˆancia (EAD). A an´alise de desempenho dessas aplicac¸˜oes est´a fortemente atrelada a carga de trabalho a que estes sistemas s˜ao submetidos. Para projetar adequadamente um sistema, ´e necess´ario ent˜ao entender as caracter´ısticas dessas cargas de trabalho. No caso dos sistemas para EAD, a carga ´e gerada pelos usu´arios e, portanto, ´e imprescind´ıvel modelar como acontece a interac¸˜ao dos usu´arios com a aplicac¸˜ao. O objetivo deste trabalho ´e apresentar uma proposta para caracterizac¸˜ao do usu´ario de um sistema de EAD. Esta proposta ser´a validada com o estudo de caso de uma aplicac¸˜ao que comporta 30 mil alunos de graduac¸˜ao espalhados por 34 polos no Estado do Rio de Janeiro.

Palavras Chave:Modelagem, Caracterizac¸˜ao de usu´arios, analise de carga de trabalho, Educac¸˜ao a Distˆancia

1. Fundamentac¸˜ao Te´orica

Aplicac¸˜oes Web s˜ao ubiquos e focadas a atender um grande n´umero de usu´arios, por isso necessitam ser r´apidas e de confianc¸a [Lutteroth and Weber 2008]. A previs˜ao de alocac¸˜ao de recursos dessas aplicac¸˜oes est´a fortemente atrelada a carga de trabalho a que estes sis-temas s˜ao submetidos. Caracterizar a carga de um sistema ´e uma tarefa estrat´egica pois as informac¸˜oes obtidas na an´alise dos dados s˜ao fundamentais para a construc¸˜ao de sistemas eficientes e precisos no tratamento da pr´opria carga. O objetivo da caracterizac¸˜ao ´e obter

(2)

uma definic¸˜ao fiel e atual da carga da Web e verificar o comportamento das mudanc¸as ao longo do tempo [Jonack and Murta 2002].

Um dos principais benef´ıcios da caracterizac¸˜ao ´e que ela permite a construc¸˜ao de modelos anal´ıticos que podem replicar o comportamento do usu´ario de modo que se possa estudar o desempenho de sistemas similares em um ambiente de laborat´orio, onde ´e poss´ıvel medir com maior precis˜ao os efeitos dos v´arios tipos de requisic¸˜oes de usu´arios, e ainda construir modelos mais precisos da utilizac¸˜ao dos recursos do sistema de informac¸˜ao.

2. Caracterizac¸˜ao da Contribuic¸˜ao

Com a popularizac¸˜ao da Internet, novas possibilidades de aplicac¸˜oes foram disponibi-lizadas, entre elas pode-se citar o crescimento extraordin´ario dos cursos universit´arios oferecidos na modalidade de Ensino a Distˆancia (EAD). Como a Internet ´e considerada um meio relativamente barato para a transmiss˜ao de dados multim´ıdia, o seu uso para a distribuic¸˜ao de conte´udo de aulas parece ser a resposta natural para a implementac¸˜ao de cursos n˜ao presenciais ou parcialmente n˜ao presenciais pelas instituic¸˜oes de ensino. De acordo com o MEC, em 2009, 145 instituic¸˜oes estavam credenciadas para a oferta de cursos superiores na modalidade a distˆancia com mais de 760.000 mil alunos matricula-dos [MEC 2011].

´

E importante enfatizar que EAD ´e educac¸˜ao e tem que ser de qualidade, tanto quanto a educac¸˜ao presencial [Nascimento and Carnielli 2009]. Um dos problemas en-contrados pelas instituic¸˜oes que provˆeem ensino na modalidade a distˆancia est´a em como compartilhar, dimensionar e alocar os recursos computacionais corretos a seus sistemas de forma a melhor atender a esta premissa. Uma hip´otese para soluc¸˜ao deste problema est´a em entender como ´e gerada a carga de trabalho a que o sistema ´e submetido. No caso dos sistemas para EAD, a carga ´e gerada pelos seus usu´arios e, portanto, ´e imprescind´ıvel modelar como acontece a interac¸˜ao dos usu´arios com a aplicac¸˜ao. A determinac¸˜ao dos processos que representam este comportamento e suas caracter´ısticas estat´ısticas nos per-mitir´a criar modelos de carga de trabalho e compor um modelo geral de sistema, de forma a responder perguntas referentes ao aumento da escalabilidade, mantendo o desempenho satisfat´orio e consequentemente a qualidade de servic¸o.

O objetivo deste trabalho ´e apresentar uma proposta que permita caracterizar a carga de trabalho de um sistema de EAD, levando em considerac¸˜ao a interac¸˜ao do usu´ario com o sistema. Para tal, s˜ao analisadas atrav´es de um estudo de caso as principais m´etricas relacionadas ao desempenho de acordo com a carga gerada pelas interac¸˜oes dos usu´arios do sistema. O estudo de caso a ser realizado ´e a do cons´orcio CEDERJ (Fundac¸˜ao CECIERJ).

O Cons´orcio CEDERJ [CEDERJ 2011] re´une seis universidades p´ublicas sediadas no Estado do Rio de Janeiro:

1. Universidade do Estado do Rio de Janeiro - UERJ;

2. Universidade Estadual do Norte Fluminense Darcy Ribeiro - UENF; 3. Universidade Federal do Estado do Rio de Janeiro - UNIRIO; 4. Universidade Federal do Rio de Janeiro - UFRJ;

(3)

5. Universidade Federal Fluminense - UFF;

6. Universidade Federal Rural do Rio de Janeiro - UFRRJ.

O aluno do Cons´orcio CEDERJ est´a matriculado em uma das universidades do cons´orcio, dependendo do curso e do p´olo regional a que esteja vinculado. Os polos s˜ao os locais onde os alunos matriculados podem realizar atividades presenciais obrigat´orias, como aulas de laborat´orio, avaliac¸˜oes, entre outros.

O Cons´orcio CEDERJ vem servindo de modelo em todo o Brasil. Em seu ´ultimo vestibular se inscreveram mais de 22 mil alunos. A quantidade de cursos cresceu sete vezes em relac¸˜ao ao primeiro vestibular e o total de municipios atendidos passou de 4 para 34 em todo o Estado do Rio de Janeiro [CEDERJ 2011].

3. Estado atual do trabalho

Ap´os revis˜ao sistem´atica realizada sobre os trabalhos encontrados na literatura, a presente pesquisa encontra-se em fase de identificac¸˜ao dos parametros para compor o modelo que melhor caracterize o comportamento dos usu´arios do sistema de EAD. Para tal, as seguintes etapas foram definidas:

1. Revis˜ao sistem´atica de trabalhos correlatos;

2. Coleta dos dados semestre de aulas (2010.2) de todos os cursos de graduac¸˜ao do CEDERJ;

3. Avaliac¸˜ao dos dados e da carga de trabalho;

4. Identificac¸˜ao dos parˆametros para compor o modelo de acordo com dados identi-ficados nos trabalhos correlatos;

5. Definic¸˜ao dos perfis dos usu´arios;

6. Definic¸˜ao do modelo matem´atico para representar o sistema da informac¸˜ao; 7. Avaliac¸˜ao e gerac¸˜ao de resultados com o modelo;

8. Criac¸˜ao de aplicac¸˜ao para demonstrar graficamente os resultados do modelo; 9. Validac¸˜ao do modelo com o ambiente real;

10. Discuss˜ao dos resultados.

4. Trabalhos relacionados (vis˜ao comparativa)

Um grande n´umero de estudos tem seu enfoque voltado a melhor forma de caracterizar e medir desempenho de carga de trabalho Web. Esses trabalhos consideram a carga como um todo, n˜ao se preocupando em identificar os perfis dos usu´arios do sistema. Isto sig-nifica que os resultados n˜ao s˜ao capazes de detectar a influˆencia do comportamento dos usu´arios na gerac¸˜ao da carga no sistema, j´a que apenas fornecem a m´edia geral da carga a qual ´e submetida o sistema.

O objetivo de [Davison 1999] ´e demonstrar como a falta de um correto levanta-mento dos dados pode afetar seriamente a caracterizac¸˜ao do trafego Web. O autor levanta quest˜oes da utilidade das requisic¸˜oes HTTP para o desempenho e caracterizac¸˜ao da carga de trabalho e demonstra os tipos de informac¸˜oes dispon´ıveis ao analisar tais requisic¸˜oes.

Em [Pereira et al. 2004] o autor realiza uma caracterizac¸˜ao hierarquica da carga de trabalho da base de dados uma universidade federal. O autor analisa o comportamento do

(4)

usu´ario baseado no estudo das sess˜oes e na correlac¸˜ao das mesmas com o servic¸o provido pelo servidor Web. O autor utiliza quatro n´ıveis para tal analise: requisic¸˜ao, func¸˜ao, sess˜ao e usu´ario. Em cada um dos n´ıveis s˜ao definidas as m´etricas com o objetivo de compor uma metodologia de caracterizac¸˜ao gen´erica para aplicac¸˜oes Web.

Em [Almeida et al. 2001] o autor analisa as cargas de dois sistemas utilizados para EAD: BIBS e eTeach. ´E feito um estudo de trˆes m´etricas para a caracterizac¸˜ao da carga de m´ıdia educativa: tempo entre chegadas de sess˜oes, popularidade das aulas e a popularidade de segmentos das aulas. Para o eTeach, a distribuic¸˜ao exponencial mostrou-se adequada para modelar o tempo entre chegadas de mostrou-sess˜oes. J´a para o sistema BIBS a distribuic¸˜ao de Pareto foi a que mais precisamente representou esta m´etrica.

Em [Lutteroth and Weber 2008] os autores aplicaram uma metodologia de analise orientada em que a interac¸˜ao do usu´ario e a resposta a essa interac¸˜ao s˜ao modeladas em um diagrama de estado de transic¸ao para obter os modelos de carga de trabalho em sistemas WEB. Os testes realizados ajudaram a revelar gargalos no sistema com antecipac¸˜ao.

Em [Hern´andez-Orallo and Vila-Carb´o 2009] os autores prop˜oem um modelo an´alitico para avaliar diversas classes de carga de trabalho baseado em histogramas. A proposta se compromete a responder perguntas como: ”Como fica o desempenho se a carga de trabalho for aumentada em 50%?”Os resultados mostraram que o modelo ´e exa-to comparado com os resultados reais quando utilizado em testes de um servidor web.

Em [Benevenuto et al. 2009] foi realizada a analise da carga de trabalho de redes sociais on line baseada nas atividades dos usu´arios. Foram executados trˆes tipos prin-cipais de an´alises: padr˜oes das sess˜oes, atividade dos usu´arios e as transic¸˜oes entre as atividades. Como resultado, descobriu-se aspectos relevantes a serem considerados, tais como a descoberta de ac¸˜oes ”fantasmas”(onde n˜ao ocorriam nenhum tipo de requisic¸˜ao), como por exemplo navegac¸˜ao entre pagimas de perfil e visualizac¸˜ao de fotos.

Dentre os trabalhos que efetuam a caracterizac¸˜ao da carga levando em considerac¸˜ao o usu´ario, podemos citar [Marques-Neto et al. 2009] que prop˜oe uma metodologia para caracterizac¸˜ao dos usu´arios de banda larga da internet. Essa metodolo-gia contempla a an´alise de sete aspectos considerados na carga de trabalho de um provedor de banda larga:

(i) processo de chegada das sess˜oes dos usu´arios `a infra-estrutura; (ii) processo de sa´ıda das sess˜oes dos usu´arios;

(iii) durac¸˜ao das sess˜oes;

(iv) bytes recebidos durante as sess˜oes dos usu´arios; (v) bytes enviados nas sess˜oes;

(vi) os principais servic¸os;

(vii) atividades de com´ercio eletrˆonico utilizadas na Internet de banda larga. Os itens i, ii e iii provˆeem informac¸˜oes sobre o aspecto temporal da carga, en-quanto que os itens iv, v, vi e vii qualificam a carga do usu´ario.

Em [Menasc´e et al. 1999], Menasce prop˜oe uma metodologia de caracterizac¸˜ao de carga de trabalho para sites de com´ercio eletrˆonico, introduzindo um modelo de

(5)

compor-tamento de usu´ario. A diferenc¸a entre [Marques-Neto et al. 2009] e [Menasc´e et al. 1999] est´a que o primeiro prop˜oe uma metodologia para caracterizac¸˜ao de usu´arios de prove-dores, enquanto que [Menasc´e et al. 1999] prop˜oe uma metodologia de caracterizac¸˜ao focada em sites de com´ercio eletrˆonico. Nessa abordagem, s´o s˜ao consideradas as requisic¸˜oes que geram ac¸˜oes no servidor. Dessa forma, os seguintes aspectos s˜ao cita-dos como importantes:

(i) a taxa de chegada dos pedidos de in´ıcio de sess˜ao, para cada tipo de sess˜ao. (ii) a m´edia de tempo passado desde que o servidor terminou uma requisic¸˜ao do usu´ario at´e receber outra.

Trabalhos com a an´alise voltada para ensino a distˆancia tamb´em s˜ao encontrados na literatura. A caracterizac¸˜ao da interatividade de alunos do curso de computac¸˜ao do CEDERJ foi proposta por [Bruno C. B. Alves, Rosa M. M. Le˜ao, Edmundo de Souza e Silva 2007]. O trabalho caracterizou apenas os videos de aulas do curso de computac¸˜ao. O servidor RIO permite aos usu´arios acesso a aulas pr´e-gravadas com v´ıdeo e slides sin-cronizados. Neste ambiente, os alunos tem total controle sobre a aula que est˜ao assistindo, podendo se movimentar livremente sobre todos os t´opicos de cada aula e de diversas for-mas, parar e retomar a exibic¸˜ao a qualquer instante e de qualquer ponto da aula. Foram analisadas 2674 sess˜oes de usu´arios, cada sess˜ao correspondendo a uma aula assistida por aluno, durante o ano de 2005. Como principal contribuic¸˜ao est´a o estudo detalhado e a parametrizac¸˜ao de vari´aveis de interatividade dos usu´arios do servidor RIO em um ambiente real de operac¸˜ao.

5. Avaliac¸˜ao dos Resultados

O estudo inicial ser´a desenvolvido utilizando os dados de semestre 2010.2 de todos os cur-sos de graduac¸`ao do CEDERJ. Entretanto, dados de 2011.1 ser˜ao coletados para validar e comparar com os do semestre anterior. A id´eia ´e verificar a escalabilidade e a adequac¸˜ao do modelo proposto diante do crescimento e alterac¸˜oes no sistema de informac¸˜ao estu-dado.

Referˆencias

Almeida, J. M., Krueger, J., Eager, D. L., and Vernon, M. K. (2001). Analysis of educa-tional media server workloads.

Benevenuto, F., Rodrigues, T., Cha, M., and Almeida, V. (2009). Characterizing user be-havior in online social networks. In IMC ’09 Proceedings of the 9th ACM SIGCOMM conference on Internet measurement conference.

Bruno C. B. Alves, Rosa M. M. Le˜ao, Edmundo de Souza e Silva (2007). Caracterizando vari´aveis de interatividade dos alunos do curso de computac¸˜ao do CEDERJ baseado no servidor multim´ıdia RIO. In In: V Workshop de Desempenho em Sistemas Com-putacionais e de Comunicac¸˜ao (WPerformance) / XXVII SBC 2007.

CEDERJ (2011). Acessado em Fevereiro (2011),

http://portal.cederj.edu.br/fundacao/.

Davison, B. D. (1999). Web traffic logs: An imperfect resource for evaluation. In Ninth Annual Conference of the Internet Society (INET).

(6)

Hern´andez-Orallo, E. and Vila-Carb´o, J. (2009). Web server performance analysis using histogram workload models. Comput. Netw., 53:2727–2739.

Jonack, M. A. and Murta, C. D. (2002). Caracterizac¸˜ao de carga de cache da www. In Revista Eletrˆonica de Iniciac¸˜ao Cient´ıfica.

Lutteroth, C. and Weber, G. (2008). Modeling a realistic workload for performance test-ing. Enterprise Distributed Object Computing Conference, IEEE International, 0:149– 158.

Marques-Neto, H. T., do Valle, E. V., Castilho, L. H., Almeida, J. M., and Almeida, V. A. F. (2009). Caracterizac¸˜ao hier´arquica do comportamento dos usu´arios de sistemas par-a-par na internet de banda larga. In 27oSimp´osio Brasileiro de Redes de

Computa-dores e Sistemas Distribu´ıdos.

MEC (2011). Acessado em Fevereiro (2011), http://portal.mec.gov.br/. Menasc´e, D., Almeida, V., Fonseca, R., and Mendes, M. (1999). A methodology for

workload characterization of e-commerce sites. In Proceedings of the ACM Conference on Electronic Commerce, New York. ACM.

Nascimento, F. and Carnielli, B. (2009). Ensino superior: expans˜ao com qualidade? In S˜ao Paulo em Perspectiva, 2000 - SciELO Brasil.

Pereira, A., Franco, G., Silva, L., and Wagner Meira, J. (2004). A hierarchical charac-terization of user behavior. Web Congress, Joint Conference Brazilian Symposium on Multimedia and the Web & Latin America, 0:2–9.

Referências

Documentos relacionados

O Documento Orientador da CGEB de 2014 ressalta a importância do Professor Coordenador e sua atuação como forma- dor dos professores e que, para isso, o tempo e

Tal como em Cirurgia Geral, a duração do estágio de Medicina Interna é também ajustada, na medida em que me permitiu adquirir gradualmente mais confiança no

Os principais objectivos definidos foram a observação e realização dos procedimentos nas diferentes vertentes de atividade do cirurgião, aplicação correta da terminologia cirúrgica,

psicológicos, sociais e ambientais. Assim podemos observar que é de extrema importância a QV e a PS andarem juntas, pois não adianta ter uma meta de promoção de saúde se

Also due to the political relevance of the problem of repressing misguided employment relationships, during the centre-left Prodi Government (2006-2008) and the

Este artigo apresenta a integração do modelo organizacional de unidades de negócio e de um sistema de custo como base para o gerenciamento dos resultados de um grupo

The microtensile bond strength of two PMMA acrylic resins used for the complete denture base was evaluated, one pre-polymerized used in CAD/CAM systems and another by

Para o Planeta Orgânico (2010), o crescimento da agricultura orgânica no Brasil e na América Latina dependerá, entre outros fatores, de uma legislação eficiente