Monitor
Um ambiente para o diagnóstico e gerenciamento de sistemas distribuídos.

Introdução

Sistemas Distribuídos são compostos por processos localizados nos diversos pontos de uma rede de computadores. Falhas de processos ou de canais de comunicação, se não forem devidamente tratadas, podem resultar na interrupção das aplicações e, portanto, dos serviços relacionados. Em geral, o tratamento de falhas, seja pelo mascaramento destas ou pela recuperação do estado do sistema, requer em primeiro lugar o diagnostico dos componentes falhos, identificando-os e informando aos processes operacionais, de uma forma consistente, o diagnóstico estabelecido.

Objetivos

O projeto Monitor tem como objetivo o desenvolvimento de uma ferramenta para a monitoria de serviços distribuídos sobre no ambiente JAVA/CORBA. MONITOR é uma ferramenta totalmente distribuída e tolerante a falhas. Ela é comporta de dois módulos principais : o SDF (Servico de diafnóstico de falhas) e o SGD (serviço de gerenciamento distribuído). O SDF é como objetivo diagnosticar um determinado conjunto de objetos/processos, através de uma monitoria constante de comportamento dos objetos e dos canais de comunicacao. Com os dados fornecidos pelo SDF, o SGG pode criar novos objetos para substituir objetos diagnosticados como falhos, mover objetos para estacoes menos carregadas pra melhorar o desempenho do sistema, etc.

Monitor trabalha sobre sistemas assíncronos onde limites de tempo (timeouts) não podem ser usados como indicação precisa de falhas e/ou estabelecimento do Diagnóstico. Para gerar Diagnósticos, além de timeouts adaptáveis, consultas ao sistema operacional e consultas a agentes SNMP, o SDF usa um protocolo de decisão tolerante a falha em duas fases (two-phase commit). O SDF, que também inclui uma ferramenta visualizadora, foi implementado e testado num ambiente JAVA/CORBA na rede de computadores do LaSiD/UFBA [BM/01]. Atualmente (Fev/2001) estamos iniciando o projeto e implementação do módulo SGD que incluirá também uma ferramenta de gerencia.

Membros do Projeto MONITOR

Publicações do Projeto

Marcela Batalha e Raimundo Macêdo.
Um Serviço Tolerante a Falhas sobre CORBA para Diagnóstico e Gerenciamento de Sistemas Distribuídos.
Technical Report RI002-01, Laboratório deSistemas Distribuídos - LaSiD, UFBA, Feb, 2001 (submetido ao SBRC2001).