Imagine o seguinte cenário. Vocês é administrador ou analista de sistemas de uma grande empresa e com isso é cobrado diariamente por diversos aspectos: Disponibilidade de sites, desempenho de um servidor, consumo de banda de internet e etc. Você se esforça durante o decorrer do dia para deixar tudo online e com um tempo de reposta adequado, porem ao chegar em casa você recebe uma ligação que um determinado sistema não esta acessível. Nesse momento você liga o seu computador e percebe que não consegue fazer a acesso remoto ao servidor da empresa, vocês se desloca até ela e ao chegar lá se da conta que o link de internet esta fora.
No dia seguinte, quando vocês chega ao escritório, seu gerente te pergunta o que tem acontecido com a rede nos últimos tempos e que tem tido muita reclamação por parte dos usuários.
Com isso surge a duvida de como responder aos envolvidos da empresa, qual tipo de problemas tem acontecido? Como conseguir provar que o mal funcionamento do sistema, se deve a fadiga de hardware ou falta de largura de banda na rede?
Quanto as dúvidas respondemos: Podemos sim atuar mensurando essas métricas e coletando esses dados para no final, termos um relatório frente ao painel de um programa. Podemos ainda configurar para que esse programa nos envie notificações por e-mail avisando quando um link de internet "quebrou" ou quando o processamento de um servidor ultrapassou X %.
Dessa forma nós começamos atuar de maneira proativa no que tange a uma rede de computadores, podendo ter tempo de ver os problemas antes mesmo dos clientes notarem.
Para entender melhor tudo isso vamos a alguns pontos:
Monitoramento
Não é de hoje que a rede de computadores é de suma importância para uma empresa. Hoje em dia, uma boa infraestrutura é indispensável para o lucro da empresa e muitas vezes pode até mesmo ser considerada como missão crítica, ou seja, não pode parar em nenhum momento. E de nada adianta ter uma rede 100% se o que mais importa para os usuários, que são os serviços, não estão operacionais. Com base nesse principio devemos monitorar não só a rede como tudo, mas também os serviços que rodam sob ela. Entretanto, o administrador de redes não vai conseguir fazer isso sozinho. É preciso o consenso de todos para saber o que monitorar.
Disponibilidade
Além disso, esse serviço deve estar disponível. Não adianta o serviço estar "no ar" se quando um usuário faz a aceso ao recurso ele se apresenta de maneira lenta e/ou defeituosa. Para isso é preciso um acordo de nível de serviço (SLA). Com o envolvimento de todos é preciso chegar em quantos % de um mês/semana/dia esse serviço vai estar online.
Capacidade
Também é importante planejar e dimensionar os recursos, que muitas vezes são mal utilizados. Alguns tem muito e outros tem pouco. Um exemplo disso é um funcionário que possui um computador com um alto poder de processamento muito além do que ele precisa para executar suas tarefas de rotina. Chamamos isso de subutilização de recursos. Com isso além do dimensionamento errado e um investimento acima do que era preciso, esse ativo vai gerar um falso positivo para o relatório de desempenho.
Performance
Monitorar também é necessário para obtermos dados de desempenho de determinadas métricas, como por exemplo, a velocidade de um link de Internet. Através de um monitoramento é possível gerar gráficos para comparar teste de download, upload e etc.
Esses foram os principais motivos para termos um programa de monitoramento devidamente configurado.
Finalizamos listando alguns softwares que possuem essa função:
- ZABBIX
- PRTG
- NAGIOS
- CACTI
- MRTG