As equipes de TI precisam avaliar regularmente o datacenter e a infraestrutura de TI da sua organização. A medição da performance do negócio pode estar diretamente ligada à existência de um acompanhamento da performance de seus principais sistemas (aplicações ), desencadeando ações assertivas de “tunning fino”, por meio de planos coesos que visam manter alinhados o negócio, a performance dos sistemas e as melhorias em infraestrutura. Implementados adequadamente, os resultados de uma análise de performance fornecem um roteiro para melhorias, que tanto podem ser direcionadas para a infraestrutura, como ao código de programação (modo com que a construção do código pode se beneficiar melhor da infraestrutura disponível ).
Não existe uma abordagem única para essas revisões. Considere o objetivo, defina o escopo das medições e depois organize as ferramentas, táticas e métricas que possam gerar um resultado significativo.
Quando e por que executar a medição de performance da infraestrutura de TI
Como falamos, nenhum padrão formal determina abordagem ou tempo para medir o desempenho de TI. Uma variedade de ferramentas poderosas de monitoramento e geração de relatórios oferece informações em tempo real sobre o desempenho de hardware e software. Mas esses insights são táticos, momento a momento, 24 horas por dia. Eles mostram como cada VM, servidor, disco e outro recurso opera e quando esses recursos falham.
Uma avaliação de desempenho serve a outro propósito, semelhante à avaliação de um funcionário. A avaliação não é um resumo dos erros do funcionário em um determinado dia, mas uma avaliação objetiva das capacidades e metas do funcionário ao longo do tempo.
Da mesma forma, o sentido de uma análise de desempenho de TI é fazer uma avaliação periódica da eficácia e das oportunidades da infraestrutura, para melhorá-la. A avaliação analisa fatores como desempenho, confiabilidade, capacidade, arquitetura e configuração, além de reconhecer quaisquer limitações importantes. As avaliações oferecem uma análise estratégica que pode direcionar tarefas de negócios de alto nível, como planejamento e orçamento, planos de melhoria e investimentos em novas tecnologias.
Por exemplo, uma organização de seguros mede o desempenho de TI e identifica servidores antigos com manutenção dispendiosa e conclui que se beneficiaria com a substituição. Os novos servidores oferecem mais capacidade para lidar com mais cargas de trabalho, permitindo o lançamento de um novo projeto comercial.
Os objetivos e benefícios da avaliação são tão diversos quanto as organizações que os conduzem. Faça-as sempre que necessário, para ajudar a orientar as decisões de negócios. Algumas organizações medem o desempenho de TI a cada poucos anos, como um prelúdio para um ciclo regular de atualização de tecnologia. O foco aqui é mudar para equipamentos mais confiáveis e econômicos ou se preparar para adotar novas tecnologias. Mas, é razoável realizar revisões anualmente ou com mais frequência. Em geral, grandes organizações com necessidades comerciais em constante mudança se beneficiam de verificações mais frequentes.
Um evento comercial crítico ou um avanço da tecnologia também podem desencadear uma avaliação dos sistemas de TI. Por exemplo, fusões e aquisições e novas unidades de negócios podem exigir infraestrutura e aplicativos adicionais. Problemas ou falhas, como um problema crônico de disponibilidade, que se tornam preocupações viáveis, também podem levar à análise de TI, e os principais avanços tecnológicos podem levar a uma avaliação dos recursos existentes para medir os efeitos de uma atualização.
Processos de medição de performance de TI
O processo básico para avaliar sistemas de TI geralmente segue esta série de cinco etapas:
Defina as metas. Concentre a avaliação nos dados que informam as decisões que você precisa tomar, seja para atualizar uma ferramenta ou simplesmente reduzir os custos de TI.
Defina o escopo. Embora seja possível medir a performance de todos os elementos de hardware e software, esses esforços abrangentes requerem substancialmente mais tempo do que uma revisão focada e provavelmente não valem a pena. Os objetivos da avaliação determinam seu escopo. Por exemplo, se o objetivo é avaliar e reduzir os custos de armazenamento, limite as medições de performance aos sistemas de armazenamento, como capacidade de disco e recursos relacionados, como uma ferramenta automatizada de classificação de camadas de dados.
Colete dados. Uma vez que os gerentes de TI conhecem as metas e o escopo de um esforço de avaliação de performance, eles devem reunir os dados que conduzem essa avaliação. Recorra às ferramentas de gerenciamento e monitoramento de sistemas existentes, que geram diversas métricas e deduzem KPIs (indicadores chave de desempenho significativos) de sistemas e aplicativos. Quando métricas e KPIs não estão prontamente disponíveis, a equipe de TI deve implementar testes e calcular KPIs para dar suporte à revisão. Por exemplo, em uma revisão que visa reduzir os custos de suporte, os administradores devem entender os KPIs, como o número de incidentes, quais sistemas ou aplicativos estão envolvidos, a proporção de incidentes resolvidos e escalados e quanto tempo cada incidente levou para ser resolvido.
Analise e avalie. Mapeie as métricas e os KPIs para as metas e faça determinações objetivas sobre o estado da infraestrutura, sistemas e aplicativos que operam dentro do escopo da avaliação. Se possível, compare os dados atuais com dados semelhantes derivados de análises anteriores, para determinar como o desempenho mudou.
Faça recomendações. A análise de métricas, KPIs e outros resultados do período de medição de performance da TI geralmente leva a uma série de ações ou recomendações de projetos. As recomendações geralmente abordam os problemas identificados ou as oportunidades descobertas pela avaliação. Por exemplo, um aumento significativo nos usuários ou incidentes de suporte técnico para um aplicativo crítico para os negócios, em comparação com uma avaliação realizada seis meses antes exige uma investigação mais aprofundada da funcionalidade do aplicativo e leva a projetos como a migração de aplicativos para uma VM maior em um servidor mais novo ou host na nuvem, provisionamento adicional de largura de banda de rede para suportar mais tráfego de usuários ou um cluster de aplicativos, para melhorar a disponibilidade sem pontos únicos de falha.
Essas etapas de medição de performance representam um círculo virtuoso ininterrupto, devendo serem repetidas incansavelmente em um processo de melhoria contínua.
Atenue os impactos promovidos pelas avaliações de performance
As ferramentas de gerenciamento e monitoramento de sistemas geram sem parar a maioria dos dados de rotina usados na análise e avaliação da infraestrutura, e essas informações alimentam dados de tendências de longo prazo. A medição por si só não é um exercício para solucionar ou corrigir problemas, embora muitas vezes recomende ações e projetos para a TI como resultado. Esses são os verdadeiros impactos.
Entretanto, pode haver trabalho adicional envolvido nas operações de TI. Algumas medições de performance de TI exigem ferramentas especializadas ou verificações ad hoc do sistema para coletar métricas específicas ou outros detalhes. Por exemplo, para testar o estresse de um servidor, a equipe de suporte de aplicativos ou operações de TI deve migrar suas cargas de trabalho ativas para outro local. Dependendo da infraestrutura, uma migração de hospedagem pode afetar os usuários do aplicativo.
Várias estratégias simples ajudam a minimizar interrupções quando o teste de desempenho do sistema é realizado em um ambiente de produção.
Limite o escopo da avaliação, para reduzir o número de sistemas e aplicativos submetidos a testes diretos. Execute as ações necessárias, como migração de VM, em um ambiente de desenvolvimento ou avaliação. Organize backups e outros planos de proteção de carga de trabalho antes dos testes de performance. Por fim, comunique os planos para toda a organização. Realize testes em janelas de tempo que afetem o menor grupo de usuários e informe-os quando ocorrerem possíveis interrupções.
A medição periódica da performance de TI permite que as organizações avaliem o estado atual de aplicativos e ambientes, comparem com dados anteriores, reconheçam oportunidades de melhorias significativas e tracem o melhor caminho a seguir para beneficiar os negócios. Embora seja muitas vezes desafiador e demorado, esse processo facilita análises vitais, que nem mesmo as estruturas de gerenciamento de sistemas mais inteligentes podem fornecer. Os gerentes de TI geralmente são chamados a planejar e implementar essas avaliações, fazendo delas um conjunto de habilidades que vale a pena desenvolver.
