Pular para o playerIr para o conteúdo principal
  • há 4 meses
Transcrição
00:00Na semana passada, uma pane causou um apagão na AWS, a nuvem da Amazon.
00:06Ontem, outra Big Tech, a Microsoft, passou por problema parecido.
00:12E como a AWS derrubou centenas de sites e aplicativos mundo afora?
00:18Vamos ver os detalhes.
00:22A Microsoft detalhou o que causou o apagão global que tirou do ar o Azure.
00:28Seu serviço de computação em nuvem, nesta quarta-feira.
00:32O problema, que durou cerca de oito horas, foi provocado por uma mudança feita por engano
00:37numa configuração interna do Azure Front Door,
00:41um sistema que distribui o tráfego entre servidores da empresa no mundo todo.
00:45O sistema de segurança, que deveria bloquear alterações incorretas, também falhou.
00:51Um defeito de software permitiu que a configuração passasse pelas verificações internas sem ser barrada.
00:57A falha afetou uma série de produtos e serviços da companhia, como o Microsoft 365, o Xbox e o Co-Pilot para segurança,
01:07além de clientes corporativos que dependem do Azure para manter plataformas online.
01:12A Alaska Airlines e a Hawaiian Airlines relataram instabilidades em seus sites e aplicativos,
01:19enquanto o aeroporto de Heathrow, em Londres, e a Vodafone tiveram interrupções temporárias.
01:25A Microsoft diz que o serviço foi restaurado ainda na noite de quarta,
01:30após um processo de recuperação gradual que exigiu reconfigurar e reequilibrar milhares de servidores.
01:37A companhia afirma que manteve comunicação constante com clientes corporativos por meio da ferramenta Azure Service Health
01:44e que vai publicar um relatório final dentro de 14 dias, com mais detalhes sobre o incidente.
01:51E no ano passado nós tivemos o apagão da CrowdStrike, dez anos atrás o da AWS, agora o da Microsoft Azure.
02:08Essas falhas estão ficando mais comuns? Será?
02:12Existem barreiras tecnológicas para tornar esses serviços mais seguros?
02:17Bom, nós conversamos com o especialista em tecnologia e inovação, Arthur Igreja,
02:23para entender um pouco melhor esse cenário. Vamos conferir.
02:27Essas seguidas falhas com os grandes sistemas de nuvem, com os grandes provedores de infraestrutura,
02:34estão evidenciando algo que aconteceu progressivamente nos últimos 15 anos.
02:39A chegada da nuvem foi a grande revolução tecnológica que aconteceu entre os smartphones e a inteligência artificial,
02:46por uma série de fatores.
02:48Ganhos de escala, já que quem oferece esse serviço acaba tirando a necessidade de investimento em infraestrutura
02:55por parte de grandes, médias e pequenas empresas que não têm isso como sua atividade fim,
03:00sem contar com a disponibilidade de conexão muito mais rápida,
03:05que propiciou não só esse armazenamento, mas a disponibilidade desses serviços em tempo real.
03:12Pois é, só que a partir do momento que praticamente todas as empresas vão na mesma direção
03:16e que nós temos uma grande concentração por parte desses provedores,
03:21o que acontece é que qualquer coisa que der errado pode alcançar um estado de calamidade
03:27em termos de escala e de indisponibilidade dos serviços.
03:31É isso que aconteceu recentemente com a AWS, a divisão de nuvem da Amazon,
03:36e agora com a nuvem da Microsoft, que acaba prejudicando em ambos os casos,
03:42inclusive as próprias empresas que oferecem esses serviços para terceiros.
03:46Do ponto de vista das empresas que contratam esses serviços, é bastante crítica esse tipo de situação,
03:54porque fica para elas não só a crise com os seus consumidores, mas também as perdas de receita.
04:00Então, quando o assunto é nuvem, a disponibilidade e o fato de ter resiliência no serviço
04:05são atributos que são imperativos.
04:07O grande problema é que para ter redundância, aí perde-se justamente uma das principais vantagens,
04:14que é transformar aquilo que era custo fixo, em termos de infraestrutura, em custos variáveis.
04:21Ou seja, contar com mais de um provedor acaba aumentando drasticamente essas vantagens em termos de custo.
04:28Espera-se que isso seja um grande alerta para que essas empresas possam internamente rever os seus processos,
04:36rever as tecnologias que eles utilizam, os testes que são feitos nas atualizações,
04:42que podem ser desastrosas, como foi o caso da Microsoft,
04:45ou até falhas operacionais graves, como parece ter sido o caso da AWS.
04:51Fato é que me parece um caminho absolutamente sem volta,
04:54mas, por outro lado, para serviços críticos, acredito que as empresas vão considerar mais e mais
05:00edge computing, computação local, modelos híbridos, que muitas empresas já adotam.
05:06Então, devemos ter um crescimento também para atividades críticas desse tipo de estratégia
05:11que conta, não necessariamente com os menores custos,
05:16mas com o melhor dos dois mundos em termos de disponibilidade.
05:19Então, esses episódios são gravíssimos e não é uma coincidência que eles tenham acontecido um depois do outro.
Comentários

Recomendado