Por dentro da pane global da CrowdStrike com o boy da informática
Paulo Rebêlo | 24.julho.2024
As manchetes só querem saber da desistência de Joe Biden, até mesmo no Brasil, como se a gente pudesse votar na Kamala Harris. A real é que, cinco dias depois, ainda há milhares de voos atrasados, aparelhos hospitalares inoperantes e indústrias inteiras com a produção em pausa.
Escolas, governos, bancos e serviços de emergência tentam voltar ao normal a passos lentos. Para quem está do lado de cá da tecnologia, o efeito dominó tem sido frustrante.
Os gringos da CNN dizem que o bug da CrowdStrike é a maior pane de tecnologia já registrada até hoje, mas sabe quem salvou o planeta de uma verdadeira hecatombe?
O boy da informática.
Se não fosse por essa figura cada vez mais rara e sempre tão injustiçada, até este meu chinfrim boletim estaria com dificuldade de chegar no seu e-mail.
O boy da informática é aquele guri ou guria que você chama quando a impressora dá problema, mas basta ele se aproximar e a impressora volta a funcionar sozinha, não é mesmo?
Parece mágica, e talvez seja, porque não deixa de ser uma feitiçaria essa capacidade dos micreiros de conversar com a máquina. Um diálogo de iguais.
Nesta pane microsoftiana que segue afetando o planeta desde o dia 19 de julho, a maior parte do problema poderia ter sido resolvida se tivessem chamado o boy da informática. No entanto, como a CrowdStrike é multibilionária e atende quase metade das empresas listadas no Fortune 500 — aquele ranking das 500 empresas mais ricas dos Estados Unidos – o pessoal achou que seria um problema complexo demais para o boy.
Não era.
Convocaram os engenheiros da Microsoft, justamente aquela turma com a maior ficha corrida de apocalipses autoinfligidos. Um séquito com zero imputabilidade no mercado.
Depois que o bug da CrowdStrike se propagou por causa de um update esquizofrênico da própria empresa, logo nas primeiras horas se soube que havia duas soluções básicas de recuperação. O problema é que só uma pessoa tinha condições de resolver: o boy da informática.
O remédio contra o bug tinha efeito imediato e dependia de quatro passos super simples para qualquer boy, mas esse cargo tem desaparecido cada vez mais, sobretudo nas megaempresas com megacontratos terceirizados por quem vende milagres.
A primeira coisa a fazer era iniciar o Windows pelo modo de segurança. Você sabe fazer isso?
Pois é. Quantas pessoas dentro de uma empresa, incluindo diretores de tecnologia e engenheiros, sabem iniciar o computador em modo de segurança? Quase ninguém. A gente lida (a contragosto) quase diariamente com gestores “técnicos” que não conhecem sequer o termo.
O segundo passo era navegar manualmente para dentro de uma pasta que, adivinhe só, o próprio Windows esconde… por motivos de segurança. Piada pronta, ok, mas um arroz com feijão para qualquer boy.
Não existe pasta escondida quando você e a máquina falam o mesmo idioma. Usando o prompt de comando (existe em todo sistema operacional, com nomes diferentes) e depois de navegar com arcaicos comandos de DOS, chega-se à fonte do bug: o diretório com as bibliotecas do software problemático da CrowdStrike, dentro da instalação do Windows, na subpasta /Windows /System32 /drivers /CrowdStrike/
Terceiro passo: apagar na tora o arquivo C-00000291*.sys dessa pasta.
Esse arquivo é a causa do bug, injetado dentro do Windows após um update automático da CrowdStrike, com a permissão (totalmente descabida e ridiculamente insegura) do sistema operacional, e que até agora muitas empresas não estão conseguindo apagar por não conseguir chegar nessa pasta. E não chegam nessa pasta porque o Windows não está carregando, e não carrega porque só vai funcionar em modo de segurança, e depois a pasta só aparece se acessar via prompt, sem nenhuma interface gráfica.
O quarto e último passo, abracadabra, é a mágica mais eficaz de todo sistema Windows há 39 anos: reiniciar o computador! O bom e velho reset vem salvando a vida dos computadores desde o Windows 1.0, que nasceu no dia 20 de novembro de 1985. Incrível.
Fim, acabou o problema. Sem o arquivo que gerou o conflito com o Windows, tudo volta a funcionar de imediato, sem cicatrizes e sem sequelas.
Você agora deve estar se perguntando: se é tão simples, por que ainda há tantos sistemas sem funcionar, voos atrasados e CEOs desesperados?
Porque essa não é a pergunta certa.
É um questionamento sem sentido em qualquer infraestrutura de TI. Quando um sistema cai por várias horas (e foi o que aconteceu por não chamarem logo o boy da informática), esse mesmo sistema sai derrubando outros sistemas vinculados a ele em efeito dominó. Não deveria acontecer, e há práticas antigas e comprovadas para não acontecer, mas acontece diariamente pela falta de resposta à pergunta certa de verdade:
— Por que a tecnologia na maioria das empresas depende de decisões de quem não entende porra nenhuma de coisa alguma de tecnologia?
Pensando bem, por que a gente ainda depende do Windows?
Como é que a maioria das empresas multibilionárias, quase todas integrantes do Fortune 500, permite rodar infraestrutura complexa em Windows? Nenhum computador com sistemas operacionais alternativos (e mais seguros), notadamente Linux e MacOS, foi afetado pelo bug. Nenhum. Zero.
Bugs espetaculosos afetam máquinas Windows por causa de uma série de práticas nocivas (de tecnologia) e decisões estapafúrdias (de gestão) que já foram documentadas há anos e anos.
Dois dias depois do bug, a Microsoft lavou as mãos e culpou verbalmente a CrowdStrike. Agora, cinco dias depois, está jogando a responsabilidade na União Europeia, justamente a única representatividade que tem questionado o passe livre que as Big Techs parecem ter no planeta inteiro.
Quase ninguém ouviu falar da CrowdStrike. Novatos, estão há cerca de dez anos no mercado e bem no topo da cadeia alimentar de um lobby trilionário no ramo de segurança digital. Vendem, por assinatura, uma plataforma (Falcon) contra vírus, invasões e qualquer tipo de ameaça. Desde que a ameaça não seja eles.
Ainda havia (há) uma segunda solução para o bug da CrowdStrike. É aquela sugestão que todo boy da informática insiste, mas ninguém da direção escuta: faça backup.
Ninguém faz.
E quando faz, é coisa para inglês ver, que em tecnologia significa pagar caro por soluções terceirizadas não-verificáveis e não-auditáveis. Só na hora que precisam do backup, percebem que não funciona ou está velho demais.
Esse efeito cascata de decisões erradas, infelizmente, não tem boy que resolva. Porque não depende mais de máquina, nem de código. Depende de gestão e coordenação, enfim, de tomada real de decisões.
E sabe qual é a maior ironia? Quem faz parte da Fortune 500 está tendo um prejuízo enorme agora, mas vai recuperar tudo em dobro.
Nestes últimos cinco dias, foi de 25% a queda no valor das ações da CrowdStrike. Os galerosos da Fortune 500 estão comprando loucamente esses papéis, na baixa, para vender na alta daqui a 3-6 meses, quando chegar uma nova atualização do software Falcon, quiçá uma nova plataforma da mesma CrowdStrike, com a promessa revigorada de mais segurança para suas operações complexas no Windows.
O boy da informática vai continuar sugerindo políticas de compliance em TI e ações de backup diário (ou de hora em hora, a depender da complexidade do sistema), para que a empresa possa se reerguer com facilidade e rapidez depois de um update desastroso ou incidente humano.
Mas ninguém escuta o boy da informática.
Só a impressora.