ECBC Alfredo Guarischi
Para isso são necessárias algumas premissas. A primeira é comparar coisas comparáveis. A segunda é usar o método estatístico adequado e demonstrar que esse estudo realmente precisa ser realizado.
Comecemos de trás para frente.
Não tem sentido fazer uma pesquisa para provar que saltar de paraquedas de um avião é mais seguro do que saltar sem paraquedas. Dos relatos chineses no século XII ao desenho de Leonardo da Vinci em 1514, até o feito de Louis-Sébastien Lenormand, que, em 1783, saltou da torre de Montpellier, França, foi dolorosa a busca para evitar a morte dos balonistas acidentados. Mas o paraquedas continua sendo aperfeiçoado para permitir a entrega de suprimentos, em missões de salvamento, como esporte e até mesmo como arma de guerra.
O uso correto da estatística permite esclarecer se a taxa de sucesso de um tratamento é real ou obra do acaso. Vamos a um exemplo. Se você joga uma moeda para o alto, ela pode dar cara ou coroa. Se o experimento for repetido 10 vezes, o resultado pode ser 9 a 1 ou outro qualquer, inclusive 5 a 5. Se for repetido mil vezes, será impossível um resultado de 900 a 100, ou de 700 a 300. Qualquer grande desvio da média significa que há alguma característica desconhecida na moeda. Jogue 10 vezes. Experimente.
O resultado positivo repetitivo de um tratamento com uma determinada substância, em pequenos grupos com menos de 50 pacientes, não dá segurança em transformá-la no tratamento padrão, pois, nesses casos, é mais frequente a distribuição não uniforme de pacientes com características especiais ou outras doenças.
Mas qual é o tamanho de um estudo para mudar uma conduta médica? Comparemos um tratamento de 600 pacientes, divididos em dois grupos iguais, um recebendo o remédio A e outro o B. Se no grupo A ocorrer a cura em 60% dos pacientes e no grupo B em 50%, posso afirmar que o remédio A deva virar o tratamento padrão? A resposta é não. Precisamos de mais estudos. Com essa diferença de 10% entre os grupos, seria necessário testar 800 pacientes para reduzir a possibilidade de um resultado falso-positivo para menos de 5% e para que o poder estatístico – diferença real – chegue a 80%.
Por outro lado, se a superioridade entre os grupos fosse de 20% em vez de 10%, um experimento com 200 pacientes, se positivo ou negativo, teria significado estatístico. Isso é que ajuda na decisão de se estar oferecendo a cada paciente o que é na atualidade o melhor. A base da decisão está na ciência, e não no acaso.
Finalmente, é fundamental comparar coisas comparáveis. Recorro ao artigo publicado pelo British Medical Journal, em 2009, no qual James Barone, cirurgião-chefe da Stanford University, EUA, fez a comparação entre maçãs e laranjas, jargão usado para analisar publicações irrealísticas. De forma jocosa concluiu que ambas são frutas, podem ser transformadas em suco e doces, são esféricas e têm um tamanho médio semelhante, apenas diferem na cor. Ao final adverte que não devemos criticar a expressão “comparação entre maçãs e laranjas”, mas propõe usar uma expressão mais apropriada, como “não vamos comparar nozes com elefantes”. Este artigo se tornou um clássico nas críticas de estudos sem sentido.
Qualquer semelhança com algumas pesquisas atuais sobre o novo coronavírus não é mera coincidência.