Visualização de dados hipotéticos

A matéria do The Washington Post publicada em 14 de março e assinada por Harry Stevens tem como objetivo principal explicar a um público leigo diferentes cenários de propagação da Covid-19. Para tal, faz uso de recursos gráficos e narrativos. Primeiramente, a matéria introduz o conceito de curva exponencial através de um gráfico (Figura 1) que mostra a evolução da doença nos Estados Unidos entre 22 de janeiro (data do primeiro caso confirmado no país) até 13 de março. A curva exponencial se comporta como uma função exponencial. O gráfico é representado em escala linear e é eficaz na evidenciação da curva acentuada que retrata a rápida propagação do vírus na população. O uso de ícone no meio da frase (Figura 2) enfatiza a forma típica de uma curva exponencial e reforça o argumento de que, caso o número de casos continue a dobrar a cada três dias, haverá cerca de cem milhões de casos nos Estados Unidos até maio. A matéria, contudo, não oferece uma visão do gráfico em escala logarítmica. 

Figura 1 – A forma do gráfico é equivalente a uma função exponencial. Fonte: Washington Post.
Fig 2 – O uso de ícone no meio do texto reforça a forma típica de uma função exponencial. Fonte: Washington Post.

Na sequência, a matéria se esforça para esclarecer porque a simulação da propagação de epidemias em cenários de “distanciamento social”, segundo profissionais de saúde pública, é a melhor abordagem para desacelerar o contágio e, consequentemente, minimizar o impacto da doença. Para elucidar tal argumento, a matéria introduz noções básicas de sistemas dinâmicos em situações epidemiológicas a partir da constituição de um cenário de propagação de uma doença fictícia, chamada de simulitis. A invenção de uma doença para ilustrar o caso ao invés de basear-se na própria Covid-19 não é claramente justificada. No entanto, pode ser compreendida como uma estratégia narrativa para simplificar a explicação, eliminando parâmetros não essenciais para uma compreensão inicial. 

A explicação da propagação da doença simulitis é feita em dois níveis: o primeiro para aclarar as categorias de pessoas envolvidas em um cenário epidemiológico e o segundo para simular a disseminação em uma pequena população. 

Em um primeiro nível de explanação, sem mencionar que está explicando o modelo SIR, o texto apresenta a divisão de uma dada população em três categorias: pessoa saudável (equivalente à categoria S, de Suscetível), pessoa doente (equivalente à categoria I, de Infectada) e pessoa recuperada (equivalente à categoria R, de Recuperada). Para esclarecer a dinâmica de contágio, a matéria apresenta duas animações consecutivas. A primeira animação reforça algo talvez já bem compreendido no senso comum que é a disseminação da doença viral a partir do contato entre uma pessoa doente e uma pessoa saudável. Quando uma bolinha marrom encosta em uma bolinha azul, a última adquire a cor da primeira, uma metáfora visual do contágio (Animação 1). A segunda animação demonstra que uma pessoa doente se transforma, provavelmente, em uma pessoa recuperada (Animação 2).

Animação 1 – A animação explica a dinâmica de contágio.
Animação 2  – A animação explica a dinâmica de contágio e recuperação.

O texto, ao mesmo tempo que descreve a animação serve de legenda visual para entender as cores utilizadas (Figura 3).

Fig 3 – O texto é codificado visualmente para funcionar como legenda das animações.

Em um segundo nível de explanação, a matéria simula o modelo SIR em uma cidade também fictícia com população de 200 pessoas diante de quatro cenários: a – circulação livre para todos; b – quarentena forçada (ou tentativa de quarentena); c – distanciamento moderado e; d – distanciamento extensivo. Cada cenário é comunicado ao leitor através de uma animação composta por três elementos visual-gráficos: 1) contagem; 2) gráfico de mudança no tempo e; 3) uma simulação de circulação e contágio entre indivíduos da população. A animação 3 ilustra o comportamento da epidemia no cenário a, isto é, sem nenhuma ação de distanciamento social e a animação 4 ilustra o cenário b, isto é, de quarentena forçada tendo como referência a prática imposta pelo governo chinês na província de Hubei, o marco zero da Covid-19. Essa última animação inclui uma barreira que separa pessoas doentes de pessoas saudáveis, mas à medida que o tempo passa a barreira se rompe, demonstrando à impraticabilidade de quarentenas forçadas sem uma campanha de conscientização da população.

Animação 3 – Simulação da propagação do simulitis no cenário a – circulação livre para todos.
Animação 4 – Simulação da propagação do simulitis no cenário b – quarentena forçada.

Após apresentar as animações geradas para cada cenário, a matéria reforça que elas são baseadas em dados hipotéticos e que, a cada nova simulação, os dados serão renderizados de modo diferente. Contudo, mesmo com dados diferentes a cada novo play da animação, há uma forma padrão nos gráficos que é mantida. A Figura 4 sintetiza a forma padrão dos gráficos gerados para cada simulação.  

Fig 4 – A forma padrão dos gráficos simulados para cada um dos cenários de propagação de uma epidemia.

Esses gráficos são, mais especificamente falando, gráficos de área que comparam mudanças no tempo mostrando a proporção do total que cada categoria ocupa em determinado momento. Este tipo de visualização gera insights sobre tendências gerais e valores relativos. Por exemplo, nota-se que no:

  • cenário a – circulação livre para todos: aproximadamente toda população é infectada e a epidemia é erradicada em menor período de tempo;   
  • cenário b – tentativa de quarentena: aproximadamente toda população é infectada, mas a epidemia acontece em duas ondas o que leva mais tempo para erradicar totalmente a doença;
  • cenário c – distanciamento moderado: uma parcela menor é infectada em um período maior de tempo, o que leva mais tempo para erradicar totalmente a doença;
  • cenário d – distanciamento extensivo: uma parcela ainda menor é infectada e a epidemia é erradicada e um período de tempo semelhante ao do cenário a.

Sem se aprofundar na análise dos gráficos e nas implicações de cada um dos cenários, o jornalista sustenta que “o distanciamento social moderado geralmente supera a tentativa de quarentena, e o amplo distanciamento social geralmente é o que funciona melhor”.

A matéria do The Washington Post simplifica o complexo e dinâmico fenômeno de propagação de uma epidemia. Em condições concretas, outros fatores precisam ser considerados, inclusive a taxa de mortalidade de uma doença que, no caso da Covid-19, é real. Com exceção do primeiro gráfico (Figura 1) que ilustra o conceito de curva exponencial a partir de dados de um evento real e completo, as visualizações apresentadas na matéria são produzidas a partir de dados hipotéticos a partir de um modelo genérico. A riqueza da abordagem da matéria não é prever a evolução da Covid-19 para determinado país ou população, mas sim visualizar diferentes cenários de propagação de uma epidemia. Esses cenários, por sua vez, são essenciais à compreensão do conceito “achatamento da curva” que, embora não mencionado nesta matéria, foi amplamente disseminado por órgãos de saúde pública e meios de comunicação. Para falar sobre tal conceito, analisaremos o gráfico publicado pelo The Economist que foi rapidamente repercutido por diversos outros meios veículos, sendo inclusive adaptado para outros formatos. Veja a análise aqui.