Dez anos de cobertura racial do jornal Folha de São Paulo: uma análise de títulos com jornalismo de dados

Dez anos de cobertura racial

Motivações pessoais

Em dez anos, MUITA coisa aconteceu; algumas, com impacto na população negra

  • Coletivamente: tivemos uma pandemia, cinco eleições, um golpe, a política de cotas raciais, diferentes campeonatos esportivos…

  • Individualmente: Pisei numa universidade pública pela primeira vez

Coleta de grande quantidade de dados

  • Após um piloto, percebi que precisava coletar muitos dados pra obter dados significativos

  • Inspiração: When women make the headlines, do The Pudding

A Folha de São Paulo

Por que a Folha de São Paulo?

  • Alcance

    • Cerca de 41 milhões de visitas no mês de outubro de 2023
  • Questões éticas e legais

    • Raspagem de dados
  • Contradições

Por que a Folha de São Paulo?

Títulos

Por que títulos?

Segundo o Manual de Redação da Folha de São Paulo (2022):

Títulos e subtítulos constituem o principal, quando não o único, ponto de contato de muitos leitores com a notícia. Sua formulação deve ser atraente e responsável, especialmente nas plataformas digitais, onde se perde a visão de conjunto.

O título antecede a pauta

Segundo a Folha (2022), a pauta é o “primeiro roteiro para a produção de reportagens, não é uma simples ideia, mas um plano de ação”.

De acordo com Moraes (2022)

Toda pauta organiza e desorganiza visibilidades e invisibilidades, toda pauta hierarquiza e desierarquiza vozes e representações, toda pauta estrutura e desestrutura discursos

Objetivos

  • Objetivo geral: Analisar dez anos de cobertura racial pelo jornal Folha de São Paulo utilizando técnicas do Jornalismo de Dados

  • Objetivos específicos:

    • Criar uma base de dados de notícias com temática racial da Folha de S. Paulo;

    • Analisar a base de dados criada com técnicas de Jornalismo de Dados, explorando o fluxo de trabalho com dados;

    • Apresentar os achados por meio de uma narrativa com dados.

Jornalismo de dados

O que são dados

  • Dados: Observações documentadas ou resultados da medição

  • Valores atribuídos à algo

  • Tudo está cada vez mais “dataficado”!

  • Processo ou E produto

Fluxo de Trabalho no DDJ

Consistiu na raspagem da página de busca da Folha de São Paulo, com as bibliotecas Selenium e BeautifulSoup da linguagem de programação Python.

  • Limpeza e padronização com editores de planilha e linguagem de programação

  • Análise descritiva: agrupar, sumarizar e ordenar;

  • Processamento de linguagem natural;

    -   Reconhecimento de entidades nomeadas
    
    -   Análise de ocorrências de palavras e bigramas

  • Gráficos de barras, colunas, nuvem de palavras, treemap

  • Estáticos: com ggplot2

    Interativos: com Flourish

  • Passo a passo, com rolagem da tela ou botões

  • Uso de HTML, CSS e Javascript

Resultados

O que eu encontrei

O que eu encontrei

O que eu encontrei

O que eu encontrei

Produtos

Limitações e potenciais

Limitações

  • O Jornalismo de Dados é um trabalho colaborativo e multidisciplinar

    • Apuração, design, desenvolvimento do site, estatística

    • Difícil fazer todas as etapas com o mesmo nível

  • Grande volume de notícias e pouco aprofundamento sobre elas

  • Isso é jornalismo?

Potenciais

  • As tecnologias estão aí e podem ser aliadas ou inimigas; é necessário saber lidar com elas

    • Inteligência artificial

    • Processamento de Linguagem Natural

    • Visualização de dados

Potenciais

  • Novas perguntas

    • Qual o “sentimento” dos títulos?

    • Qual o papel das imagens?

Novas perguntas

Potenciais

  • Novas aplicações dessa metodologia

    • Outras buscas na Folha para reconhecimento de padrões

    • Mesma busca em outros veículos da grande imprensa (G1, Estadão, etc.) e de mídias alternativas e antirracistas (Alma Preta ou Nós, mulheres da periferia, por exemplo)

Obrigada!