Sobre o Projeto

O FakeCheck é um sistema que utiliza técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM) para auxiliar na detecção de notícias falsas em língua portuguesa. O sistema foi desenvolvido um LLM LightGBM.

Ao receber um um link da noticia, baixamos o conteudo e o sistema extrai atributos linguísticos como a frequência de palavras, a presença de classes gramaticais específicas e outras características relevantes. Esses atributos são então utilizados para alimentar um modelo de aprendizado de máquina treinado para classificar a notícia como verdadeira ou falsa.

Como Funciona ?

O sistema FakeCheck funciona em quatro etapas principais:

  1. **Pré-processamento:** O texto da notícia é pré-processado para remover ruídos, como pontuação, caracteres especiais e palavras irrelevantes.
  2. **Extração de Atributos:** São extraídos atributos linguísticos do texto pré-processado, como a frequência de palavras, a presença de classes gramaticais específicas e outras características relevantes.
  3. **Classificação:** Os atributos extraídos são utilizados para alimentar um modelo de aprendizado de máquina treinado para classificar a notícia como verdadeira ou falsa.
  4. **Interpretação dos Resultados:** O sistema apresenta o resultado da classificação, indicando a probabilidade de a notícia ser verdadeira ou falsa.

Modelos de Detecção

O FakeCheck oferece dois modelos de detecção de notícias falsas:

  • **Palavras do Texto:** Este modelo utiliza uma representação Bag of Words do texto, onde a presença ou ausência de uma palavra é marcada como 0 ou 1 em um vetor com 10395 posições (relativas às palavras mais importantes do córpus).
  • **Classes Gramaticais:** Este modelo calcula a porcentagem de palavras pertencentes à cada classe gramatical, de acordo com o tagger nlpnet.

Limitações

É importante ressaltar que o FakeCheck é um sistema em desenvolvimento e ainda apresenta algumas limitações:

  • **A acurácia do sistema pode variar dependendo do estilo da escrita e do tema da notícia.**
  • **O sistema não é capaz de detectar notícias falsas que se baseiam em informações falsas ou enganosas, mas que são bem escritas e não apresentam erros gramaticais ou ortográficos.**
  • **O sistema não é um substituto para a análise crítica e a verificação de fontes confiáveis de informação.**

O Projeto

O FakeCheck é um projeto desenvolvido por Dígito Inovação e Tecnologia. É um projeto desenvolvido pela Dígito Inovação e Tecnologia, uma empresa brasileira com foco em soluções digitais inovadoras. Tem como objetivo combater a desinformação e as notícias falsas que circulam online, principalmente nas redes sociais.