Sobre o Projeto
O FakeCheck é um sistema que utiliza técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM) para auxiliar na detecção de notícias falsas em língua portuguesa. O sistema foi desenvolvido um LLM LightGBM.
Ao receber um um link da noticia, baixamos o conteudo e o sistema extrai atributos linguísticos como a frequência de palavras, a presença de classes gramaticais específicas e outras características relevantes. Esses atributos são então utilizados para alimentar um modelo de aprendizado de máquina treinado para classificar a notícia como verdadeira ou falsa.
Como Funciona ?
O sistema FakeCheck funciona em quatro etapas principais:
- **Pré-processamento:** O texto da notícia é pré-processado para remover ruídos, como pontuação, caracteres especiais e palavras irrelevantes.
- **Extração de Atributos:** São extraídos atributos linguísticos do texto pré-processado, como a frequência de palavras, a presença de classes gramaticais específicas e outras características relevantes.
- **Classificação:** Os atributos extraídos são utilizados para alimentar um modelo de aprendizado de máquina treinado para classificar a notícia como verdadeira ou falsa.
- **Interpretação dos Resultados:** O sistema apresenta o resultado da classificação, indicando a probabilidade de a notícia ser verdadeira ou falsa.
Modelos de Detecção
O FakeCheck oferece dois modelos de detecção de notícias falsas:
- **Palavras do Texto:** Este modelo utiliza uma representação Bag of Words do texto, onde a presença ou ausência de uma palavra é marcada como 0 ou 1 em um vetor com 10395 posições (relativas às palavras mais importantes do córpus).
- **Classes Gramaticais:** Este modelo calcula a porcentagem de palavras pertencentes à cada classe gramatical, de acordo com o tagger nlpnet.
Limitações
É importante ressaltar que o FakeCheck é um sistema em desenvolvimento e ainda apresenta algumas limitações:
- **A acurácia do sistema pode variar dependendo do estilo da escrita e do tema da notícia.**
- **O sistema não é capaz de detectar notícias falsas que se baseiam em informações falsas ou enganosas, mas que são bem escritas e não apresentam erros gramaticais ou ortográficos.**
- **O sistema não é um substituto para a análise crítica e a verificação de fontes confiáveis de informação.**
O Projeto
O FakeCheck é um projeto desenvolvido por Dígito Inovação e Tecnologia. É um projeto desenvolvido pela Dígito Inovação e Tecnologia, uma empresa brasileira com foco em soluções digitais inovadoras. Tem como objetivo combater a desinformação e as notícias falsas que circulam online, principalmente nas redes sociais.