Misinformation Identification with LLMs

Funded by FAPERGS · CNPq · PUCRS Financiado pela FAPERGS · CNPq · PUCRS

Funded by Financiamento

This project proposes a method for the automatic identification of misinformation, built on a Large Language Model (LLM) fine-tuned for the health domain in the Portuguese language. Misinformation is especially harmful in public health, where it undermines vaccination campaigns, spreads ineffective treatments, and erodes trust in institutions such as Brazil's Unified Health System (SUS). The guiding research question is how to integrate LLMs with Retrieval-Augmented Generation (RAG) to detect and counter scientific misinformation in health.

To accomplish this, we develop a new module for sentence-embedding generation combined with the RAG technique. This integration lets the model not only generate responses but also draw on external, trusted sources, reducing the occurrence of hallucinations. By grounding generation in reliable and up-to-date data, the system can flag potentially false or misleading assertions and suggest references that support or refute a claim. The system will be made available through an API for the analysis of external information.

Expected outcomes include a new fine-tuning module for sentence embeddings that adapts embedding models by modifying roughly 1% of the model's parameters, an LLM adapted to the health domain in Portuguese released openly on Hugging Face, and a functional RAG system for misinformation reduction, alongside scientific publications and technical reports.

Este projeto propõe um método para a identificação automática de desinformação, baseado em um LLM ajustado para o domínio da saúde no idioma português. A desinformação é especialmente danosa na saúde pública, onde compromete campanhas de vacinação, dissemina tratamentos ineficazes e enfraquece a confiança em instituições como o Sistema Único de Saúde (SUS). A pergunta de pesquisa que orienta o projeto é como integrar LLMs a sistemas de Recuperação e Geração de Informações (RAG) para detectar e combater a desinformação científica em saúde.

Para isso, desenvolvemos um novo módulo para geração de embeddings de sentença combinado com a técnica de RAG. Essa integração permite que o modelo, além de gerar respostas, utilize fontes externas consideradas confiáveis, reduzindo a ocorrência de alucinações. Ao ancorar a geração em dados confiáveis e atualizados, o sistema consegue sinalizar asserções potencialmente falsas ou enganosas e sugerir referências que corroborem ou refutem uma afirmação. O sistema será disponibilizado por meio de uma API, permitindo a análise de informações externas.

Os resultados esperados incluem um novo módulo para fine-tuning de embeddings de sentença que adapta modelos modificando cerca de 1% dos parâmetros, um LLM adaptado ao domínio da saúde em português disponibilizado abertamente na Hugging Face e um sistema de RAG funcional para redução de desinformação, além de publicações científicas e relatórios técnicos.

Research Axes Eixos de Pesquisa

Efficient Sentence-Embedding Fine-tuning Fine-tuning Eficiente de Embeddings de Sentença

An attention-based neural module that fine-tunes sentence-embedding models by adjusting only about 1% of trainable parameters, a smaller fraction than LoRA, making large embedding models viable under limited compute. Um módulo neural baseado em atenção que faz fine-tuning de modelos de embeddings de sentença ajustando apenas cerca de 1% dos parâmetros treináveis, fração menor que o LoRA, viabilizando modelos grandes sob recursos computacionais limitados.

Health-Domain LLM in Portuguese LLM de Saúde em Português

Fine-tuning and instruction-tuning of an open LLM for health content in Portuguese, so it can interpret medical terminology and evaluate news and social-media posts for fact-dependent assertions. Fine-tuning e instruction-tuning de um LLM aberto para conteúdo de saúde em português, capaz de interpretar terminologia médica e avaliar notícias e postagens em redes sociais quanto a asserções que dependem de fatos.

RAG for Misinformation Detection RAG para Detecção de Desinformação

A RAG system, fed by trusted scientific and governmental sources, that analyzes a message, text, or news item, identifies potentially false content, and suggests references to corroborate or refute the claim. Um sistema de RAG, alimentado por fontes científicas e governamentais confiáveis, que analisa uma mensagem, texto ou notícia, identifica conteúdo potencialmente falso e sugere referências para corroborar ou refutar a asserção.

Project Details Detalhes do Projeto

Funder Financiador

FAPERGS · CNPq

FAPERGS call Edital FAPERGS

FAPERGS 10/2024 · ARD/ARC FAPERGS 10/2024 · ARD/ARC

CNPq call Chamada CNPq

CNPq/Decit/SECTICS/MS Nº 30/2024 CNPq/Decit/SECTICS/MS Nº 30/2024

Institution Instituição

PUCRS

Timeline Período

2025 – 2027

Public record Registro público

Pesquisa Saúde · MS

Team Equipe

Coordinator Coordenador

Lucas S. Kupssinskü

Professor / Researcher Professor / Pesquisador

Rodrigo C. Barros

Postdoctoral Researcher Pós-Doutorado

Christian Mattjie

Ph.D. Students Doutorado

Marcelo M. Delucis
Otávio Parraga
Rafaela Ravazio

Master's Students Mestrado

Jerusa Dalbosco Finatto
Joana M. Pasquali
Lucas M. Fraga
Pedro P. Wagner

Undergraduate Researchers Iniciação Científica

Arthur Domingues Fachel Nunes
Pedro T. Barcelos
Yasmin C. Aguirre