8 IA Aplicada à Pesquisa Reprodutível
8.1 Objetivos de Aprendizagem
8.2 Contextualização
A integração entre IA e CA está gerando discussões crescentes em editoras científicas e universidades, sendo fundamental para a criação de uma cultura de pesquisa transparente e reprodutível. A discussão sobre CA representa uma mudança cultural necessária.
A crise de reprodutibilidade afeta diversas áreas científicas de forma independente, com periódicos tendo dificuldades crescentes em garantir que pesquisas publicadas possam ser replicadas por outros pesquisadores. Um problema significativo é a dificuldade de encontrar bases de dados organizadas em artigos publicados nos principais periódicos, o que compromete tanto o ensino quanto a formação de novos pesquisadores.
As cinco principais editoras científicas (Wiley, Taylor & Francis, entre outras) controlam 50% da produção científica mundial, criando um ciclo vicioso que dificulta o avanço da CA. O governo brasileiro recentemente aumentou contratos com editoras para pagar taxas de APC (Article Processing Charges) aos autores, o que aumentou o faturamento das editoras sem necessariamente beneficiar o desenvolvimento da CA.
Este cenário levanta questões fundamentais sobre equidade de acesso e sustentabilidade do modelo atual de publicação científica, especialmente quando combinado com o uso crescente de ferramentas de IA que também apresentam custos significativos.
8.3 Aplicações Práticas da IA na Pesquisa
8.3.1 Documentação e Organização
A IA demonstra grande eficácia no trabalho com documentação, frequentemente um gargalo significativo para pesquisadores. É possível utilizar ferramentas de IA para documentar trabalhos já realizados, criando pastas, codebooks de variáveis e estruturas organizacionais, mantendo-se dentro dos direitos autorais do pesquisador.
Essa aplicação representa uma perspectiva de treinamento, permitindo que pesquisadores aprendam execuções de processos ao solicitar que a IA gere documentação a partir de sites ou materiais existentes. O uso de IA para documentação é considerado eticamente aceitável, pois a ferramenta está trabalhando dentro do conteúdo e dos direitos autorais do próprio pesquisador.
8.3.2 Geração e Otimização de Código
A IA pode auxiliar significativamente na perspectiva de códigos, especialmente para pesquisadores com dificuldades em programação. Algumas revistas permitem que pesquisadores utilizem plataformas como Google Colab, inserindo códigos e utilizando ferramentas como Gemini para executar processos completos, facilitando o compartilhamento de código.
Essa capacidade de gerar código automaticamente pode ser crucial para garantir que outros pesquisadores consigam replicar análises, mesmo sem conhecimento profundo de programação. A geração de código por IA permite que mais pesquisadores participem de práticas de CA, democratizando o acesso às metodologias quantitativas.
8.3.3 Tradução de Textos Científicos
A tradução representa uma aplicação considerada totalmente aceitável no uso de IA para pesquisa científica. Por exemplo, os instrutores desse curso constumam adotar o seguinte fluxo de trabalho: primeiro utiliza o Google Tradutor, seguido por refinamento com IA para ajustar a linguagem conforme a área específica, e finalmente revisão parágrafo por parágrafo utilizando ferramentas como Grammarly ou quilboot.
Alternativas incluem ferramentas como PaperPal, desenvolvida por editoras. Editores de revistas de alto impacto consideram bem aceitável usar IA para tradução, especialmente para falantes não nativos como mecanismo de coesão textual, desde que monitorada pelos autores.
8.4 Transparência e Questões Éticas
8.4.1 Declaração de Uso
Embora a IA juridicamente não possa ser coautora de trabalhos científicos, a questão da transparência sobre seu uso permanece central. Uma proposta é utilizar os “credit roles” (papéis de crédito) já existentes em submissões de artigos para declarar de forma transparente onde e como a IA foi utilizada no processo de pesquisa.
Documentar o uso de IA na seção de métodos deve especificar como e quando a ferramenta foi utilizada. Registrar versões, prompts e outputs de forma similar ao que se faz com bases de dados e códigos de análise. Sempre que possível, utilizar ferramentas abertas, dependendo da viabilidade orçamentária.
8.4.2 Desafios das Plataformas Point-and-Click
As principais plataformas de IA no ambiente de pesquisa científica são basicamente “point and click”, executando processos sem oferecer total confiabilidade sobre a execução, o que pode se tornar um dilema ético e metodológico.
Quanto mais se utiliza plataformas que apenas executam comandos sem mostrar o processo, mais se terceiriza o conhecimento científico. Isso cria uma barreira significativa para a CA, pois grande parte da IA usada para pesquisa científica são aquelas em que não há acesso ao algoritmo subjacente.
8.4.3 Modelos Abertos versus Proprietários
Existem discussões crescentes sobre o uso de modelos abertos versus proprietários. A integração com IA levanta questões sobre acessibilidade e equidade. Plataformas como Semantic Scholar oferecem APIs abertas para conectar bases de dados diretamente, com tokens acessíveis, permitindo formatar prompts e compartilhar na rede de forma controlada.
Modelos proprietários podem ampliar ou reduzir a equidade de acesso. Quando se usa IA gratuita, na verdade está-se ajudando a treinar o modelo para que usuários pagos depois utilizem versões mais validadas. A discussão central envolve quem tem acesso a ferramentas de IA na ciência, considerando os custos crescentes das plataformas que passaram de assinaturas para pagamento por crédito.
8.5 Proposta de Integração: FAIR + IA
Os princípios FAIR (Findable, Accessible, Interoperable, Reusable) são amplamente reconhecidos em CA. Uma proposta emergente sugere adaptar esses princípios para incluir integração com IA.
8.5.1 F - Findable (Encontrável)
A IA pode enriquecer metadados através de deep research na internet, encontrando informações com maior velocidade. O desafio é garantir acesso ao output da IA, já que muitas plataformas entregam apenas o resultado final, não o processo. Uma estratégia para acessar o processo é utilizar “cadeia de pensamento” (chain of thought) em prompts.
8.5.2 A - Accessible (Acessível)
A questão da acessibilidade envolve repositórios abertos e licenças claras. A integração com IA levanta questões sobre modelos abertos versus proprietários, com implicações diretas para quem tem acesso a ferramentas de IA na ciência.
8.5.3 I - Interoperable (Interoperável)
A interoperabilidade requer padrões de dados e vocabulário controlado. APIs abertas facilitam a integração, mas surge a questão: como garantir reprodutibilidade com diferentes IAs, considerando que cada IA tem algoritmo e treinamento próprios?
8.5.4 R - Reusable (Reutilizável)
A documentação através de logs de uso e versionamento de prompts (etapa um, dois, três) é fundamental, embora seja difícil reutilizar prompts de forma exata. Quando um modelo é atualizado (exemplo: do GPT 5.1 para 5.2), nunca se chega ao mesmo resultado, exigindo estudo de nova teoria e novos prompts.
8.6 Níveis de Integração com Ciência Aberta
A integração entre IA e ciência aberta pode ser concebida em três níveis de maturidade crescente:
8.6.1 Nível Básico
Trabalho disponível em CA com declaração de uso de IA para documentação e código. Especificação das etapas onde IA foi utilizada, com políticas mínimas de controle estabelecidas.
Neste nível, o foco está em transparência básica sobre onde e como a IA foi empregada no processo de pesquisa.
8.6.2 Nível Intermediário
Disponibilização de dados e código com versionamentos ou prompts tecnicamente documentados. Ações concretas incluem treinamento de pesquisadores com experiência de outros usuários das plataformas de IA.
Este nível envolve não apenas declaração, mas documentação técnica completa que permita rastreamento do processo.
8.6.3 Nível Avançado
Pré-registro e peer review aberto integrados com modelo aberto e pipeline reproduzível. Requer infraestrutura adequada (computador e organização). A referência seria uma ciência integrada à comunidade, com IA como colaboradora mostrando todas as etapas.
Algoritmos como o AI Scientist demonstram que todo o fluxo de geração de pesquisa deve ter supervisão humana, com IA entrando como colaboradora e sempre havendo quem está fazendo e avaliando a pesquisa de maneira integrada.
8.7 Boas Práticas e Recomendações
8.7.1 Para Uso Ético
As principais recomendações para uso ético de IA em pesquisa incluem:
- Documentar o uso de IA na seção de métodos, especificando como e quando foi utilizada
- Registrar versões, prompts e outputs, similar ao que se faz com bases de dados e códigos de análise
- Sempre que possível, utilizar ferramentas abertas, dependendo da viabilidade orçamentária
- Ser transparente sobre as limitações e incertezas associadas ao uso de IA
8.7.2 Para Ensino
No contexto educacional, recomenda-se que estudantes compartilhem prompts para entender como chegaram aos resultados, aplicando a mesma perspectiva de IA generativa à CA. Plataformas como ChatGPT e Gemini oferecem modos de aprendizado e estudo específicos, representando um dos principais caminhos para trabalhar com o próprio aprendizado.
É importante estabelecer diretrizes claras sobre o que pode ou não ser feito com IA em trabalhos acadêmicos, promovendo uso responsável ao invés de proibição. A transparência por parte de educadores sobre seu próprio uso de IA também é fundamental para criar um ambiente de confiança e aprendizado.
8.8 Aplicações da IA neste Curso
Este curso adota o uso de Inteligência Artificial Generativa (IA) 🤖 como ferramenta de apoio metodológico e pedagógico, alinhado às diretrizes éticas e responsáveis propostas por Sampaio et al. (2024). A IA é utilizada exclusivamente em funções complementares, que ampliam a eficiência do trabalho científico e a acessibilidade dos conteúdos, sem substituir o trabalho intelectual, crítico e autoral dos pesquisadores.
Consideramos que o uso da IA generativa na pesquisa científica representa um caminho sem volta. Por isso, o ensino de CA e reprodutibilidade deve incorporar essa realidade — tanto no processo de produção do conhecimento, quanto na transmissão e avaliação do aprendizado. Ignorar essa transformação tecnológica seria negligenciar o potencial de inovação, transparência e inclusão que ela oferece para a prática da CA.
Seguindo os princípios de preservação da agência humana, transparência e uso eticamente orientado preconizados por Sampaio et al. (2024), a IA tem sido empregada nas seguintes funções ao longo do desenvolvimento e execução deste curso:
📚 Resumo de materiais didáticos: Síntese de artigos científicos, documentações técnicas e materiais extensos para facilitar a compreensão inicial e identificação de pontos-chave, sempre com revisão e contextualização humana.
💻 Auxílio na codificação: Suporte para escrita, depuração e otimização de códigos em R, Python e outras linguagens, acelerando o desenvolvimento de exemplos práticos e soluções técnicas.
🧭 Reflexão e estruturação de conteúdos: Apoio na concepção de roteiros didáticos, organização lógica de tópicos e desenvolvimento de sequências de aprendizagem mais coerentes.
🔍 Busca e seleção de literatura: Identificação preliminar de referências relevantes, mapeamento de debates atuais e descoberta de fontes complementares, sempre com curadoria humana final.
🎨 Elaboração de imagens e vídeos: Criação de elementos visuais e recursos multimídia para enriquecer a experiência de aprendizado e tornar conceitos complexos mais acessíveis. Nessa função utilizamos “com força”, pois temos zero habilidade artística ou sensibilidade estética 😁.
✅ Revisão de conteúdo: Suporte na revisão gramatical, clareza textual e coerência argumentativa dos materiais didáticos, mantendo a autoria e decisão final humanas.
🌐 Tradução de literatura: Tradução preliminar de materiais em idiomas estrangeiros para ampliar o acesso a recursos internacionais, com revisão técnica posterior.
🎓 Ensino preliminar de tópicos: Exploração inicial de áreas fora da zona de conhecimento consolidado dos instrutores, servindo como ponto de partida para aprofundamento posterior com fontes especializadas.
8.8.1 Princípios Norteadores
Conforme Sampaio et al. (2024), a IA deve ser utilizada como apoio à expressão humana — e não como substituto da reflexão, da análise crítica ou da autoria. É essa perspectiva que orienta todas as aplicações tecnológicas neste curso. Os autores destacam que a supervisão humana contínua é essencial para evitar que a IA incorpore erros, vieses ou problemas de integridade acadêmica.
Ademais, seguimos os princípios práticos estabelecidos no guia:
- ✨ Transparência: Documentar quando e como a IA foi utilizada na produção de materiais
- 🎯 Integridade acadêmica: Garantir originalidade, evitar plágio e preservar direitos autorais
- 👤 Agência humana: Manter o pesquisador/instrutor como responsável final por todas as decisões
- 🧠 Letramento em IA: Desenvolver compreensão crítica sobre limitações e potencialidades das ferramentas
- 🔄 Uso complementar: Empregar a IA como ferramenta auxiliar, nunca como substituta do trabalho científico
8.8.2 Contexto da Ciência Aberta
O uso transparente e documentado de ferramentas de IA pode alinhar-se perfeitamente com os princípios da CA 🔓: transparência, reprodutibilidade e compartilhamento de processos e recursos. Ao adotar IA de forma ética e responsável, contribuímos para uma cultura científica mais eficiente, inclusiva e, sobretudo, transparente sobre seus métodos e ferramentas.
Nenhum conteúdo deve ser gerado de forma integral ou automatizada sem supervisão docente. Todo material deve passar por processo de curadoria, validação e contextualização humana, respeitando os princípios de autoria, originalidade e responsabilidade acadêmica (Sampaio et al., 2024).
8.9 Um Exemplo Prático: A Elaboração dessa Página
Este módulo representa um exemplo concreto de integração entre IA e CA no processo de produção de material educacional. O texto que está sendo lido foi elaborado a partir da transcrição da aula síncrona do módulo, seguindo um fluxo de trabalho que ilustra os conceitos discutidos ao longo deste módulo.
8.9.1 Fluxo de Trabalho Utilizado
Etapa 1 - Obtenção da Transcrição: A aula síncrona foi gravada, a transcrição automática foi obtida via YouTube, copiada para documento Word e posteriormente convertida para PDF.
Etapa 2 - Processamento com IA: A transcrição em PDF foi fornecida a uma ferramenta de IA conversacional (Perplexity AI) com o seguinte prompt inicial:
“Crie um resumo detalhado e objetivo da transcrição em anexo sobre IA em Pesquisas Reprodutíveis. Extraia apenas o conteúdo científico e pedagógico, excluindo identificação de falantes e interações entre participantes. Organize por seções temáticas.”
Etapa 3 - Estruturação do Conteúdo: Após o resumo inicial, foi solicitado à IA que estruturasse o conteúdo seguindo o padrão dos módulos anteriores do curso, com as seções: Objetivos de Aprendizagem, Contextualização e Preparação para a Aula.
Etapa 4 - Refinamento Iterativo: O processo envolveu múltiplas iterações de refinamento, com prompts específicos para: - Remover marcas de oralidade e referências temporais - Eliminar menções aos palestrantes e participantes - Tornar o texto impessoal e acadêmico - Ajustar o conteúdo para focar exclusivamente no que foi discutido na transcrição
Etapa 5 - Supervisão Humana: Todo o processo foi supervisionado por humano, com revisão crítica de cada versão gerada, correção de imprecisões, adequação ao contexto do curso e validação do conteúdo final.
8.9.2 Transparência e Documentação
Este exemplo demonstra os princípios discutidos no módulo:
- Declaração de uso: IA foi utilizada para extração, organização e formatação do conteúdo
- Versionamento: múltiplas iterações foram necessárias, cada uma com prompt específico
- Supervisão humana: decisões sobre estrutura, ênfase e adequação pedagógica permaneceram sob controle humano
- Limitações reconhecidas: a IA não criou conhecimento novo, apenas reorganizou conteúdo existente
- Documentação do processo: este relato permite que outros compreendam como o material foi produzido
8.9.3 Reflexões sobre o Processo
Este caso ilustra como IA pode ser ferramenta valiosa para documentação e organização de conhecimento, especialmente quando:
- Há conteúdo rico mas não estruturado (transcrição de aula)
- Necessita-se transformar oralidade em texto acadêmico
- Deve-se manter fidelidade ao conteúdo original enquanto se adequa a formato específico
- A supervisão humana garante qualidade, precisão e adequação pedagógica
Também evidencia limitações: a IA não pode capturar nuances, exemplos visuais mostrados na aula, ou contextos implícitos. A transcrição automática pode conter erros que se propagam no processo. E, fundamentalmente, a qualidade final depende da qualidade da supervisão humana e dos prompts fornecidos.
8.10 Preparação para a Aula
Para uma compreensão mais profunda sobre o uso ético da IA no contexto acadêmico e científico, recomenda-se a leitura de Sampaio et al. (2024), que discute fundamentos importantes para o tema abordado neste módulo.