Prefácio

A origem

Este site nasceu de um convite. No início de 2026, o Prof. Dr. Fábio Lopes Rocha — psiquiatra, professor, mentor — me convidou para dar uma aula sobre análise de dados para o serviço de residência em psiquiatria da FHEMIG (Fundação Hospitalar do Estado de Minas Gerais). A pauta inicial era pequena — uma aula, uma manhã. O que acabou saindo foi este curso completo.

Esse projeto nasceu de dois acasos felizes que se encontraram na hora certa. Primeiro: eu acabava de terminar meu primeiro aplicativo de iPhone, escrito do zero usando vibe coding — descrevendo em português o que queria, deixando a IA escrever o código. Estava recém-publicado na Apple Store, e a experiência tinha sido transformadora. Em poucas semanas, sem ser desenvolvedor profissional, eu tinha um app funcionando, com publicação real numa loja real. Segundo: eu estudo R desde 2015, escrevi o Manual Básico da Linguagem R (Alvarenga da Silva, 2024) em 2024, e há quase uma década observo de perto como o R poderia ser o padrão de análise de dados nas universidades médicas brasileiras — sem nunca chegar a sê-lo de fato.

O R e Python como instrumentos para pesquisa

Sempre achei que o R ou Python pudessem se tornar o padrão de análise de dados nas universidades médicas. As razões eram conhecidas: São gratuitos, abertos, mais poderosos softwares proprietários, com comunidade ativa de bioestatísticos e epidemiologistas.

Mas a curva de aprendizado era enorme. Estudantes de medicina têm carga horária massiva, internato extenuante, residência implacável. Aprender uma linguagem de programação, mesmo amigável como R ou Python, exige tempo e disposição que jovens médicos pesquisadores raramente têm. Quando o professor de iniciação científica diz “use esse software”, o estudante usa esse software — e a faculdade paga a licença anual cara. O resultado, na prática, é uma pulverização desnecessária. Durante uma trajetória acadêmica de cinco a sete anos, um mesmo estudante passa por três, quatro, cinco softwares diferentes — porque cada professor de cada laboratório ensina o seu, e cada nova iniciacçõa científica envolve uma ferramenta nova. O estudante aprende todos superficialmente, não domina nenhum direito, e atrita contra a curva de aprendizado de cada um. Tempo perdido em coisa que poderia ser uma só ferramenta dominada bem.

Os LLMs e a possibilidade de gerar código a partir de descrição em linguagem natural mudam essa equação. A barreira da curva de aprendizado não desaparece, mas é rebaixada de “anos de prática” para “semanas de familiaridade”. O estudante de medicina hoje pode descrever em português o que quer fazer (“compare a pressão arterial entre os dois grupos com teste t e gere a tabela formatada para artigo”) e receber código R ou Python funcionando em segundos. Isso destrava a entrada de R e Python como tecnologias acessíveis a quem não é programador profissional — incluindo o pesquisador da área da saúde que tem outras prioridades.

As consequências institucionais:

Redução de custos. Universidades não precisam mais arcar com licenças anuais de softwares proprietários. Para uma instituição com centenas de estudantes e dezenas de pesquisadores, a economia chega a centenas de milhares de reais por ano.
Padronização. Adoção sistemática de R e Python como ambiente único elimina a pulverização atual. O estudante aprende um ambiente e o domina.
Reprodutibilidade. Análises em R e Python são código texto, versionável, auditável, recuperável. Análises em muitos outros softwares são feitas cliques, sequencias irreproduzíveis depois de meses, quanto mais anos.

Para quem é este material

Foi escrito pensando em professores universitários da área da saúde — porque professores são multiplicadores, e mudar a prática nas faculdades começa por convencer os mentores. Por extensão, serve também aos estudantes que esses professores formam: graduandos em iniciação científica, residentes (em qualquer especialidade — medicina, psicologia, enfermagem, fisioterapia, farmácia, odontologia), mestrandos, doutorandos, pós-doutorandos.

O pré-requisito é vontade de aprender uma forma nova de fazer pesquisa. Não é necessário saber programar. Não é necessário ter usado R ou Python antes. Familiaridade com qualquer software de análise de dados (SPSS, Stata, JASP, Excel) ajuda mas não é obrigatória.

O que este curso NÃO é

Para calibrar expectativas:

Não é um curso de programação. Não vai te transformar em desenvolvedor de R ou Python. Ensina a usar essas linguagens via IA.
Não é exaustivo sobre R ou Python. Para tratamento aprofundado, o curso aponta para o Manual Básico da Linguagem R do autor (Alvarenga da Silva, 2024) e para recursos curados de Python.
Não substitui um livro de bioestatística. Quem decide qual teste estatístico aplicar continua sendo você (com apoio de literatura ou estatístico humano). A IA implementa o teste; ela não escolhe o método metodologicamente correto.
Não é sobre vibe coding em geral. É sobre vibe coding aplicado especificamente a pesquisa em saúde — com exemplos do domínio, vocabulário do domínio, e considerações específicas (LGPD, dados de pacientes, recomendações ICMJE).

Ciência aberta

Este curso é gratuito, aberto, redistribuível. Todo o material está disponível publicamente em https://henriquealvarenga.com/vibe-coding, com fonte versionada no GitHub. Você pode usar para qualquer fim — incluindo como base para suas próprias aulas e materiais didáticos.

Como foi construído

Este curso foi escrito em menos de um mês. O tamanho do site — cinco módulos, treze blocos, em torno de oitenta capítulos, próximo de meio milhão de palavras — seria simplesmente impossível de produzir nesse prazo sem a ajuda de IA.

A redação dos capítulos foi feita em colaboração intensa com o Claude Cowork e o Claude Code, da Anthropic. O fluxo: eu defini estrutura, escopo, sequência didática, voz, e cada decisão editorial; os agentes de IA produziram o texto sob essa direção, capítulo por capítulo, em interação contínua. Decisões controvertidas (incluir ou excluir um tema, escolher um exemplo em vez de outro, manter ou cortar uma seção, deletar oito capítulos do M3-B3 porque a tese central tornava redundantes) sempre foram humanas; a redação propriamente dita teve participação massiva de IA.

Material em construção

Aviso importante: este material ainda não foi inteiramente revisado

Capítulos foram escritos em ritmo intenso, e nem todos passaram por leitura cuidadosa de erro, ambiguidade ou inconsistência.

Se você encontrar:

Erro factual (data errada, autoria errada, citação invertida)
Erro de lógica (afirmação que se contradiz com outra parte)
Erro técnico (código que não funciona, comando errado, link quebrado)
Tradução estranha, ambiguidade, ou expressão imprecisa
Sugestão de melhoria, capítulo faltando, tópico mal coberto

Por favor reporte. O repositório do curso está aberto no GitHub: qualquer pessoa pode abrir uma issue descrevendo o problema, propor uma correção via pull request, ou simplesmente mandar email. Cada reporte é genuinamente bem-vindo. Considere este curso uma obra viva, em iteração contínua, e não um produto finalizado.

Para reportar:

Issue no GitHub: [https://github.com/henriquealvarenga/vibe-coding.git]
Email: [henriquealvarenga@gmail.com]

Agradecimentos

Ao Prof. Dr. Fábio Lopes Rocha — psiquiatra, professor, mentor e amigo — pelo convite que catalisou tudo isto. Sem aquela aula proposta para o serviço de residência em psiquiatria da FHEMIG, este curso simplesmente não existiria.

— Henrique Alvarenga da Silva
13 de maio de 2026

Começar pelo Módulo 0 — Setup →

Referências

ALVARENGA DA SILVA, Henrique. Manual Básico da Linguagem R: Introdução à análise de dados com a linguagem R, RStudio e Quarto para área da saúde. [S. l.]: Edição do autor, 2024. Disponível em: https://henriquealvarenga.com/manual_r/.