IA supera médicos em triagem de emergência, aponta estudo de Harvard

Um estudo publicado na revista Nature pela Harvard Medical School testou o modelo O1, da OpenAI, em 76 pacientes reais atendidos em um pronto-socorro de Boston.
A IA acertou o diagnóstico em 67% dos casos, enquanto médicos humanos acertaram entre 50 e 55%. Quando os dados clínicos completos estavam disponíveis, a precisão da IA chegou a 82%.
| 67% diagnósticos corretos pela IA | 82% precisão com dados clínicos completos | 89% acerto em planos de tratamento complexos |
O que a pesquisa da Harvard encontrou
A pesquisa da Harvard Medical School avaliou se sistemas de inteligência artificial conseguiriam superar médicos humanos em tarefas de triagem e diagnóstico em emergências hospitalares.
A pesquisa envolveu 76 pacientes reais atendidos em um pronto socorro de Boston e os resultados foram publicados na revista Nature.
O processo entre a pesquisa, a revisão e a publicação na revista Nature costuma levar de um a dois anos.
Em linhas gerais, a pesquisa encontrou os seguintes resultados:
- O modelo O1 da OpenAI acertou ou chegou muito próximo do diagnóstico correto em 67% dos casos, contra 50-55% dos médicos humanos. Uma diferença de 12 a 17 pontos percentuais.
- Quando as informações clínicas estavam completas e disponíveis para o modelo, a precisão da IA saltou para 82%.
- Em um segundo experimento, focado em planos de tratamentos complexos (como o uso de antibióticos e cuidados paliativos), a IA atingiu 89% de acerto. Os médicos, usando métodos tradicionais de pesquisa, alcançaram 34%.
- Um ponto de destaque é o caso em que, enquanto os médicos investigavam um coágulo no pulmão, a IA identificou que a paciente tinha lúpus, condição que explicava a inflamação e que os médicos não haviam considerado.
Por que isso importa para quem trabalha com tecnologia
O estudo de Harvard é um dos primeiros publicados em uma revista científica de alto impacto a comparar diretamente o desempenho de LLMs com médicos humanos em um ambiente clínico real, não em testes sintéticos ou simulações.
Para pessoas desenvolvedoras e pessoas que trabalham com IA aplicada, especialmente com dados de saúde, sistemas de apoio a decisões clínicas e produtos B2B para hospitais, os números mudam a régua do que já é possível com modelos disponíveis comercialmente.
Um ponto de atenção importante: os pesquisadores ressaltam que a IA avaliou apenas as informações textuais de pacientes. Ou seja, não entraram nessa equação sinais humanos (aparência, nível de dor, comportamento), que só médicos presencialmente conseguem captar.
No fim das contas, o resultado da pesquisa não indica a substituição de médicos, mas o uso de IA como uma ferramenta de apoio para chegar ao diagnóstico correto.
Inclusive, vale notar que a pesquisa usou o modelo O1, lançado pela OpenAI em 2024. Em contrapartida, é fato que os modelos atuais já evoluíram de forma significativa. O que sugere que os resultados de novos testes podem ser ainda mais expressivos.
Quer entender melhor como a IA está sendo aplicada na prática?
Se você quer se aprofundar nos fundamentos de inteligência artificial e entender como aplicar esses conceitos em projetos reais, incluindo em áreas como saúde, dados e produtos, a Alura tem trilhas completas de IA e Machine Learning.
Na formação de Arquitetura de Soluções com IA, por exemplo, você aprende como estruturar aplicações inteligentes, integrar modelos de IA em sistemas reais e criar soluções capazes de processar grandes volumes de dados, algo essencial em contextos como hospitais, plataformas clínicas e sistemas de apoio a diagnóstico.
Já a carreira de Especialista em IA aprofunda conceitos de Machine Learning, IA generativa e análise de dados.
E para quem quer explorar a próxima geração de aplicações inteligentes, a formação de Engenharia de Agentes de IA ensina como desenvolver agentes autônomos com LLMs ou automações e sistemas capazes de interpretar informações exatamente o tipo de tecnologia que começa a ganhar espaço em setores altamente especializados como a saúde.









