Estudo comparativo entre plataformas de IA mostra que Gemini, do Google, está 10% à frente do ChatGPT-4 no quesito jurídico
A Inner AI, empresa especializada em IA, realizou uma pesquisa inédita para avaliar a eficácia de diferentes plataformas de IA generativa em conhecimentos gerais sobre o Brasil.
O estudo que analisou 15 dos principais algoritmos disponíveis no país, utilizou um banco de mil questões filtradas. Isto é, um dataset inicial de 10 mil, para avaliar as IAs de forma equitativa.
Pedro Salles Leite, CEO e cofundador da Inner AI, destacou que não há uma única inteligência artificial que se sobressaia em todos os aspectos. Cada plataforma demonstrou ter suas próprias forças em áreas específicas. Notavelmente, o GPT-4, foi amplamente conhecido e utilizado, não alcançou o primeiro lugar em nenhuma categoria avaliada.
Gemini se destaca em múltiplas áreas
O Gemini, IA desenvolvida pelo Google, emergiu como o grande destaque da pesquisa. Ele conquistou o primeiro lugar nos rankings de medicina e jurídico, além de empatar com o ChatGPT em outra categoria.
No quesito jurídico, entretanto, o Gemini demonstrou estar 10% à frente do ChatGPT-4. Ou seja, uma diferença significativa que pode impactar diretamente o trabalho de profissionais da área.
A pesquisa também avaliou outras plataformas, incluindo o SABIA, uma IA desenvolvida no Brasil, e o Grok, da XAI.
Salles Leite enfatizou a importância de considerar as particularidades de cada IA para diferentes aplicações. Ele alertou que o uso da plataforma errada pode resultar em respostas imprecisas. Dessa forma, ressaltou a necessidade de os profissionais escolherem a ferramenta mais adequada para suas necessidades específicas.
O futuro das IAs especializadas
O CEO da Inner AI prevê um futuro em que as plataformas de IA se tornarão cada vez mais especializadas e nichadas. Assim, cada fabricante se destaca em áreas específicas, da economia ao esporte.
Essa tendência pode levar a um cenário onde os usuários precisarão recorrer a diferentes IAs para atender a diversas demandas. De forma similar ao que ocorre com serviços de streaming de entretenimento.