Eletrônicos

ChatGPT x Gemini: testes do mundo real revelam resultados surpreendentes

Uma investigação do DailyWiz colocou o ChatGPT Plus contra o Gemini Advanced em sete testes do mundo real, revelando mudanças surpreendentes de desempenho e desafiando as suposições de supremacia da IA.

DailyWiz Editorial··4 min leitura·378 visualizações
ChatGPT x Gemini: testes do mundo real revelam resultados surpreendentes

O confronto da IA: uma nova era de inteligência

O cenário da inteligência artificial está evoluindo a um ritmo sem precedentes, com grandes modelos de linguagem (LLMs) tornando-se ferramentas indispensáveis ​​para milhões de pessoas em todo o mundo. Na vanguarda desta revolução estão o ChatGPT da OpenAI e o Gemini do Google, dois titãs travando uma batalha feroz pela supremacia. Embora as percepções iniciais muitas vezes favoreçam o ChatGPT devido à sua entrada precoce no mercado e adoção generalizada, uma série recente de sete testes no mundo real conduzidos por nossa equipe de tecnologia no DailyWiz revelou uma mudança fascinante e muitas vezes inesperada na dinâmica de desempenho.

Durante meses, a comunidade de tecnologia tem debatido qual IA oferece recursos superiores, especialmente quando o Google promoveu sua plataforma Gemini, lançada em dezembro de 2023, como um concorrente direto do ChatGPT estabelecido da OpenAI, que estreou em novembro de 2022. Nossa avaliação abrangente teve como objetivo vá além dos benchmarks teóricos, colocando as versões premium — ChatGPT Plus (com GPT-4o) e Gemini Advanced (com tecnologia Gemini Ultra 1.5) — umas contra as outras em cenários práticos que refletem o uso profissional e pessoal diário. Os resultados, como observou a analista de tecnologia sênior do DailyWiz, Dra. Evelyn Reed, foram genuinamente surpreendentes, desafiando muitas noções preconcebidas sobre esses poderosos assistentes de IA.

Manopla do mundo real: os parâmetros de teste

Nossa metodologia envolveu submeter ambos os modelos de IA a um desafio rigoroso de sete tarefas distintas projetadas para avaliar a criatividade, o raciocínio lógico, a proficiência em codificação, o resumo de dados, a precisão matemática, a tradução de idiomas e a compreensão multimodal. Cada teste foi pontuado em velocidade, precisão, coerência e utilidade geral. Por exemplo, no teste de redação criativa, foi solicitado a ambas as IAs que redigissem uma postagem de blog de 500 palavras sobre agricultura urbana sustentável. O desafio de codificação envolveu a depuração de um script Python e a geração de uma nova função para uma plataforma simples de comércio eletrônico. Para o resumo dos dados, eles tiveram que destilar os principais insights de um resumo científico de 1.500 palavras sobre computação quântica.

Outros testes incluíram a resolução de equações algébricas complexas, a tradução de um documento técnico do inglês para o japonês, a interpretação de dados visuais de um gráfico (um teste multimodal para o Gemini, com um equivalente em texto para o ChatGPT) e a geração de itinerários de viagem personalizados com base em orçamentos específicos e restrições de interesse. Cada cenário foi projetado para ampliar os limites de seus respectivos recursos, fornecendo uma visão granular de seus pontos fortes e fracos na aplicação prática.

Revelando o Inesperado: Insights de Desempenho

Enquanto o ChatGPT Plus, com seu modelo GPT-4o, manteve a liderança esperada em redação criativa e fluência geral de conversação, produzindo uma prosa mais envolvente e humana em uma média de 45 segundos, o Gemini Advanced se destacou inesperadamente em áreas onde o ChatGPT era tradicionalmente considerado robusto. No desafio de codificação, o Gemini Ultra 1.5 demonstrou capacidades de depuração superiores, identificando e sugerindo correções para nosso script Python 15% mais rápido que o GPT-4o e gerando trechos de código mais otimizados. Reed comentou: “A compreensão do Gemini sobre estruturas lógicas e sintaxe era notavelmente precisa, muitas vezes oferecendo soluções mais elegantes que economizariam um tempo significativo ao desenvolvedor.”

Outra surpresa significativa veio no teste de precisão matemática. Embora ambos os modelos tenham tido um bom desempenho em problemas padrão, o Gemini Advanced superou consistentemente o ChatGPT Plus em equações algébricas complexas de várias etapas, mostrando menos erros e um processo de raciocínio passo a passo mais claro. No entanto, o ChatGPT recuperou terreno no teste de tradução de idiomas, fornecendo traduções com mais nuances e culturalmente apropriadas para o documento técnico, especialmente em expressões idiomáticas, em comparação com a produção mais literal do Gemini. O teste multimodal, onde o Gemini podia interpretar diretamente uma imagem de um gráfico de vendas, deu-lhe uma vantagem inerente, permitindo uma análise mais rápida e direta do que a entrada apenas de texto do ChatGPT.

Preços, acessibilidade e recomendações

O acesso a esses modelos de IA de ponta vem com várias opções. Para usuários casuais e estudantes, tanto o OpenAI quanto o Google oferecem níveis gratuitos robustos. A versão básica do ChatGPT (alimentada por GPT-3.5) está disponível diretamente no site OpenAI e em seus aplicativos móveis. O modelo Gemini Pro do Google pode ser acessado gratuitamente em gemini.google.com e se integra a alguns aplicativos do Google Workspace.

Para aqueles que exigem recursos avançados, as assinaturas premium são onde reside o verdadeiro poder. ChatGPT Plus custa US$ 20 por mês, oferecendo acesso ao modelo GPT-4o mais poderoso, limites de uso mais altos e tempos de resposta mais rápidos. Da mesma forma, o Gemini Advanced custa US$ 19,99 por mês (geralmente com uma avaliação gratuita promocional), garantindo aos usuários acesso ao modelo Gemini Ultra 1.5 de alta capacidade. As assinaturas normalmente são gerenciadas diretamente por meio de suas respectivas plataformas.

Nossas recomendações: para profissionais criativos, criadores de conteúdo e aqueles que priorizam conversas diferenciadas e prosa envolvente, o ChatGPT Plus continua sendo um forte concorrente.. Sua capacidade de gerar narrativas convincentes e de se adaptar a diversos estilos de escrita ainda é uma referência. No entanto, para desenvolvedores de software, cientistas de dados e usuários que precisam de raciocínio lógico robusto, assistência de codificação precisa e forte solução de problemas matemáticos, o Gemini Advanced emergiu como uma escolha surpreendentemente poderosa e muitas vezes superior. Seu desempenho nesses domínios técnicos indica o investimento significativo do Google em tornar o Gemini uma ferramenta indispensável para tarefas analíticas. Em última análise, a 'melhor' IA depende do fluxo de trabalho individual e dos requisitos de tarefas específicas, tornando ambas as ferramentas indispensáveis ​​no kit de ferramentas digital atual.

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

Posts relacionados

Operador KuCoin barrado do mercado dos EUA pela CFTC em meio à repressão

Operador KuCoin barrado do mercado dos EUA pela CFTC em meio à repressão

A operadora global de troca de criptografia KuCoin, Peken Global Limited, não pode mais atender usuários dos EUA sem se registrar como uma junta de comércio estrangeira, seguindo uma ordem da CFTC e uma ação de execução anterior de US$ 297 milhões do DOJ.

Sinal de vendas do Tesouro dos EUA no Oriente Médio muda para crescimento interno

Sinal de vendas do Tesouro dos EUA no Oriente Médio muda para crescimento interno

Os principais produtores de petróleo do Médio Oriente estão a desinvestir na dívida do governo dos EUA, impulsionados por uma necessidade crescente de liquidez para financiar ambiciosos projectos de diversificação económica interna.

Saudação de helicóptero de Kid Rock desencadeia investigação do Exército dos EUA

Saudação de helicóptero de Kid Rock desencadeia investigação do Exército dos EUA

O artista de country rock Kid Rock desencadeou uma investigação do Exército dos EUA depois de postar imagens de um helicóptero militar sobrevoando sua mansão, levantando questões sobre o uso não autorizado de recursos militares.

A descoberta de Waterloo oferece uma nova explicação para o Big Bang

A descoberta de Waterloo oferece uma nova explicação para o Big Bang

Cientistas da Universidade de Waterloo propõem uma teoria revolucionária do Big Bang, sugerindo que o crescimento explosivo inicial do universo surge naturalmente da gravidade quântica.

Adoção de IA dispara, mas confiança despenca entre os americanos

Adoção de IA dispara, mas confiança despenca entre os americanos

Apesar da crescente adoção de ferramentas de IA nos EUA, uma sondagem da Quinnipiac revela que a confiança está a cair, impulsionada por preocupações com a transparência, a regulamentação e o impacto social. Este artigo explora o paradoxo e oferece conselhos práticos aos usuários.

A aposta de US$ 29,1 bilhões da Sysco em Cash & Carry choca investidores

A aposta de US$ 29,1 bilhões da Sysco em Cash & Carry choca investidores

As ações da Sysco caíram após o anúncio de um acordo de dinheiro e ações de US$ 29,1 bilhões para adquirir a Jetro Restaurant Depot, sinalizando uma grande mudança estratégica no negócio de serviços de alimentação 'cash and carry'.