O ChatGPT é rei? Como os melhores chatbots de IA gratuitos se saíram durante os testes de campo

A concorrência está esquentando com vários novos chatbots de IA inundando o mercado e, se você não quiser pagar uma assinatura mensal, o OpenAI pode não ser a melhor escolha.

Embora o ChatGPT da OpenAI tenha sido o primeiro chatbot alimentado por inteligência artificial (IA) a cativar o mundo após seu lançamento público em novembro de 2022, vários concorrentes entraram no mercado desde então.

Gigantes da tecnologia como Google e Microsoft lançaram seus chatbots de IA, com o Bard do Google removendo sua lista de espera e se abrindo para mais de 180 países e territórios em 10 de maio, depois que a Microsoft lançou completamente seu mecanismo de busca Bing alimentado por IA em 4 de maio.

Com vários chatbots para escolher, o Cointelegraph decidiu colocar alguns dos mais conhecidos à prova para ver quais se saíam melhor durante os testes de campo, além de comparar alguns de seus recursos.

Para testar os chatbots, a eles foram feitas uma série de perguntas, enigmas e solicitações mais complexas para determinar sua precisão e velocidade de resposta.

Muitos chatbots de IA disponíveis hoje são alimentados pelos modelos GPT da OpenAI. Embora esses chatbots de IA possam dar resultados semelhantes ao ChatGPT, os desenvolvedores de aplicativos também podem adicionar comandos adicionais, que podem alterar os resultados.

 

ChatGPT-3.5 da OpenAI

Embora a OpenAI já tenha lançado o ChatGPT-4, que está disponível para usuários do plano Plus por US$ 20 por mês, o ChatGPT-3.5 é gratuito para usar e é testado aqui.

O ChatGPT-4 supera significativamente seu predecessor com velocidades de resposta mais rápidas, respostas mais precisas e menos tempo de inatividade do servidor.

O primeiro chatbot de IA a conquistar o mundo pode ajudar com tarefas como redação de artigos, depuração de código e até finanças pessoais após apenas um ou dois segundos de tempo de processamento.

No entanto, uma área em que o ChatGPT se sai mal é sua falta de capacidade para pesquisar na internet.

Isso significa que o modelo é tão bom quanto os dados de treinamento que foram alimentados nele, que vão até setembro de 2021. A OpenAI está implementando plugins que permitem obter informações online usando a API de pesquisa do Bing, mas isso será limitado aos usuários do plano Plus.

ChatGPT tem um novo plugin que usa a API do Bing para acessar a internet atual e atualizada.

Isso muda tudo. pic.twitter.com/Izknqp1UgC

— Rowan Cheung (@rowancheung) 23 de março de 2023

Apesar dessa falha na versão gratuita, o chatbot ainda costuma sugerir recursos para ajudar o usuário com sua consulta, como destacado na interação abaixo.

Uma captura de tela ilustrando a incapacidade do ChatGPT-3.5 de falar sobre eventos recentes. Fonte: OpenAI

O ChatGPT-3.5 respondeu corretamente à maioria dos enigmas que lhe foram dados e todos os problemas simples de matemática, mas as respostas foram menos consistentemente corretas quando foram feitas perguntas mais complexas.

Por exemplo, quando solicitado a resolver a equação quadrática 2t^2 + 0.3t – 0.4 = 0, o ChatGPT-3.5 retornou a resposta correta em uma de três tentativas e teve problemas semelhantes ao multiplicar números maiores.

O ChatGPT-3.5 também pode ser impreciso ao responder a outras perguntas. De acordo com os testes da OpenAI, ele só conseguiu responder corretamente a 213 de 400 perguntas no Exame da Ordem dos Advogados, que os graduados em direito nos Estados Unidos precisam passar antes de se tornarem advogados praticantes.

Além das imprecisões factuais, o ChatGPT-3.5 também teve dificuldades com perguntas para testar sua capacidade lógica, como a abaixo.

ChatGPT responde incorretamente a uma pergunta destinada a testar sua habilidade lógica. Fonte: OpenAI

Bing da Microsoft

O ChatGPT do Bing é baseado no modelo de linguagem GPT-4 criado pela OpenAI, mas os dois chatbots têm várias diferenças-chave.

A primeira diferença notável é que o chatbot do Bing leva muito mais tempo para responder a perguntas, com um tempo médio de resposta de aproximadamente cinco segundos em comparação com o ChatGPT da OpenAI, que leva apenas um segundo.

Ele também exige que os usuários usem o navegador da web Microsoft Edge, que não é tão popular quanto o Google Chrome.

Do lado positivo, o chatbot do Bing utiliza o mecanismo de busca do Bing em suas respostas, permitindo responder a perguntas sobre eventos atuais, ao contrário de qualquer outro chatbot que use o GPT-4. Ele também está atualmente disponível gratuitamente.

Além disso, ele fornece fontes para suas respostas, permitindo que os usuários verifiquem mais facilmente as afirmações feitas pelo chatbot.

Bing ChatGPT da Microsoft em ação. Fonte: Bing

Usando a mesma equação quadrática 2t^2 + 0.3t – 0.4 = 0, o Bing vinculou ao Microsoft Math Solver, mas frequentemente deu uma resposta incorreta e teve problemas semelhantes para responder corretamente a multiplicações maiores.

Na mesma pergunta lógica sobre o marcador feita ao ChatGPT-3.5, o Bing respondeu corretamente que você esperaria ver o marcador na página 120.

 

Bard do Google

O chatbot de IA recentemente lançado pelo Google é chamado Bard, que funciona com seu modelo de linguagem PaLM 2.

2/ Bard agora também tem plugins

Obtenha acesso instantâneo a esses aplicativos, entre outros:

・Spotify (Música)
・Walmart (varejo)
・Indeed (busca de emprego)
・Uber Eats (entrega de refeições)
・Adobe Firefly (criação de imagens)
・E todos os aplicativos do Google pic.twitter.com/WyRBBYbYbR

— Moritz Kremb (@moritzkremb) 11 de maio de 2023

Como apontado em uma thread no Twitter pelo entusiasta de IA Moritz Kremb, ele pode responder e ser solicitado com imagens, suporta várias linguagens de programação e, como o chatbot do Bing, pode se conectar à internet.

Quando perguntado como o PaLM 2 se compara com o GPT-4, Bard disse que o GPT-4 é melhor na geração de texto, mas o PaLM 2 é melhor no raciocínio e na lógica, acrescentando:

“Em última análise, o melhor modelo de linguagem para você depende das suas necessidades. Se você precisa de um LLM que seja forte em raciocínio e lógica, então o Palm 2 é a melhor escolha. Se você precisa de um LLM que seja rápido, bom na geração de texto e já se provou, então o GPT-4 é a melhor escolha.”

O Bard respondeu corretamente à questão do marcador e explicou sua resposta com mais profundidade do que o Bing, mas as explicações eram muitas vezes sem sentido.

Ele resolveu a maioria das charadas que lhe foram dadas e se saiu bem nas questões de matemática, resolvendo corretamente as questões de multiplicação complexa e a equação quadrática em duas das três respostas preliminares que preparou.

YouChat

Embora também use o GPT-3.5 da OpenAI, existem algumas diferenças entre o YouChat do You.com e o ChatGPT da OpenAI.

Ele lista fontes para a maioria do texto que gera e também fornece links para várias páginas da web relacionadas à consulta.

Ele também se conecta à internet, permitindo-lhe acessar eventos atuais, e como não tem o mesmo nível de popularidade do chatbot da OpenAI, o tempo de inatividade não é um problema.

Ele respondeu incorretamente tanto à questão do marcador, à equação quadrática e ao problema de multiplicação mais complexo.

Ele conseguiu resolver a maioria das charadas que lhe foram dadas, mas respondeu incorretamente a algumas.

 

HuggingChat

HuggingChat é um chatbox de IA de código aberto da empresa de IA Hugging Face, lançado em abril.

Algumas pessoas disseram que as APIs fechadas estavam ganhando…

mas nunca vamos desistir da luta pela IA de código aberto ⚔️⚔️

Hoje é um grande dia, pois lançamos a primeira alternativa de código aberto ao ChatGPT:

HuggingChat

Alimentado pelo último modelo do Open Assistant – o melhor chat de código aberto… pic.twitter.com/LjKN78XaI7

— Julien Chaumond (@julien_c) 25 de abril de 2023

Perguntado para resolver a mesma equação quadrática, o HuggingChat retornou 684 palavras de texto e não forneceu uma resposta à pergunta. Embora pudesse responder corretamente a problemas simples, não conseguia multiplicar números maiores.

Embora às vezes desse respostas diretas, o HuggingChat frequentemente retornava vastos muros de texto, que eram relevantes inicialmente, mas se transformavam em algo parecido com divagações.

Por exemplo, foi pedido para resolver a seguinte charada: “Um barril de água pesava 60 libras. Alguém colocou algo nele, e agora pesa 40 libras. O que a pessoa adicionou?”

A resposta correta é um buraco, mas o HuggingChat respondeu cubos de gelo antes de lançar-se em um monólogo de 545 palavras

E o resto?

Existem muitos outros chatbots de IA atualmente disponíveis, projetados para casos de uso mais limitados do que os mencionados aqui, e o mercado provavelmente continuará a crescer rapidamente.

Por exemplo, o Socratic é outro chatbot de IA do Google que pode ser baixado em um smartphone para ajudar os usuários a responder perguntas sobre ciência, matemática, literatura e muito mais. Ele também fornece explicações visuais de conceitos em diferentes disciplinas e é uma ferramenta útil para auxiliar o aprendizado.

O DeepAI é um chatbot de IA que se especializa em escrever texto como código de programação, poemas, histórias ou ensaios.

 

Conclusão

Pode ser injusto comparar o ChatGPT-3.5 da OpenAI com o chatbot de IA do Bing — dado que eles estão usando diferentes modelos de linguagem —, mas este artigo pretende olhar apenas para os chatbots de IA disponíveis gratuitamente.

Através do Bing, os usuários podem tirar proveito do modelo de linguagem ChatGPT-4 da OpenAI, que é uma grande melhoria em relação ao seu antecessor.

Embora o Bard do Google fosse promissor, o Bing geralmente se saiu melhor entre os chatbots de IA atualmente disponíveis gratuitamente, mas ainda cometeu alguns erros.

Outros chatbots parecem ter casos de uso mais limitados que poderiam ser mais úteis, mas estes três parecem liderar o caminho à medida que o desenvolvimento progride.

O acima representa um teste de campo informal de diferentes soluções de IA e de maneira alguma é exaustivo ou representativo da posição da Cointelegraph sobre uma solução de IA em particular.

VEJA MAIS:

Você pode gostar...