OpenAI ativa rastreador ‘GPTBot’ como parte dos planos para lançamento de novo modelo: GPT-5

Os usuários do ChatGPT têm a opção de eliminar o rastreador da Web adicionando um comando “disallow” a um arquivo padrão no servidor.

A empresa de inteligência artificial OpenAI lançou o “GPTBot”, sua nova ferramenta de rastreamento da Web que será usada para aprimorar os futuros modelos do ChatGPT.

“As páginas da Web rastreadas com o agente de usuário GPTBot podem ser potencialmente usadas para aprimorar modelos futuros”, disse a OpenAI em uma postagem no blog oficial da empresa, acrescentando que o novo recurso poderia melhorar a precisão e expandir os recursos de iterações futuras.

Um rastreador da web, às vezes chamado de “web spider”, é um tipo de bot que indexa o conteúdo de sites na Internet. Mecanismos de pesquisa como o Google e o Bing os utilizam para que os sites apareçam nos resultados de pesquisa dos usuários das suas ferramentas de busca. 

A OpenAI declarou que o rastreador da Web coletará dados publicamente disponíveis na rede mundial de computadores, mas filtrará fontes que exijam conteúdo pago, ou que sejam conhecidas por coletar informações de identificação pessoal, ou que tenham textos que violem suas políticas.

Urgente

A OpenAI acaba de lançar o GPTBot, um rastreador da Web projetado para coletar automaticamente dados disponíveis em toda a Internet.

Esses dados serão usados para treinar futuros modelos de IA, como o GPT-4 e o GPT-5!

O GPTBot garante que as fontes que violam a privacidade e as que são protegidas por paywalls não serão acessadas.

— Shubham Saboo (@Saboo_Shubham_) 

Vale a pena observar que os proprietários de sites podem bloquear o rastreador da Web adicionando um comando “disallow” (não permitir, em tradução livre) a um arquivo padrão no servidor.

Instruções para “não permitir” o acesso do GPTBot ao material de usuários do ChatGPT. Fonte: OpenAI

O novo rastreador foi anunciado três semanas depois que a empresa entrou com um pedido de registro de marca registrada para o “GPT-5”, o sucessor do atual modelo em operação, o GPT-4.

O pedido foi registrado no Escritório de Marcas e Patentes dos Estados Unidos em 18 de julho e abrange o uso do termo “GPT-5”, que inclui software para texto e fala humana com base em IA, conversão de áudio em texto e reconhecimento de voz e fala.

A OpenAI entrou com um pedido de registro de marca registrada para:

“GPT-5”

que inclui “software para”:

“a produção artificial de fala e texto humanos”

“conversão de arquivos de áudio em texto”

“reconhecimento de voz e fala”

“processamento de fala e linguagem baseado em aprendizado de máquina”

— YK aka CS Dojo (@ykdojo)

No entanto, os observadores talvez ainda não queiram esperar ansiosamente pela próxima iteração do ChatGPT. Em junho, o fundador e CEO da OpenAI, Sam Altman, disse que a empresa não está “nem perto” de iniciar o treinamento do GPT-5, explicando que várias auditorias de segurança precisam ser realizadas antes de que o processo tenha início.

Enquanto isso, ultimamente têm surgido preocupações com relação à estratégia de coleta de dados da OpenAI, principalmente no que diz respeito a direitos autorais e sem consentimento.

O órgão de vigilância da privacidade do Japão emitiu um aviso à OpenAI sobre a coleta de dados confidenciais sem permissão em junho, enquanto a Itália proibiu temporariamente o uso do ChatGPT após alegar que ele violava as leis de privacidade da União Europeia em abril.

No final de junho, 16 litigantes entraram com uma ação coletiva contra a OpenAI, alegando que a empresa de IA acessou informações privadas de interações dos usuários do ChatGPT.

Se for comprovada a veracidade dessas alegações, a OpenAI – e a Microsoft, que também foi citada como ré no processo – terá violado a Lei de Fraude e Abuso de Computadores, uma lei com precedente para casos de rastreamento de dados na Web.

LEIA MAIS

Você pode gostar...