OpenAI e Microsoft são acusadas de roubar dados para treinar ChatGPT em nova ação coletiva

O processo alega que os lucros da OpenAI resultaram do uso de dados ilegalmente coletados para treinar seus modelos.

A OpenAI e a Microsoft foram citadas como rés em mais uma ação coletiva que as acusa de uso de técnicas de raspagem de dados na Web para obtenção de dados supostamente privadas para o treinamento do ChatGPT e de outros modelos de inteligência artificial (IA) associados. 

A ação coletiva mais recente foi movida em 5 de setembro em São Francisco por um escritório de advocacia que representa dois engenheiros não identificados.

De acordo com o processo registrado no Tribunal Distrital dos Estados Unidos para o Distrito Norte da Califórnia:

“Esta ação coletiva decorre da conduta ilegal e prejudicial dos Réus no desenvolvimento, comercialização e operacionalização de seus produtos de IA, incluindo o ChatGPT-3.5, o ChatGPT-4.0, o Dall-E e o Vall-E (os ‘Produtos’), que usam informações privadas roubadas, incluindo informações de identificação pessoal de centenas de milhões de usuários da Internet, incluindo de crianças de todas as idades, sem seu consentimento ou conhecimento prévio.”

O processo alega que a OpenAI “dobrou a estratégia de coletar secretamente grandes quantidades de dados pessoais da Internet” após uma reestruturação realizada em 2019.

“Sem esse roubo sem precedentes de informações privadas e protegidas por direitos autorais pertencentes a pessoas reais”, escrevem os autores da ação, “os produtos”, referindo-se ao ChatGPT, DALL-E e outros modelos de IA da OpenAI, “não seriam o negócio multibilionário que são hoje.”

De acordo com o processo, os denunciantes estão pedindo aos tribunais que concedam indenizações a quaisquer membros das classes propostas – o que poderia incluir qualquer pessoa cujas informações tenham sido supostamente roubadas.

A ação também pede que os tribunais ordenem que os réus realizem a “restituição não restitutiva” dos lucros obtidos como resultado da suposta coleta ilegal de dados.

Raspagem é uma prática de usar um bot automatizado, geralmente chamado de “crawler”, para colecionar dados disponíveis na Internet. O processo alega que a OpenAI e a Microsoft se envolveram conscientemente em atividades de raspagem “ilegais.”

Uma ação coletiva anterior, com denúnciais quase idênticas contra a OpenAI e a Microsoft, foi apresentada no mesmo distrito judicial em 28 de junho. Até o momento, não está claro se o tribunal ou os réus dos casos à parte considerariam a possibilidade de combinar ambas as ações.

Esta não é a primeira vez que a Microsoft se envolve em um processo judicial por raspagem de dados. A empresa de Redmond (Washington) emitiu uma ordem de cessação e desistência em nome de sua marca LinkedIn contra a empresa de análise de dados HiQ em 2019 questinando as práticas admitidas de raspagem de dados desta última.

Nesse caso, a Microsoft e o LinkedIn alegaram que a HiQ havia violado os termos do contrato de serviço necessário para fazer login no site do LinkedIn e, assim, ter acesso aos dados dos usuários da plataforma social de empregos. Inicialmente, o tribunal de circuito decidiu a favor da HiQ, mas após recursos da Microsoft, a Suprema Corte anulou a sentença.

O caso foi então levado de volta ao tribunal de circuito, onde a Microsoft saiu vencedora. A HiQ fez um acordo com a Microsoft por um valor não revelado e recebeu a ordem de interromper suas atividades de raspagem.

A Microsoft e a OpenAI não responderam imediatamente aos pedidos de comentários do Cointelegraph.

LEIA MAIS

Você pode gostar...