Um novo padrão RSL para sites surge como uma inovação promissora para proteger os direitos de empresas de mídia, criadores de conteúdo e detentores de bases de dados. Este sistema visa instituir uma salvaguarda adicional contra o aproveitamento não remunerado de produções intelectuais para o aprimoramento de ferramentas de inteligência artificial. A iniciativa busca reformular o modo como o conteúdo online é acessado e monetizado por plataformas de IA, garantindo que o valor gerado pelos dados seja devidamente reconhecido e recompensado aos seus originadores.
A tecnologia introduzida pelo Really Simple Licensing (RSL) promove uma alteração substancial no mecanismo binário do conhecido arquivo robots.txt. Enquanto este último tradicionalmente oferece uma resposta de “sim” ou “não” sobre a possibilidade de raspagem de dados de um site, o RSL aprofunda essa comunicação. A “raspagem de dados” refere-se à coleta sistematizada, por meio de softwares automatizados, de informações visíveis e ocultas de um portal. No contexto das IAs, isso se traduz, por exemplo, na extração do texto de reportagens de um portal de notícias ou na compilação de dados estatísticos hospedados em sites governamentais para o treinamento de modelos de linguagem.
Novo Padrão RSL Protege Conteúdo Digital de Uso por IAs
Com o advento do novo modelo, os editores e criadores de conteúdo ganharão a capacidade de integrar a monetização diretamente em suas diretrizes de acesso. Este sistema inovador introduz modalidades de cobrança como o “pay-per-crawl”, que impõe um custo pela raspagem de dados, e o “pay-per-inference”, que estabelece uma taxa pelo uso do conteúdo em respostas geradas por inteligências artificiais. Tal estrutura visa criar um fluxo de receita justo para o vasto universo de dados que alimentam os algoritmos de IA, redefinindo o valor econômico do material digital.
O desenvolvimento do Really Simple Licensing é resultado da colaboração de diversos grupos influentes no ecossistema digital. Entre as entidades por trás dessa iniciativa, destacam-se nomes como Reddit, People Inc, Yahoo!, Ziff Davis, WikiHow, Quora, O’Reilly Media e Medium. A união desses atores sinaliza uma ampla preocupação e um esforço coordenado para endereçar a questão da remuneração de conteúdo digital em face do avanço acelerado da inteligência artificial.
Para além de oferecer uma solução econômica ao uso de conteúdo, o novo padrão RSL tem o potencial de mitigar as crescentes tensões entre as grandes companhias de IA e os grupos de mídia. Atualmente, diversos veículos enfrentam litígios contra as controladoras dessas ferramentas. Casos notórios incluem a ação judicial movida pela Folha contra a OpenAI, na qual o jornal exige a interrupção da coleta e uso não autorizado e não pago de seu conteúdo, e o processo anterior do The New York Times, que acusa a OpenAI e a Microsoft de violação de direitos autorais pelo uso de milhões de textos sem a devida remuneração.
Representantes da OpenAI e do Google foram contatados para comentar a situação, mas não apresentaram respostas até o momento da publicação. A Microsoft, por sua vez, informou que não se manifestaria sobre o assunto. Essa postura reflete a complexidade e a sensibilidade do tema, especialmente considerando as implicações legais e financeiras envolvidas.
Daniel Bichuetti, especialista em IA e tecnologia e CEO da Forlex, vislumbra que o RSL promoverá um ecossistema de vantagens mútuas. Segundo Bichuetti, benefícios diretos e indiretos surgirão tanto para os publicadores, quanto para as empresas de inteligência artificial e os usuários finais. Para os consumidores da tecnologia, espera-se uma elevação do nível de confiabilidade nas respostas fornecidas pelas IAs, resultando em uma “menor propensão a ‘alucinações'”, termo que descreve as respostas incorretas ou inventadas por modelos de IA.
Bichuetti também destaca as oportunidades para empresas de menor porte, que terão melhores condições de negociar coletivamente seus conteúdos. A consultora de IA para negócios, Victoria Luz, corrobora essa perspectiva, afirmando que o modelo outorga maior poder de barganha às pequenas organizações. Enquanto grandes corporações de mídia, como Wall Street Journal e Financial Times, já estabeleceram acordos de conteúdo com empresas de IA, as entidades menores frequentemente carecem de acesso a tais negociações.
Na prática, a principal inovação que o RSL oferece aos publicadores é a capacidade de personalizar as respostas durante o processo de raspagem de dados para treinamento de IA. Superando a simples opção binária de “sim” ou “não”, o modelo permite que um publicador especifique condições, como “sim, sob pagamento” ou “sim, com a citação da fonte original”. Esta granularidade oferece um controle sem precedentes sobre o licenciamento e o uso de conteúdo digital.

Imagem: www1.folha.uol.com.br
Victoria Luz ressalta, no entanto, que o protocolo atual do robots.txt já delimitava o que poderia ou não ser utilizado no treinamento das ferramentas de IA. A especialista aponta que a interpretação das empresas de tecnologia foi a de que essas limitações foram, em alguns casos, desconsideradas nos processos de treinamento. Com o RSL, há uma “camada extra” de proteção, adicionando uma barreira mais robusta contra o uso indiscriminado. Contudo, para a efetividade do novo padrão, é imprescindível “que essas empresas de inteligência artificial se comprometam com essa governança”, pondera Victoria.
A consultora também avalia que a implementação do RSL pode demandar um “novo equilíbrio de forças” em um cenário global onde diversas nações, incluindo o Brasil, debatem a regulamentação das ferramentas de IA e o uso de conteúdos protegidos por direitos autorais. No contexto brasileiro, o Projeto de Lei 2.338, já aprovado no Senado em 2024, segue em tramitação na Câmara dos Deputados, indicando uma evolução legislativa ativa sobre o tema. Para mais informações sobre legislações internacionais relativas à inteligência artificial, você pode consultar o site da Organização Mundial da Propriedade Intelectual (OMPI).
Um possível risco do modelo que demanda remuneração pelo conteúdo, segundo Victoria Luz, é a geração de novos custos para ferramentas que, atualmente, são disponibilizadas gratuitamente aos usuários. “Se a gente coloca pagamento associado a todo tipo de conteúdo, esses modelos vão ficar extremamente caros e inviáveis para a grande maioria”, alerta ela. A especialista enfatiza que os “modelos [de IA] precisam de dados suficientes e gratuitos para que sejam treinados e para que esse custo não seja repassado ao usuário. Esse é o principal ponto de atenção”.
Luis Molla Veloso, líder de produtos na Vindi, compartilha essa preocupação, afirmando que, com o padrão de governança proporcionado pelo RSL, é provável que, a médio e longo prazo, haja uma diminuição na disponibilidade de dados abertos ou gratuitos na internet. Essa tendência é esperada “já que parte desse conteúdo poderá ficar protegido por licenciamento”. A perspectiva levanta questões sobre o futuro da gratuidade e acessibilidade de informações digitais.
Em comunicado oficial no site do novo modelo, Tim O’Reilly, CEO da O’Reilly Media e membro do conselho técnico do RSL, enfatiza a necessidade premente de as regras para os sistemas de inteligência artificial acompanharem a evolução tecnológica. A discussão sobre a governança e a remuneração é um passo crucial nesse processo.
Por outro lado, Nicolas Robinson Andrade, diretor da OpenAI para a América Latina, expressou em entrevista ao jornal O Globo a oposição da empresa ao pagamento de direitos autorais previsto no projeto de lei em tramitação na Câmara dos Deputados brasileira. Andrade chegou a comparar a remuneração para autores de conteúdo jornalístico, artístico e literário a impostos sobre produtos manufaturados, como cadeiras, levantando a preocupação de que tal medida poderia desencorajar a inovação e o investimento no país: “É como se o Brasil se tornasse o único país do mundo a taxar a fabricação de cadeiras. Aí é natural que as fábricas de cadeiras no futuro não sejam construídas aqui.”
Confira também: artigo especial sobre leis e valortrabalhista
A discussão sobre o Really Simple Licensing (RSL) e suas implicações ressalta a importância de equilibrar a inovação tecnológica com a justa remuneração e proteção dos direitos autorais. Enquanto o mercado e o legislativo buscam um consenso, é fundamental que a sociedade continue acompanhando esses desenvolvimentos. Para se manter atualizado sobre política e tecnologia, continue explorando as análises e notícias disponíveis em nossa editoria de Política.
Crédito da imagem: Dado Ruvic-27.12.24/Reuters
🔗 Links Úteis
Recursos externos recomendados