Tecnologia Fácil
  • Notícias
  • Reviews
  • Dicas
  • Opinião
  • Entretenimento
  • Curiosidades
Sem resultados
Ver todos os resultados
tecnologiafacil.com
Sem resultados
Ver todos os resultados

Descubra o Truque para Impedir que ChatGPT e Google Bard Roubem o Conteúdo do seu Site

Tiago Carvalho por Tiago Carvalho
21/12/2023
em Notícias
Tempo de leitura: 2 mins de leitura
Partilha no FacebookPartilha no TwitterPartilha no Whatsapp

Com o crescimento exponencial da inteligência artificial (IA), tem-se debatido intensamente sobre a origem dos dados de treinamento utilizados pelos grandes modelos de linguagem, como o GPT-4. A questão do direito dos criadores dessas IAs de usar tais dados também tem sido discutida, chegando até mesmo a ser levada a tribunal.

Estes modelos de IA são treinados utilizando grandes volumes de dados, que incluem conteúdo extraído de diversos sites. Este processo, conhecido como “scraping web”, é uma prática comum em investigação, jornalismo e arquivo digital. No entanto, alguns proprietários de sites podem ter reservas sobre como o seu conteúdo é utilizado neste contexto específico.

Recentemente, tanto a OpenAI como a Google forneceram orientações para os proprietários de sites que preferem evitar que o conteúdo dos seus sites seja incorporado nos enormes datasets de treinamento destes modelos de IA. No entanto, é importante notar que estas orientações apenas se aplicam a conteúdo futuro, uma vez que ambas as empresas não oferecem um método para apagar os dados nos quais as suas IAs já foram treinadas.

Para evitar que o conteúdo de um site seja utilizado em futuros “scrapings” por qualquer um destes gigantes da IA, existe um processo simples, desde que o alojamento web permita o acesso à estrutura de arquivos do site. Para colocar aos bots destas empresas o equivalente digital a uma placa de “Acesso Proibido”, deve-se editar ou criar um arquivo chamado “robots.txt” no diretório raiz do servidor web.

Este arquivo serve como um conjunto de instruções para bots e rastreadores web. Até agora, tem sido utilizado principalmente para dar instruções aos motores de busca. Para bloquear o acesso destes modelos a um site, deve-se incluir no arquivo robots.txt as seguintes linhas:

User-agent: GPTBot
Disallow: /

User-agent: Google-Extended
Disallow: /

Em ‘Disallow’, pode-se especificar apenas certas pastas específicas para bloqueio, caso não se importe que o resto do conteúdo do site seja utilizado.

O debate sobre a origem dos dados de treinamento da IA e o direito de uso desses dados é complexo e multifacetado. Embora a prática de “scraping web” seja comum e amplamente aceite em muitos campos, é compreensível que alguns proprietários de sites possam ter reservas sobre como o seu conteúdo é utilizado neste contexto. As orientações fornecidas pela OpenAI e pela Google são um passo na direção certa, mas ainda há muito a ser discutido e acordado no que diz respeito à ética e aos direitos de propriedade intelectual na era da IA.

Fonte: Eff

Tags: intenret
Share186Tweet116Send
Próximo artigo

Adobe revoluciona o mundo digital com a actualização surpreendente do Spectrum 2

Deixe um comentário Cancelar resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Interessante

Kit Lavagem nasal para crianças bebés e recem nascidos

Nariz Limpinho

O kit de lavagem nasal que facilita a lavagem nasal do bebé/criança e pode ser utilizado desde o nascimento.

O adaptador nasal Nariz Limpinho® é feito de silicone maleável, oferecendo-lhe a segurança de que não magoa o seu filho durante a higiene nasal.

Mais informação sobre lavagem nasal na wiki da lavagem nasal para bebés, crianças e recém nascidos.

Últimas Noticias

A Revolução da Programação: O Impacto da Inteligência Artificial no Desenvolvimento de Software

2025/05/26

Google Wallet para Crianças: A Nova Era dos Pagamentos Digitais

2025/05/25

PlayStation em Crise: Estratégia de Serviços ao Vivo em Xeque Após Fracasso de Concord!,

2025/05/25

Falhanço Total: A Ferramenta Community Notes do X Está a Desiludir

2025/05/24

Microsoft Office 2024: O Futuro do Software de Produtividade sem Subscrições

2025/05/24

Erro Catastrófico: Google Lança Ferramenta que Assume o Controlo Total do Seu Computador

2025/05/24

ÚLTIMAS REVIEWS

Reviews

Review Energy System K7 Silent-Ninja: um teclado gaming humilde

2022/04/24
Reviews

Review Energy System M3 Neon: rato gaming a bom preço!

2022/04/21
Notícias

Review aos Urbanista Los Angeles: música sem parar

2022/04/19

Top Dicas

Dicas

iMessage: conhece as melhores funcionalidades do serviço de mensagens da Apple

2022/02/02
Dicas

Controla a tua saúde mental com estes serviços

2021/02/12
Dicas

Tile vs. Samsung SmartTag e Apple AirTag – qual o localizador a comprar?

2021/04/27
Tecnologia Fácil

Categorias

  • Curiosidades
  • Dicas
  • Entretenimento
  • Notícias
  • Opinião
  • Reviews
  • Todos os artigos

Etiquetas

#imperdível AI Amazon Android Apple chatgpt China Chrome Cinema e TV Ciência Crónica Curiosidades Dicas Elon Musk fim Gaming Google IA Instagram inteligência artificial iphone jogos lua Meta microsoft MWC 2022 Netflix novidade OpenAI Opinião Portugal Reviews Samsung segurança Spotify Tecnologia Tesla TikTok twitter whatsapp windows Windows 11 xbox Xiaomi YouTube

Recentes

A Revolução da Programação: O Impacto da Inteligência Artificial no Desenvolvimento de Software

Maio 26, 2025

Google Wallet para Crianças: A Nova Era dos Pagamentos Digitais

Maio 25, 2025
  • Sobre nós
  • Publicidade
  • Política de privacidade
  • Declaração de Ética

© 2024 TecnologiaFácil - Parceiros: Site Fácil | Lavagem Nasal | Nariz Limpinho

Sem resultados
Ver todos os resultados
  • Home
  • Notícias
  • Reviews
  • Dicas
  • Opinião
  • Entretenimento
  • Curiosidades

© 2024 TecnologiaFácil - Parceiros: Site Fácil | Lavagem Nasal | Nariz Limpinho