Os escritores de fanfiction batalham ai, um raspar de cada vez

Os escritores de fanfiction batalham ai, um raspar de cada vez

Blog Curiosidade Tecnologia

No mundo on -line dos escritores de fanfiction, que as histórias de caneta inspiradas em seus filmes, livros e jogos favoritos e os compartilham de graça, existem códigos de conduta não ditos. Entre os mais importantes: nunca cobre dinheiro pela sua fanfic e nunca roube o trabalho de outras pessoas.

Faz sentido, então, que os escritores da fanfic estavam entre os primeiros criadores a derramar o alarme sobre o trabalho deles ser alimentado ao aprendizado de modelos de idiomas que alimentam IA generativa sem seu conhecimento ou permissão. Mas seus esforços para impedir a invasão da IA ​​em espaços de fãs é uma batalha difícil.

A Salvo mais recente chegou no início de abril, quando o usuário Nyuuzyou raspou 12,6 milhões de fanfics do arquivo de repositório on-line (AO3) e enviou o conjunto de dados para abraçar o rosto, uma empresa que hospeda os modelos e software de IA de código aberto.

O upload de Nyuuzyou foi rapidamente descoberto pelo Reddit Community R/AO3, onde centenas de usuários postaram reações furiosas. Uma conta do Tumblr, AO3ScRapeSearch, construiu um mecanismo de pesquisa que permitia aos autores pesquisar seus nomes de usuário e ver se o trabalho deles havia sido raspado por Nyuuzyou.

“Isso é algo que leva tempo e esforço, seu coração e sua alma, e você faz isso em uma comunidade.”

Os escritores da fanfic inundaram a seção de comentários do conjunto de dados em abraçar o rosto, entrando em argumentos com os defensores da IA. Dckchili defendeu o arranhão de Nyuuzyou, alegando que não importava porque os rastreadores de grande tecnologia já rasparam o arquivo inúmeras vezes. Raraeaves argumentou que “os arrepios” dependem dos escritores da fanfic para não revidar quando seu trabalho e criatividade estão sendo explorados.

Quando Nikki, uma escritora de fãs de Guerra nas Estrelas que passa por Infinitegalaxies on -line, digitou seu nome no mecanismo de busca, ela viu que mais de 70 de suas fic que foram raspadas. Mas um pulou. Era um ensaio coletivo que ela foi co-autora com outros 11 escritores para aumentar a conscientização sobre a ameaça de IA para fandom e carregada para AO3. A ironia não escapou dela.

Nikki escreve principalmente a fanfiction sobre Reylo, o emparelhamento romântico (ou “navio”) dos personagens Rey e Kylo Ren do Guerra nas Estrelas Trilogia da sequência. O Reylo Fandom é unido e prolífico, com mais de 30.000 histórias de Reylo postadas no AO3. Cerca da metade está definida no cânone Guerra nas Estrelas Universo de sabres de luz e aventuras espaciais, mas a outra metade ocorre em universos alternativos e explore tudo, desde romances de cafeteira e dramas no local de trabalho a cavaleiros medievais e reinos de fadas. Uma fic particularmente amada no fandom é ambientada em 1994 e reformula Kylo Ren como Kyril, um chefe da Máfia na Rússia recém-soviética. O fandom produziu escritores como Ali Hazelwood e Thea Guazon, que deram o salto da Fanfic para se tornarem autores de romance publicados e altamente bem -sucedidos.

Para Nikki, o Reylo Fandom oferece um novo senso de pertencimento. Ela encontrou um lar na comunidade de apoio de escritores e leitores e apreciou a liberdade de escrever o que quisesse.

“Os fãs são em grande parte uma economia de presentes. Estamos aqui para nos divertir e fazer as coisas com a bondade de nosso coração. E dar coisas um para o outro e fazer o trabalho na comunidade”, diz Nikki.

Esse sentimento é ecoado por muitos outros na comunidade Reylo, incluindo Em, que escreve sob o pseudônimo de Okapijones. Em se apaixonou pelos personagens de Rey e Kylo Ren porque eles representaram os arquétipos claros / escuros de inimigos para amantes que a lembraram de A bela e a fera e Orgulho e preconceito. Mas ela odiava a maneira como a história deles terminava no Guerra nas Estrelas Trilogia da sequência e procurou outros fãs que queriam um final diferente.

“A FIC mudou minha vida. Conheci alguns dos melhores amigos que já tive através da FIC e através da comunidade de fanfiction”, diz Em. “Não há regras, não há editores. É um playground puro criativo, e isso vai criar inovação. Algumas das histórias mais criativas que eu já li, algumas das histórias mais loucas, são fanfic. E isso me excita como criador, porque você pode fazer o que quiser”.

“Isso é algo que leva tempo e esforço, seu coração e sua alma, e você faz isso em uma comunidade”, diz Nikki. “E então você está me dizendo que está apenas cocô dois segundos na tela. E eu fiquei tipo, quem pediu isso? Isso é nojento.”

Em 2023, veio o motor da história de Sudowrite, alimentado em parte pelo chatgpt da Openai. Nikki se lembra de assistir a um vídeo sobre o novo software AI “Writing Assistant”, que permite que os usuários inseram detalhes sobre personagens e pontos de plotagem e geram um romance inteiro. Ela ficou tão chocada que a fez chorar. Nikki, que trabalha para uma empresa de software, já tinha visto seu local de trabalho mudar para a integração da IA. Mas ela não imaginou que seu hobby também seria impactado por ele.

“Tentando derrubar essas coisas, é provavelmente a melhor coisa que se pode fazer agora.”

Mais tarde naquele ano, a prevalência de termos sexuais altamente específicos relacionados ao tropo de fanfiction de lobo-biologia de Omegaverse apareceu em Sudowrite, revelando que o ChatGPT provavelmente havia sido treinado para a fanfic sem o conhecimento dos autores.

Desde então, Nikki e muitos outros defendem a IA em todas as suas formas em fãs, incluindo o uso da IA ​​para gerar fanfic ou Fanaart.

“É roubo em sua essência. Não há uso ético de algo construído sobre trabalho roubado”, diz Nikki. Embora ela seja contra Genai em princípio por causa de sua dependência de dados obtidos sem consentimento, ela também diz que isso rompe com as normas fãs de troca livre.

“Fiz isso porque amo esses personagens, porque queria brincar naquela caixa de areia, porque queria que as pessoas que também os amassem a lerem. É um presente.” Em diz. “Eles roubaram sem minha permissão.”

Mas, nos últimos anos, os escritores de fanfic dizem que houve inúmeros exemplos de empreendedores da Genai que tentam lucrar com seu trabalho-como pessoas como Cliff Weitzman, CEO da Appify de texto para voz, que foi encontrado para que o Site Authem. (Ele removeu rapidamente que depois que os fãs recuaram nas mídias sociais.) Então havia conhecimento. O aplicativo foi anunciado em maio de 2024, mas foi retirado no final daquele mês após a reação dos fãs.

“É como uma coisa de pancada. Toda vez que você se vira, há outro grifter tentando roubar sua merda”, diz Nikki.

Pode parecer estranho ouvir um sentimento tão forte de um escritor que, como a maioria dos criadores de fanfic, usa a propriedade intelectual protegida por direitos autorais como uma “caixa de areia” para inventar suas próprias histórias. Mas os defensores do FanWorks dizem que são “transformadores”, o que significa que um “criador de fãs detém os direitos de seu próprio conteúdo, da mesma forma que qualquer autor, artista profissional ou outro criador”, de acordo com a AO3. Isso é muito diferente do que um LLM faz quando, por exemplo, gera um romance baseado em prompts. A IA não pode replicar o processo humano criativo de “transformação”, que envolve inventar e integrar novas idéias. Os LLMs só podem remodelar e regurgitar conteúdo que já existe.

E, diferentemente dos livros gerados pela IA que inundam a Amazon, um dos princípios da fanfiction é que os escritores não obtêm lucro com seu trabalho.

Isso não impediu a IA se infiltrando em fãs de outras maneiras controversas. Alguns leitores, ansiosos para obter novas atualizações de suas fics favoritas, adotaram para enviá -las para o chatgpt para gerar novos capítulos, para a consternação de alguns autores. Alguns adotaram o bloqueio de suas histórias, exigindo que os leitores tenham uma conta AO3 para acessá -las ou excluí -las da Internet completamente.

No caso do arranhão de Nyuuzou, os fãs coordenaram on-line para arquivar avisos de abstenção sob o Digital Millennium Copyright Act (DMCA) e a Organização de Obras Transformativas (OTW), a organização sem fins lucrativos que administra AO3, também apresentou uma queda. Em 9 de abril, abraçar o rosto desativado o conjunto de dados. A OTW respondeu às preocupações dos usuários sobre fanfics serem raspadas em uma reunião do conselho em 26 de abril, dizendo: “Adicionamos uma ferramenta Cloudflare para impedir a raspagem da IA ​​e outros bots. Isso ajuda muito, mas não é perfeito. No entanto, soluções mais robustas teriam um impacto negativo significativo em alguns de nossos usuários, especialmente aqueles que usam dispositivos mais antigos.”

Nyuuzou permaneceu impenitente, apresentando uma contocirteza e reuplomando o conjunto de dados para sites hospedados na Rússia e na China, que são muito menos responsivos às queixas da DMCA. Contatado por A beira Por meio de uma conta de telegrama ligada ao seu perfil de rosto abraçado, Nyuuzou disse que era um estudante de 18 anos e trabalhador de TI na Rússia que “não está interessado em fanfiction” e enviou o conjunto de dados para “fins de pesquisa legítima”.

“Meu objetivo era apoiar pesquisas comunitárias em áreas como moderação de conteúdo, ferramentas anti-plágio, sistemas de recomendação e preservação de arquivo”, escreveu Nyuuzou via Telegram. “Acho que grande parte do desacordo vem de mal -entendidos sobre por que esses conjuntos de dados existem. Isso nunca se tratava de criar chatbots ou grandes modelos de idiomas para uso comercial”.

Fundada em 2016 por empreendedores franceses, abraçar o rosto começou a construir chatbots para adolescentes. Desde então, a empresa se expandiu para hospedar modelos de código aberto com o objetivo declarado de “Democratizando a IA”, tornando o desenvolvimento de aprendizado de máquina acessível ao público.

“Nosso objetivo é permitir que todas as empresas do mundo construam sua própria IA”, disse Jeff Boudier, abraçando o chefe de produto do rosto, à Amazon Web Services (AWS) em fevereiro. Mas abraçar o rosto está profundamente conectado a grandes empresas. Além de sua colaboração em andamento com a AWS, a IBM investiu US $ 235 milhões em Hugging Face em 2023 e anunciou que estava colaborando com a empresa no Watsonx, a plataforma generativa de IA da IBM.

Nyuuzou disse que ficou surpreso com a reação agressiva do OTW ao conjunto de dados, escrevendo: “Eu esperava dialogar sobre como os conjuntos de dados de pesquisa poderiam se alinhar com os objetivos de preservação”.

“Isso é realmente falso”, diz Alex Hanna, diretor de pesquisa do Instituto de Pesquisa Distribuído da IA ​​e autor de A IA CON: Como combater o hype da Big Tech e criar o futuro que queremos. Ela é cética em relação à ideia de que qualquer conjunto de dados enviado para abraçar o rosto não seria usado para treinar LLMs. “Por que você teria uma grande parcela de dados não estruturados disponíveis na Web, se não fossem treinar um modelo de idioma?”

Embora raspadores individuais como Nyuuzou sejam pequenos fritas na economia em geral de Genai, que é dominada por empresas de bilhões de dólares como o Openai, Hanna diz que ainda está de acordo com sites como AO3 para proteger agressivamente o trabalho de seus usuários. Quanto aos próprios escritores de fanfic, ela acha que a estratégia de Nikki de Whack-A-Mole é o caminho a percorrer. “Tentando derrubar essas coisas, é provavelmente a melhor coisa que se pode fazer agora”, diz Hanna.

Nikki e Em, os escritores da Fanfic, tiveram uma resposta mais acalorada à explicação de Nyuuzou para o arranhão.

“Foda -se, cara”, diz Em. “Fazemos trabalho livre pelo amor ao jogo e não estamos lucrando com ele – além de criar uma comunidade, ganhando prática para nosso ofício e criando conteúdo para personagens e histórias que amamos. E isso está sendo roubado para alimentar coisas que têm implicações tão maiores”.

Nikki diz que está determinada a continuar se recuperando contra a invasão da IA ​​nos espaços fãs.

“Eu não vou procurar brigar”, diz ela. “Mas quando as pessoas vêm até nós com uma briga, eu lutarei.”

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *