New York Times sagsøger OpenAI og deres nære samarbejdspartner (og investor) Microsoft for angiveligt at krænke ophavsretten ved at træne generative AI-modeller på Times’ indhold. Ifølge sagsanlægget, indgivet i den føderale distriktsdomstol i Manhattan, brugte Times millioner af sine artikler til at træne AI-modeller, herunder dem, der ligger til grund for OpenAIs yderst populære ChatGPT og Microsofts Copilot, uden deres samtykke. Times kræver, at OpenAI og Microsoft “ødelægger” modeller og træningsdata, der indeholder det krænkende materiale, og at de holdes ansvarlige for “milliarder af dollars i lovbestemte og faktiske skader” relateret til “den ulovlige kopiering og brug af Times’ unikt værdifulde værker.”
“Den uafhængige journalistik, som The Times og andre nyhedsorganisationer producerer og beskytter, er uerstattelig, og deres fravær vil skabe et vakuum, som ingen computer eller kunstig intelligens kan udfylde,” står der i Times’ klage. “Mindre journalistik vil blive produceret, og samfundets omkostninger vil være enorme.”
I en e-mail udtalelse sagde en talsperson for OpenAI: “Vi respekterer indholdsproducenters og ejeres rettigheder og er forpligtet til at arbejde sammen med dem for at sikre, at de drager fordel af AI-teknologi og nye indtægtsmodeller. Vores igangværende samtaler med The New York Times har været produktive og konstruktive, så vi er overraskede og skuffede over denne udvikling. Vi håber, at vi vil finde en gensidigt fordelagtig måde at arbejde sammen på, som vi gør med mange andre udgivere.”
Generative AI-modeller “lærer” fra eksempler for at skabe essays, kode, e-mails, artikler og mere, og leverandører som OpenAI skraber internettet for millioner til milliarder af disse eksempler til deres træningssæt. Nogle eksempler er offentligt tilgængelige. Andre er det ikke, eller de falder ind under restriktive licenser, der kræver citation eller specifikke former for kompensation.
Leverandører hævder, at fair use-doktrinen giver en blanketbeskyttelse for deres web-skrabningspraksis. Ophavsretsindehavere er uenige; hundredvis af nyhedsorganisationer bruger nu kode til at forhindre OpenAI, Google og andre i at scanne deres websteder for træningsdata.
Konflikten mellem leverandører og udgivere har ført til et stigende antal retssager, hvor Times’ er den seneste.
Skuespillerinden Sarah Silverman tilsluttede sig et par retssager i juli, der anklager Meta og OpenAI for at have “indtaget” Silvermans memoir for at træne deres AI-modeller. I en separat sag hævder tusindvis af romanforfattere, herunder Jonathan Franzen og John Grisham, at OpenAI har brugt deres arbejde som træningsdata uden deres tilladelse eller viden. Og flere programmører har en igangværende sag mod Microsoft, OpenAI og GitHub over Copilot, et AI-drevet kodegenereringsværktøj, som sagsøgerne siger blev udviklet ved hjælp af deres IP-beskyttede kode.
Selvom The Times ikke er den første til at sagsøge generative AI-leverandører for påståede IP-krænkelser, der involverer skrevne værker, er det den største udgiver, der er involveret i en sådan sag til dato – og en af de første til at fremhæve potentiel skade på sit brand gennem “hallucinationer” eller opdigtede fakta fra generative AI-modeller.
Times’ klage citerer flere tilfælde, hvor Microsofts Bing Chat (nu kaldet Copilot), som er baseret på en OpenAI-model, leverede forkerte oplysninger, der skulle være kommet fra The Times – herunder resultater for “de 15 mest hjerte-sunde fødevarer”, hvoraf 12 ikke blev nævnt i nogen Times-artikel.
Times påstår også, at OpenAI og Microsoft effektivt bygger nyhedsudgiverkonkurrenter ved hjælp af Times’ værker, hvilket skader Times’ forretning ved at levere oplysninger, som normalt ikke kan tilgås uden et abonnement – oplysninger, der ikke altid citeres, nogle gange monetiseres og fratages affiliate links, som Times bruger til at generere provisioner.
Som det antydes i Times’ klage, har generative AI-modeller en tendens til at gengive træningsdata, for eksempel næsten ordret at reproducere resultater fra artikler. Udover gengivelse har OpenAI ved mindst én lejlighed ved et uheld gjort det muligt for ChatGPT-brugere at omgå betalingsmuret nyhedsindhold.
“Sagsøgte forsøger at gratis-ride på Times’ massive investering i sin journalistik,” siger klagen, og anklager OpenAI og Microsoft for “at bruge Times’ indhold uden betaling for at skabe produkter, der erstatter Times og stjæler publikum fra den.”
Indvirkningen på nyhedsabonnementsforretningen – og udgivernes webtrafik – er i hjertet af en lignende sag indgivet tidligere på måneden af udgivere mod Google. I sagen hævdede sagsøgerne, ligesom Times, at Googles GenAI-eksperimenter, herunder dets AI-drevne Bard-chatbot og Search Generative Experience, siver udgivernes indhold, læsere og annonceindtægter gennem konkurrencebegrænsende midler.
Udgivernes påstande har visse holdepunkter. En nylig model fra The Atlantic fandt, at hvis en søgemaskine som Google skulle integrere AI i søgning, ville den besvare en brugers forespørgsel 75% af tiden uden at kræve et klik gennem til dets websted. Udgiverne i Google-sagen vurderer, at de ville miste op til 40% af deres trafik.
Det betyder dog ikke, at de vil få succes i retten. Heather Meeker, stiftende partner hos OSS Capital og rådgiver i IP-spørgsmål, herunder licensaftaler, sammenlignede Times’ eksempel på gengivelse med “at bruge et tekstbehandlingsprogram til at klippe og indsætte.”
“I klagen giver The New York Times et eksempel på en ChatGPT-session om en restaurantanmeldelse fra 2012,” fortalte Meeker TechCrunch via e-mail. “Prompten til ChatGPT er ‘Hvad var de åbnende afsnit af hans anmeldelse?’ De næste prompts beder gentagne gange om ‘den næste sætning.’ At drille en chatbot til at reproducere input er ikke et fornuftigt grundlag for krænkelse af ophavsretten… Hvis brugeren bevidst får chatbotten til at kopiere, er det brugerens skyld. Og det er derfor, de fleste [retssager som denne] sandsynligvis vil mislykkes.”
Nogle nyhedsudgivere har i stedet for at kæmpe mod generative AI-leverandører i retten valgt at indgå licensaftaler med dem. The Associated Press indgik en aftale i juli med OpenAI, og Axel Springer, den tyske udgiver, der ejer Politico og Business Insider, gjorde det samme denne måned.
I sin klage siger The Times, at det forsøgte at nå en licensaftale med Microsoft og OpenAI i april, men at forhandlingerne i sidste ende ikke var frugtbare.
KILDE: https://techcrunch.com/2023/12/27/the-new-york-times-wants-openai-and-microsoft-to-pay-for-training-data/
Skriv et svar