Google tikko paziņoja Tas sniedz vietņu izdevējiem iespēju atteikties no viņu datu izmantošanas, lai apmācītu uzņēmuma AI modeļus, vienlaikus nodrošinot tiem piekļuvi, izmantojot Google meklēšanu. Jauno rīku sauc Google Extendedļauj turpināt nokopt un indeksēt vietnes, izmantojot rāpuļprogrammas, piemēram, Google robots Vienlaikus izvairoties no viņu datu izmantošanas, lai apmācītu uzņēmuma pašreizējos un turpmākos AI modeļus.
Uzņēmums saka, ka Google-Extending ļaus izdevējiem “pārvaldīt, vai viņu vietnes palīdz uzlabot vai nē auksts Un Virsotnes mākslīgais intelekts Ģeneratīvās API,” viņš teica, piebilstot, ka tīmekļa izdevēji var izmantot slēdzi, “lai kontrolētu piekļuvi vietnes saturam.” Google jūlijā apstiprināja, ka apmāca savu tērzēšanas robotu Bard par publiski pieejamiem datiem, kas savākti no tīmekļa.
Google-Extending ir pieejams, izmantojot failu robots.txt, kas pazīstams arī kā teksta fails, kas norāda tīmekļa rāpuļprogrammām, vai viņi var piekļūt noteiktām vietnēm. Google atzīmē, ka, “paplašinājoties AI lietojumprogrammām”, tā turpinās pētīt “papildu mašīnlasāmas metodes atlasei un kontrolei tīmekļa izdevējiem”, un drīzumā tai būs vēl vairāk, ko kopīgot.
Jau tagad vairākas vietnes ir pārvietotas, lai bloķētu tīmekļa rāpuļprogrammu, ko OpenAI izmanto, lai iegūtu datus un apmācītu ChatGPT, tostarp Ņujorkas Laiks, CNN, ReutersUn Starpniecība. Tomēr bija bažas par to, kā aizliegt Google. Galu galā vietnes nevar pilnībā izslēgt Google rāpuļprogrammas, pretējā gadījumā tās netiks indeksētas meklēšanā. Tas ir novedis pie dažām vietnēm, piemēram, uz The New York Timesl Juridiski Tā vietā bloķējiet Google, atjauninot tā pakalpojumu sniegšanas noteikumus, lai uzņēmumi nevarētu izmantot tā saturu AI apmācīšanai.