De verborgen kost van AI

Generatieve AI wordt mooier voorgesteld dan het in werkelijkheid is. Achter de façade wordt massaal roofbouw gepleegd op mens en milieu.

We kunnen er niet omheen: langs alle kanten wordt je tegenwoordig geconfronteerd met AI (en nu ook al in dit artikel). Het lijkt wel alsof elk initiatief, bedrijf of overheid niet goed bezig is, tenzij ze iets met AI aan het implementeren zijn. Vooral generatieve AI (genre ChatGPT, DALL-E, Le Chat, …) wordt daarbij opgedrongen als magische tool, die massaal vervelende taken gaat automatiseren, alle kennis in pacht heeft, en bovenal een performantie verhoging op de werkvloer moet teweegbrengen (lees: meer werk verzetten of minder mensen, maar waarschijnlijk beiden).

Het ontwikkelen van dergelijke AI modellen gaat evenwel gepaard met enorme kosten, en heeft een rechtstreekse impact op mens en milieu. Een AI model moet je immers eerst trainen op basis van een heel grote dataset aan tekst, beelden, … Om die data te verzamelen wordt het hele internet doorspit en met supercomputers in grote datacenters geanalyseerd. Een forse klus, die flink wat tijd en grondstoffen verbruikt.

Milieu impact

Het Franse Mistral (het bedrijf achter AI model ‘Le Chat’, https://mistral.ai) publiceerde recent gedetailleerde cijfers over hun milieu impact. De training van hun grootste model, Mistral Large 2, genereerde in totaal 20,4 kiloton aan CO2 emissies. Dat is equivalent met de jaarlijkse emissies van 4.758 personenwagens op benzine (https://www.epa.gov/energy). Tegelijk gebruikte die training 281 miljoen liter water, wellicht voornamelijk als koelwater voor het datacenter, net zoals in een energiecentrale als Doel het geval is. Wel knap dat Mistral zo transparant durft te zijn, want ze zijn globaal een kleine speler. Naar het energie verbruik van de Noord-Amerikaanse AI marktleiders hebben we het raden want die bieden hoegenaamd geen transparantie. Maar indicatief zijn bv. recente berichten dat zelfs oudere kerncentrales van onder het stof worden gehaald om aan de immer toenemende energievraag in de US tegemoet te komen (https://www.reuters.com).

Ook het internet kreunt onder de impact van AI. In hun zucht naar steeds meer nieuwe data om de AI modellen te trainen, worden ‘scraper bots’ ingezet. Dat is autonome software die systematisch kijken of de content van websites is veranderd. Sommige bekende informatieleveranciers, zoals bv. bibliotheken, museums, archieven merken echter dat deze bots hun site zo vaak controleren en informatie opvragen dat ‘reguliere’ gebruikers de website niet meer kunnen raadplegen. Generatieve AI ontwikkelaars voeren zo eigenlijk het equivalent van een DDOS aanval uit, een techniek die soms ook door malafide hackers wordt ingezet. Om de bots te weren dienen de informatieleveranciers zelf software in te zetten zoals Cloudflare of Nepenthes. Die proberen de bots om de tuin te leiden en laten hen verdwalen in een labyrint van webpagina’s met (door generatieve AI gegenereerde) verzonnen data, of zelfs bewust ‘giftige’ data bedoeld om het AI model ontwikkelingsproces tegen te werken. Een spel van kat en muis, met één verliezer: de kleine, onafhankelijke website die niet de middelen heeft om mee te draaien in deze virtuele wapenwedloop.

Menselijke kost

En, niet in het minst, heeft de ontwikkeling van AI ook een menselijke kost. Want die verzamelde dataset om het model op te trainen moet ook worden uitgezuiverd. Als jij een vraag stelt aan ChatGPT, zou je waarschijnlijk liever niet hebben dat die jou een pornografisch antwoord voorschotelt. Of dat DALL-E jou een afbeelding aflevert waarin een grafische gewelddaad is verwerkt. Nochtans staat het internet, in al zijn glorieuze afspiegeling van de menselijke conditie, vol van dat soort content. Dus als je wil vermijden dat porno, geweld, haat, etc. toch opduiken in een AI model, moet iemand dat uit de dataset van het model verwijderen. En ultiem is dit een taak die door mensen wordt uitgevoerd: duizenden data annotatoren en content moderatoren in landen als Kenia, India, Zuid Afrika, … die voor dit keiharde werk peanuts worden betaald. Om ChatGPT minder toxisch te maken huurde OpenAI bv. het Keniaanse bedrijf Sama in, waar werknemers maximaal 2 dollar per uur verdienden. De werknemers werden dag in dag uit met zeer extreme content geconfronteerd. Een der mate traumatische ervaring, dat het bedrijf uiteindelijk zelf besloot om vroegtijdig het contract met OpenAI te verbreken (https://time.com).

De praktijken van technologiebedrijven die generatieve AI ontwikkelen roepen steeds meer ethische vragen op. In afwezigheid van gedegen reglementering is het aan ons, de potentiële eindgebruiker, om de enige ethische keuze te maken en massaal generatieve AI links te laten liggen. Check https://resist-ai.sh hoe je dat kan doen.

Meer nieuws in deze categorie

Makers gezocht

We gebruiken cookies om het verkeer op onze website te analyseren, en eventueel te delen met onze sociale mediapartners. View more
Cookies settings
Accepteren
Weigeren
Privacy & Cookie policy
Privacy & Cookies policy
Cookie name Active

Wie zijn we

Ons site adres is: https://www.gazetvanstekene.be.

Comments

Als bezoekers reacties achterlaten op de site, verzamelen we de gegevens getoond in het reactieformulier, het IP-adres van de bezoeker en de browser user agent om te helpen spam te detecteren. Een geanonimiseerde string, gemaakt op basis van je e-mailadres (dit wordt ook een hash genoemd) kan worden gestuurd naar de Gravatar dienst indien je dit gebruikt. De privacybeleid pagina van de Gravatar dienst kun je hier vinden: https://automattic.com/privacy/. Nadat je reactie is goedgekeurd, is je profielfoto publiekelijk zichtbaar in de context van je reactie.

Media

Als je een geregistreerde gebruiker bent en afbeeldingen naar de site upload, moet je voorkomen dat je afbeeldingen uploadt met daarin EXIF GPS locatie gegevens. Bezoekers van de site kunnen de afbeeldingen van de site downloaden en de locatiegegevens inzien.

Cookies

Wanneer je een reactie achterlaat op onze site, kun je aangeven of je naam, je e-mailadres en site in een cookie opgeslagen mogen worden. Dit doen we voor je gemak zodat je deze gegevens niet opnieuw hoeft in te vullen voor een nieuwe reactie. Deze cookies zijn een jaar lang geldig. Indien je onze inlogpagina bezoekt, slaan we een tijdelijke cookie op om te controleren of je browser cookies accepteert. Deze cookie bevat geen persoonlijke gegevens en wordt verwijderd zodra je je browser sluit. Zodra je inlogt, zullen we enkele cookies bewaren in verband met je login informatie en schermweergave opties. Login cookies zijn 2 dagen geldig en cookies voor schermweergave opties 1 jaar. Als je "Herinner mij" selecteert, wordt je login 2 weken bewaard. Zodra je uitlogt van je account, worden login cookies verwijderd. Wanneer je een bericht wijzigt of publiceert wordt een aanvullende cookie door je browser opgeslagen. Deze cookie bevat geen persoonlijke data en heeft enkel het post ID van het artikel wat je hebt bewerkt in zich. Deze cookie is na een dag verlopen.

Ingesloten inhoud van andere sites

Berichten op deze site kunnen ingesloten inhoud bevatten (bijvoorbeeld video's, afbeeldingen, berichten, enz.). Ingesloten inhoud van andere sites gedraagt zich exact hetzelfde alsof de bezoeker deze andere site heeft bezocht. Deze sites kunnen gegevens over je verzamelen, cookies gebruiken, extra tracking van derde partijen insluiten en je interactie met deze ingesloten inhoud monitoren, inclusief het vastleggen van de interactie met ingesloten inhoud als je een account hebt en ingelogd bent op die site.

Met wie we je gegevens delen

Als je een wachtwoord reset aanvraagt, wordt je IP-adres opgenomen in de reset e-mail.

Hoelang we je gegevens bewaren

Wanneer je een reactie achterlaat dan wordt die reactie en de metadata van die reactie voor altijd bewaard. Op deze manier kunnen we vervolgreacties automatisch herkennen en goedkeuren in plaats van dat we ze moeten modereren. Voor gebruikers die zich op onze site registreren (indien aanwezig), slaan we ook de persoonlijke informatie op die ze verstrekken in hun gebruikersprofiel. Alle gebruikers kunnen op ieder moment hun persoonlijke informatie bekijken, bewerken of verwijderen (behalve dat ze hun gebruikersnaam niet kunnen wijzigen). Site beheerders kunnen deze informatie ook bekijken en bewerken.

Welke rechten je hebt over je gegevens

Als je een account hebt op deze site of je hebt reacties achter gelaten, kan je verzoeken om een exportbestand van je persoonlijke gegevens die we van je hebben, inclusief alle gegevens die je ons opgegeven hebt. Je kan ook verzoeken dat we alle persoonlijke gegevens die we van je hebben wissen. Dit bevat geen gegevens die we verplicht moeten bewaren in verband met administratieve, wettelijke of beveiligings doeleinden.

Waar je gegevens naar toe worden gezonden

Mogelijk worden reacties van bezoekers gecontroleerd via een geautomatiseerde spamdetectie service.
Save settings
Cookies settings