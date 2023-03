Gisteren heeft OpenAI GPT-4 aangekondigd, het langverwachte AI-taalmodel van de volgende generatie. De mogelijkheden van het systeem worden nog beoordeeld, maar terwijl onderzoekers en experts zich verdiepen in de bijbehorende materialen, hebben velen hun teleurstelling geuit over een bepaald kenmerk: dat GPT-4, ondanks de naam van het moederbedrijf, geen open AI-model.

OpenAI heeft veel benchmark- en testresultaten voor GPT-4 gedeeld, evenals enkele intrigerende demo’s, maar heeft in wezen geen informatie gegeven over de gegevens die zijn gebruikt om het systeem te trainen, de energiekosten of de specifieke hardware of methoden die zijn gebruikt om het te maken .

Moet AI-onderzoek open of gesloten zijn? Deskundigen zijn het daar niet mee eens

Velen in de AI-gemeenschap hebben kritiek geuit op deze beslissing en merken op dat het de oprichtingsethos van het bedrijf als onderzoeksorganisatie ondermijnt en het voor anderen moeilijker maakt om zijn werk te repliceren. Misschien nog belangrijker is dat sommigen zeggen dat het het ook moeilijk maakt om waarborgen te ontwikkelen tegen het soort bedreigingen van AI-systemen zoals GPT-4, aangezien deze klachten komen in een tijd van toenemende spanning en snelle vooruitgang in de AI-wereld.

“Ik denk dat we het gesloten kunnen noemen op ‘Open’ AI: de 98 pagina’s tellende paper waarin GPT-4 wordt geïntroduceerd, verklaart trots dat ze * niets * onthullen over de inhoud van hun trainingsset, ” getweet Ben Schmidt, VP Information Design bij Nomic AI, in een thread over dit onderwerp.

Hier verwijst Schmidt naar een sectie in het technische GPT-4-rapport dat als volgt luidt:

Gezien zowel het concurrentielandschap als de veiligheidsimplicaties van grootschalige modellen zoals GPT-4, bevat dit rapport geen verdere details over de architectuur (inclusief modelgrootte), hardware, trainingscomputer, datasetconstructie, trainingsmethode of iets dergelijks.

Spreken tegen De rand in een interview ging Ilya Sutskever, hoofdwetenschapper en mede-oprichter van OpenAI, dieper in op dit punt. Sutskever zei dat OpenAI’s redenen om niet meer informatie over GPT-4 te delen – angst voor concurrentie en angst voor veiligheid – “vanzelfsprekend” waren:

“Op het gebied van concurrentie – het is daarbuiten competitief”, zei Sutskever. “GPT-4 is niet eenvoudig te ontwikkelen. Vrijwel heel OpenAI werkte heel lang samen om dit ding te produceren. En er zijn heel veel bedrijven die hetzelfde willen doen, dus vanuit competitief oogpunt kun je dit zien als een rijping van het veld.

“Aan de veiligheidskant zou ik zeggen dat de veiligheidskant nog niet zo’n opvallende reden is als de competitieve kant. Maar het gaat veranderen, en het is eigenlijk als volgt. Deze modellen zijn erg krachtig en ze worden steeds krachtiger. Op een gegeven moment zal het heel gemakkelijk zijn om, als je zou willen, met die modellen veel schade aan te richten. En naarmate de mogelijkheden groter worden, is het logisch dat u ze niet wilt onthullen.

“Ik verwacht volledig dat het over een paar jaar voor iedereen volkomen duidelijk zal zijn dat open-source AI gewoon niet verstandig is.”

De gesloten aanpak is een duidelijke verandering voor OpenAI, dat in 2015 werd opgericht door een kleine groep met onder meer de huidige CEO Sam Altman, Tesla-CEO Elon Musk (die in 2018 ontslag nam uit het bestuur) en Sutskever. In een inleidende blogpost zeiden Sutskever en anderen dat het doel van de organisatie was om “waarde te creëren voor iedereen in plaats van aandeelhouders” en dat het “vrij zou samenwerken” met anderen in het veld om dit te doen. OpenAI werd opgericht als een non-profitorganisatie, maar werd later een “afgetopte winst” om miljarden aan investeringen veilig te stellen, voornamelijk van Microsoft, met wie het nu exclusieve zakelijke licenties heeft.

Op de vraag waarom OpenAI zijn benadering van het delen van zijn onderzoek veranderde, antwoordde Sutskever eenvoudig: “We hadden het mis. Ronduit, we hadden het mis. Als u, net als wij, gelooft dat AI — AGIk — zal extreem, ongelooflijk krachtig zijn, dan heeft het gewoon geen zin om open-source te gebruiken. Het is een slecht idee… Ik verwacht volledig dat het over een paar jaar voor iedereen volkomen duidelijk zal zijn dat open-source AI gewoon niet verstandig is.”

De meningen in de AI-gemeenschap hierover lopen uiteen. Met name de lancering van GPT-4 komt slechts enkele weken nadat een ander AI-taalmodel, ontwikkeld door Facebook-eigenaar Meta, genaamd LLaMA, online uitlekte, wat soortgelijke discussies op gang bracht over de bedreigingen en voordelen van open-sourceonderzoek. De meeste eerste reacties op het gesloten model van GPT-4 waren echter negatief.

Spreken tegen De rand via DM legde Schmidt van Nomic AI uit dat het niet kunnen zien op welke gegevens GPT-4 was getraind, het moeilijk maakte om te weten waar het systeem veilig kon worden gebruikt en om met oplossingen te komen.

“Als mensen weloverwogen beslissingen willen nemen over waar dit model niet zal werken, moeten ze een beter idee hebben van wat het doet en welke aannames erin zijn ingebakken”, aldus Schmidt. “Ik zou een zelfrijdende auto die getraind is zonder ervaring in sneeuwklimaten niet vertrouwen; het is waarschijnlijk dat er enkele gaten of andere problemen zijn die naar boven kunnen komen wanneer dit in echte situaties wordt gebruikt.

William Falcon, CEO van Lightning AI en maker van de open-source tool PyTorch Lightning, vertelde VentureBeat dat hij de beslissing vanuit een zakelijk perspectief begreep. (“Je hebt het volste recht om dat als bedrijf te doen.”) Maar hij zei ook dat de verhuizing een “slecht precedent” schept voor de bredere gemeenschap en schadelijke gevolgen kan hebben.

“Als dit model fout gaat… hoe moet de gemeenschap dan reageren?”

“Als dit model fout gaat, en dat zal gebeuren, je hebt het al gezien met hallucinaties en het geven van valse informatie, hoe moet de gemeenschap dan reageren?” zei Valk. “Hoe moeten ethische onderzoekers gaan en daadwerkelijk oplossingen voorstellen en zeggen: deze manier werkt niet, misschien aanpassen om dit andere ding te doen?”

Een andere reden die door sommigen wordt gesuggereerd voor OpenAI om details van de constructie van GPT-4 te verbergen, is wettelijke aansprakelijkheid. AI-taalmodellen worden getraind op enorme tekstdatasets, waarbij veel (inclusief eerdere GPT-systemen) informatie van het web schrapen – een bron die waarschijnlijk auteursrechtelijk beschermd materiaal bevat. AI-beeldgeneratoren die ook getraind zijn op inhoud van internet, zijn om precies deze reden geconfronteerd met juridische uitdagingen, waarbij verschillende bedrijven momenteel worden aangeklaagd door onafhankelijke artiesten en stockfotosite Getty Images.

Op de vraag of dit een van de redenen was waarom OpenAI zijn trainingsgegevens niet deelde, zei Sutskever: “Mijn mening hierover is dat trainingsgegevens technologie zijn. Het ziet er misschien niet zo uit, maar dat is het wel. En de reden waarom we de trainingsgegevens niet vrijgeven, is ongeveer dezelfde reden waarom we het aantal parameters niet vrijgeven.” Sutskever antwoordde niet op de vraag of OpenAI definitief kon verklaren dat zijn trainingsgegevens geen illegaal gekopieerd materiaal bevatten.

Sutskever was het eens met de critici van OpenAI dat er “verdienste” is aan het idee dat open-sourcemodellen helpen bij het ontwikkelen van waarborgen. “Als meer mensen die modellen zouden bestuderen, zouden we er meer over leren, en dat zou goed zijn”, zei hij. Maar om deze redenen heeft OpenAI bepaalde academische en onderzoeksinstellingen toegang gegeven tot zijn systemen.

De discussie over het delen van onderzoek komt op een moment van hectische veranderingen in de AI-wereld, met toenemende druk op meerdere fronten. Aan de zakelijke kant haasten techgiganten als Google en Microsoft zich om AI-functies aan hun producten toe te voegen, waarbij eerdere ethische zorgen vaak aan de kant worden geschoven. (Microsoft heeft onlangs een team ontslagen dat ervoor moet zorgen dat zijn AI-producten de ethische richtlijnen volgen.) Aan de onderzoekskant lijkt de technologie zelf snel te verbeteren, waardoor de vrees ontstaat dat AI een serieuze en onmiddellijke bedreiging aan het worden is.

Het balanceren van deze verschillende druk vormt een serieuze bestuurlijke uitdaging, zei Jess Whittlestone, hoofd AI-beleid bij de Britse denktank The Centre for Long-Term Resilience – en een die volgens haar waarschijnlijk externe regelgevers zal moeten betrekken.

“Het zou niet aan individuele bedrijven moeten zijn om deze beslissingen te nemen.”

“We zien dat deze AI-mogelijkheden erg snel evolueren en ik maak me in het algemeen zorgen over het feit dat deze mogelijkheden sneller evolueren dan dat we ons er als samenleving aan kunnen aanpassen”, vertelde Whittlestone. De rand. Ze zei dat de redenen van OpenAI om niet meer details over GPT-4 te delen goed zijn, maar er waren ook terechte zorgen over de centralisatie van macht in de AI-wereld.