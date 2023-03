Twee weken geleden kondigde Meta zijn nieuwste AI-taalmodel aan: LLaMA. Hoewel niet toegankelijk voor het publiek zoals OpenAI’s ChatGPT of Microsoft’s Bing, is LLaMA Meta’s bijdrage aan een golf van AI-taaltechnologie die nieuwe manieren belooft om met onze computers om te gaan, evenals nieuwe gevaren.

Meta heeft LLaMA niet uitgebracht als openbare chatbot (hoewel de Facebook-eigenaar is die ook bouwen), maar als een open-sourcepakket waartoe iedereen in de AI-gemeenschap toegang kan vragen. De bedoeling, zei het bedrijf, is “de toegang tot AI verder te democratiseren” om onderzoek naar de problemen ervan te stimuleren. Meta profiteert als deze systemen minder bugs bevatten, dus ze zullen het geld graag uitgeven om het model te maken en het voor anderen te distribueren om problemen mee op te lossen.

“Zelfs met alle recente vorderingen op het gebied van grote taalmodellen, blijft volledige onderzoekstoegang daartoe beperkt vanwege de middelen die nodig zijn om zulke grote modellen te trainen en te gebruiken”, aldus het bedrijf in een blogpost. “Deze beperkte toegang heeft het vermogen van onderzoekers beperkt om te begrijpen hoe en waarom deze grote taalmodellen werken, waardoor vooruitgang wordt belemmerd bij het verbeteren van hun robuustheid en het verminderen van bekende problemen, zoals vooringenomenheid, toxiciteit en het potentieel voor het genereren van verkeerde informatie.”

Meta’s state-of-the-art AI-taalmodel lekte een week na de release uit op 4chan

Echter, slechts een week nadat Meta verzoeken begon in te dienen om toegang te krijgen tot LLaMA, werd het model online gelekt. Op 3 maart werd een downloadbare torrent van het systeem gepost op 4chan en heeft zich sindsdien verspreid over verschillende AI-gemeenschappen, wat leidde tot discussies over de juiste manier om baanbrekend onderzoek te delen in een tijd van snelle technologische veranderingen.

Sommigen zeggen dat het lek verontrustende gevolgen zal hebben en geven Meta de schuld voor het te vrijelijk verspreiden van de technologie. “Bereid u voor op massa’s gepersonaliseerde spam- en phishingpogingen,” getweet cybersecurity-onderzoeker Jeffrey Ladish nadat het nieuws uitkwam. “Het open sourcen van deze modellen was een vreselijk idee.”

Anderen zijn optimistischer en beweren dat open toegang nodig is om waarborgen voor AI-systemen te ontwikkelen en dat vergelijkbare complexe taalmodellen al openbaar zijn gemaakt zonder noemenswaardige schade aan te richten.

“Ons is al een tijdje verteld dat er een golf van kwaadwillig gebruik (van AI-taalmodellen) op komst is”, schreven onderzoekers Sayash Kapoor en Arvind Narayanan in een blogpost. “Toch lijken er geen gedocumenteerde gevallen te zijn.” (Kapoor en Narayanan melden rapporten van studenten die vals spelen met ChatGPT of sites die worden overspoeld door AI-spam of de publicatie van met fouten gevulde AI-journalistiek, aangezien deze toepassingen niet bedoeld zijn om schade aan te richten en per definitie niet kwaadaardig zijn.)

De rand sprak met een aantal AI-onderzoekers die het gelekte systeem hebben gedownload en zeggen dat het legitiem is, waaronder een — Matthew Di Ferrante — die de gelekte versie kon vergelijken met het officiële LLaMA-model dat door Meta werd gedistribueerd en bevestigde dat ze overeenkwamen. Meta weigerde vragen te beantwoorden van De rand over de authenticiteit of oorsprong van het lek, hoewel Joelle Pineau, algemeen directeur van Meta AI, bevestigd in een persverklaring dat “Hoewel het (LLaMA) model niet voor iedereen toegankelijk is … sommigen hebben geprobeerd het goedkeuringsproces te omzeilen.”

LLaMA is krachtige AI – als je de tijd, expertise en juiste hardware hebt

Dus hoeveel gevaar is een loslopende LLaMA? En hoe verhoudt het model van Meta zich tot openbaar toegankelijke chatbots zoals ChatGPT en het nieuwe Bing?

Welnu, het belangrijkste punt is dat het downloaden van LLaMA voor de gemiddelde internetgebruiker heel weinig zal doen. Dit is geen kant-en-klare chatbot, maar een “onbewerkt” AI-systeem dat een behoorlijke hoeveelheid technische expertise nodig heeft om aan de slag te gaan. (Even terzijde: LLaMA is ook geen enkel systeem maar vier modellen van verschillende afmetingen en rekenkundige vereisten. Hierover later meer.)

Di Ferrante vertelt De rand dat “iedereen die bekend is met het opzetten van servers en ontwikkelomgevingen voor complexe projecten” LLaMA operationeel moet krijgen “mits voldoende tijd en de juiste instructies”. (Hoewel het vermeldenswaard is dat Di Ferrante ook een ervaren machine learning-ingenieur is met toegang tot een “machine learning-werkstation met 4 GPU’s van 24 GB” en dus niet representatief is voor de bredere bevolking.)

LLaMA is een “onbewerkt” model dat veel werk vereist om operationeel te worden

Naast hardware- en kennisbarrières is LLaMA ook niet “afgesteld” voor conversatie zoals ChatGPT of Bing. Verfijning is het proces waarbij de multifunctionele tekstgenererende mogelijkheden van een taalmodel worden gericht op een meer specifieke taak. Deze taak kan vrij breed zijn — bijvoorbeeld een systeem vertellen dat het “vragen van gebruikers zo nauwkeurig en duidelijk mogelijk moet beantwoorden” — maar een dergelijke afstemming is een noodzakelijke en vaak moeilijke stap bij het creëren van een gebruiksvriendelijk product.

Gezien deze beperkingen is het misschien handig om LLaMA te beschouwen als een ongemeubileerd flatgebouw. Veel van het zware werk is gedaan – het frame is gebouwd en er is stroom en sanitair aanwezig – maar er zijn geen deuren, vloeren of meubels. Je kunt er niet zomaar intrekken en het je thuis noemen.

Stella Biderman, directeur van non-profit AI-onderzoekslaboratorium EleutherAI en een machine learning-onderzoeker bij Booz Allen Hamilton, zei dat de rekeneisen van het model de “nummer één beperking” zouden zijn voor effectief gebruik. “De meeste mensen bezitten helemaal niet de hardware die nodig is om (de grootste versie van LLaMA) te draaien, laat staan ​​efficiënt”, vertelde Biderman. De rand.

Afgezien van deze kanttekeningen, is LLaMA nog steeds een buitengewoon krachtig hulpmiddel. Het model is er in vier formaten, die worden gemeten in miljarden parameters (een maatstaf die zich ruwweg vertaalt naar het aantal verbindingen binnen elk systeem). Er is een LLaMA-7B, 13B, 30B en 65B. Meta zegt dat de 13 miljard versie – die kan worden uitgevoerd op een enkele A100 GPU, een enterprise-grade systeem dat relatief toegankelijk is en een paar dollar per uur kost om te huren op cloudplatforms – beter presteert dan OpenAI’s 175 miljard parameters tellende GPT-3-model op tal van benchmarks voor AI-taalmodellen.

“Ik denk dat het zeer waarschijnlijk is dat deze modelrelease een enorme mijlpaal zal zijn.”

Er is natuurlijk veel discussie over de geldigheid van deze vergelijkingen. AI-benchmarks zijn berucht omdat ze niet worden vertaald naar gebruik in de echte wereld, en sommige LLaMA-gebruikers hebben moeite gehad om fatsoenlijke output uit het systeem te halen (terwijl anderen hebben gesuggereerd dat dit slechts een vaardigheidsprobleem is). Maar alles bij elkaar genomen suggereren deze statistieken dat LLaMA, indien nauwkeurig afgesteld, mogelijkheden biedt die vergelijkbaar zijn met ChatGPT. En veel waarnemers geloven dat de compacte aard van LLaMA een significant effect zal hebben op het stimuleren van ontwikkeling.

“Ik denk dat het zeer waarschijnlijk is dat deze modelrelease een enorme mijlpaal zal zijn”, vertelt Shawn Presser, een onafhankelijke AI-onderzoeker die heeft geholpen bij het verspreiden van het gelekte model. De rand. Presser zegt: de mogelijkheid om LLaMA uit te voeren op een enkele A100 GPU – waar “de meesten van ons toegang toe hebben … of iemand kennen die ons er een tijdje een kan laten gebruiken” – is een “enorme sprong voorwaarts”.

De toekomst van AI-onderzoek: open of gesloten?

Het LLaMA-lek is ook interessant omdat het inspeelt op een voortdurende ideologische strijd in de wijdere wereld van AI: de strijd tussen “gesloten” en “open” systemen.

Het definiëren van dit debat vereist een beetje oversimplificatie, en alle bedrijven, onderzoekers en modellen bevinden zich ergens in een spectrum tussen deze twee polen. Maar in wezen zijn er openers, die pleiten voor meer toegang tot AI-onderzoek en -modellen, en sluiters, die vinden dat deze informatie en technologie voorzichtiger moeten worden uitgedeeld.

De motivatie voor deze kampen is op elkaar afgestemd (beide willen minder slechte AI-dingen en meer goede AI-dingen in de wereld), maar hun aanpak verschilt. Openers beweren dat alleen door AI-systemen op grote schaal te testen, kwetsbaarheden kunnen worden gevonden en beveiligingen kunnen worden ontwikkeld, en dat het niet open source maken van deze technologie de macht zal concentreren in de handen van onverschillige bedrijven. Sluiters antwoorden dat zo’n vrij-voor-iedereen gevaarlijk is, en dat naarmate AI steeds geavanceerder wordt, de inzet van testen in het openbaar steeds hoger wordt. Alleen gesloten instellingen kunnen dergelijke bedreigingen goed onderzoeken en beperken.

Voor wie meer openheid wil, is het LLaMA-lek een zegen. Di Ferrante zegt dat hij over het algemeen denkt dat het hebben van open-sourcesystemen “net goed is, omdat het voorkomt dat we in een monopoliesituatie terechtkomen waarin OpenAI et al. zijn de enige entiteiten die in staat zijn om complexe (AI-modellen) te bedienen.” Presser is het daarmee eens en zegt dat de “ruwe” staat van LLaMA in dit opzicht bijzonder aantrekkelijk is. Het betekent dat onafhankelijke onderzoekers de systemen van Meta kunnen afstemmen op hun eigen doeleinden; het lege frame uitrusten als winkels, kantoren of wat ze maar willen.

Presser stelt zich voor dat toekomstige versies van LLaMA op uw computer kunnen worden gehost en op uw e-mails kunnen worden getraind; in staat om vragen te beantwoorden over uw werkschema’s, ideeën uit het verleden, takenlijsten en meer. Dit is functionaliteit die startups en technologiebedrijven ontwikkelen, maar voor veel AI-onderzoekers is het idee van lokale controle veel aantrekkelijker. (Voor typische gebruikers zullen afwegingen in kosten en privacy voor gebruiksgemak waarschijnlijk de andere kant op gaan.)

“Als we de pogingen van mensen om technologie te verspreiden te goeder trouw niet respecteren, wordt het moeilijker voor mensen om dingen vrij te geven.”

Ongeacht de kracht van open of gesloten modellen van AI-verspreiding, merkt Biderman op dat het lek waarschijnlijk schadelijk is voor het verminderen van het vertrouwen tussen bedrijven als Meta en de academici waarmee ze hun onderzoek delen. “Als we de oprechte pogingen van mensen om technologie te verspreiden op manieren die in overeenstemming zijn met hun wettelijke en ethische verplichtingen niet respecteren, zal dat alleen maar leiden tot een meer vijandige relatie tussen het publiek en onderzoekers en het moeilijker maken voor mensen om dingen vrij te geven. ‘ merkt ze op.