Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.

Google Gemini: alle details over het AI-model dat Google hoopt te kunnen overnemen op GPT-4


Het is het begin van een nieuw tijdperk van AI bij Google, zegt CEO Sundar Pichai: het Gemini-tijdperk. Gemini is het nieuwste grote taalmodel van Google, dat Pichai voor het eerst plaagde tijdens de I/O-ontwikkelaarsconferentie in juni en dat nu voor het publiek wordt gelanceerd. Als je Pichai en Google DeepMind CEO Demis Hassabis het hoort beschrijven, is het een enorme sprong voorwaarts in een AI-model dat uiteindelijk vrijwel alle producten van Google zal beïnvloeden. “Een van de krachtige dingen van dit moment,” zegt Pichai, “is dat je aan één onderliggende technologie kunt werken en deze kunt verbeteren, zodat deze onmiddellijk doorstroomt naar onze producten.”

Gemini is meer dan één enkel AI-model. Er is een lichtere versie genaamd Gemini Nano die bedoeld is om zowel native als offline op Android-apparaten te draaien. Er is een krachtigere versie genaamd Gemini Pro die binnenkort veel Google AI-services zal aandrijven en vanaf vandaag de ruggengraat van Bard zal vormen. En er is een nog capabeler model genaamd Gemini Ultra, de krachtigste LLM die Google tot nu toe heeft gemaakt en die vooral lijkt te zijn ontworpen voor datacenters en bedrijfsapplicaties.

Google lanceert het model nu op een aantal manieren: Bard wordt nu aangedreven door Gemini Pro en Pixel 8 Pro-gebruikers krijgen dankzij Gemini Nano een paar nieuwe functies. (Gemini Ultra komt volgend jaar.) Ontwikkelaars en zakelijke klanten hebben vanaf 13 december toegang tot Gemini Pro via Google Genative AI Studio of Vertex AI in Google Cloud. Gemini is voorlopig alleen beschikbaar in het Engels, en andere talen zullen blijkbaar binnenkort beschikbaar zijn. Maar Pichai zegt dat het model uiteindelijk zal worden geïntegreerd in de zoekmachine van Google, zijn advertentieproducten, de Chrome-browser en meer, over de hele wereld. Het is de toekomst van Google, en het is geen moment te vroeg.

In eerste instantie is Gemini verkrijgbaar in drie maten, bedoeld voor drie verschillende doeleinden.
Afbeelding: Google

OpenAI lanceerde ChatGPT een jaar en een week geleden, en het bedrijf en het product werden meteen de grootste dingen in AI. Nu is Google – het bedrijf dat een groot deel van de fundamentele technologie achter de huidige AI-boom heeft gecreëerd, dat zichzelf al bijna tien jaar een ‘AI-first’-organisatie noemt, en dat duidelijk en beschamend overrompeld werd door hoe goed ChatGPT was en hoe snel de technologie van OpenAI de industrie heeft overgenomen – is eindelijk klaar om terug te vechten.

Laten we dus even tot de belangrijke vraag komen, oké? OpenAI’s GPT-4 versus Google’s Gemini: klaar, klaar. Dit is duidelijk al een tijdje in de gedachten van Google. “We hebben een zeer grondige analyse van de systemen naast elkaar en de benchmarking uitgevoerd”, zegt Hassabis. Google heeft 32 gerenommeerde benchmarks uitgevoerd waarin de twee modellen zijn vergeleken, van brede algemene tests zoals de Multi-task Language Understanding-benchmark tot een benchmark die het vermogen van twee modellen om Python-code te genereren vergelijkt. “Ik denk dat we substantieel voorlopen op 30 van de 32” van die benchmarks, zegt Hassabis met een glimlach op zijn gezicht. “Sommige ervan zijn erg smal. Sommigen zijn groter.”

Google zegt dat Gemini de GPT-4 verslaat in 30 van de 32 benchmarks

In die benchmarks (die eigenlijk meestal heel dichtbij liggen) komt het duidelijkste voordeel van Gemini voort uit het vermogen om video en audio te begrijpen en ermee te communiceren. Dit is heel erg by design: multimodaliteit is vanaf het begin onderdeel van het Gemini-plan. Google heeft geen aparte modellen voor beeld en stem getraind, zoals OpenAI DALL-E en Whisper heeft gemaakt; het bouwde vanaf het begin één multisensorisch model. “We zijn altijd geïnteresseerd geweest in zeer algemene systemen”, zegt Hassabis. Hij is vooral geïnteresseerd in de manier waarop je al deze modi kunt combineren: om zoveel mogelijk gegevens te verzamelen uit een willekeurig aantal inputs en zintuigen en vervolgens antwoorden te geven met evenveel variatie.

Op dit moment zijn de meest eenvoudige modellen van Gemini tekst-in en tekst-uit, maar krachtigere modellen zoals Gemini Ultra kunnen werken met afbeeldingen, video en audio. En “het wordt nog algemener dan dat”, zegt Hassabis. “Er zijn nog steeds dingen als actie en aanraking – meer dingen van het robotica-type.” In de loop van de tijd, zegt hij, zal Gemini meer zintuigen krijgen, zich bewuster worden en nauwkeuriger en gegronder worden in het proces. “Deze modellen begrijpen de wereld om hen heen gewoon beter.” Deze modellen hallucineren natuurlijk nog steeds, en ze hebben nog steeds vooroordelen en andere problemen. Maar hoe meer ze weten, zegt Hassabis, hoe beter ze zullen worden.

“Deze modellen begrijpen de wereld om hen heen gewoon beter.”

Benchmarks zijn echter slechts benchmarks, en uiteindelijk zal de echte test van de capaciteiten van Gemini komen van gewone gebruikers die het willen gebruiken om over ideeën te brainstormen, informatie op te zoeken, code te schrijven en nog veel meer. Google lijkt vooral coderen te zien als een killer-app voor Gemini; het maakt gebruik van een nieuw codegenererend systeem genaamd AlphaCode 2 dat naar eigen zeggen beter presteert dan 85 procent van de deelnemers aan de codeerwedstrijd, tegenover 50 procent voor de originele AlphaCode. Maar Pichai zegt dat gebruikers een verbetering zullen merken in vrijwel alles wat het model aanraakt.

Even belangrijk voor Google is dat Gemini blijkbaar een veel efficiënter model is. Het is getraind op de eigen Tensor Processing Units van Google en is zowel sneller als goedkoper in gebruik dan de eerdere modellen van Google, zoals PaLM. Naast het nieuwe model lanceert Google ook een nieuwe versie van zijn TPU-systeem, de TPU v5p, een computersysteem dat is ontworpen voor gebruik in datacentra voor training en het uitvoeren van grootschalige modellen.

Big-deal AI-model; beetje saai logo.
Afbeelding: Google

Uit gesprekken met Pichai en Hassabis is het duidelijk dat zij de lancering van Gemini zowel als het begin van een groter project zien als als een stapsgewijze verandering op zichzelf. Gemini is het model waar Google op heeft gewacht, waar Google al jaren naar toe bouwt, misschien zelfs wel het model dat het gereed had moeten hebben voordat OpenAI en ChatGPT de wereld overnamen.

Google, dat na de lancering van ChatGPT een “code rood” afkondigde en sindsdien wordt gezien als een inhaalslag, lijkt nog steeds vast te houden aan zijn “stoutmoedige en verantwoordelijke” mantra. Hassabis en Pichai zeggen allebei dat ze niet bereid zijn om te snel te handelen, alleen maar om bij te blijven, vooral nu we dichter bij de ultieme AI-droom komen: kunstmatige algemene intelligentie, de term voor een AI die zichzelf verbetert, slimmer is dan mensen, en klaar om de wereld te veranderen. “Als we AGI naderen, zullen de zaken anders worden”, zegt Hassabis. “Het is een soort actieve technologie, dus ik denk dat we daar voorzichtig mee moeten omgaan. Voorzichtig, maar optimistisch.”

Google zegt dat het hard heeft gewerkt om de veiligheid en verantwoordelijkheid van Gemini te garanderen, zowel door middel van interne als externe tests en red-teaming. Pichai wijst erop dat het garanderen van gegevensbeveiliging en -betrouwbaarheid vooral belangrijk is voor enterprise-first-producten, waar de meeste generatieve AI zijn geld verdient. Maar Hassabis erkent dat een van de risico’s van het lanceren van een geavanceerd AI-systeem is dat het problemen en aanvalsvectoren zal hebben die niemand had kunnen voorspellen. “Daarom moet je dingen loslaten”, zegt hij, “om te zien en te leren.” Google neemt de Ultra-release bijzonder langzaam op; Hassabis vergelijkt het met een gecontroleerde bèta, met een “veiligere experimenteerzone” voor het meest capabele en ongeremde model van Google. Kortom, als er binnen Gemini een alternatieve persoonlijkheid is die het huwelijk verpest, probeert Google deze te vinden voordat jij dat doet.

Pichai en andere leidinggevenden van Google zijn al jaren poëtisch over het potentieel van AI. Pichai zelf heeft meer dan eens gezegd dat AI meer transformatief voor de mensheid zal zijn dan vuur of elektriciteit. In deze eerste generatie zal het Gemini-model de wereld misschien niet veranderen. In het beste geval zou het Google kunnen helpen OpenAI in te halen in de race om geweldige generatieve AI te bouwen. (In het ergste geval blijft Bard saai en middelmatig, en blijft ChatGPT winnen.) Maar Pichai, Hassabis en alle anderen bij Google lijken te denken dat dit het begin is van iets werkelijk groots. Het internet heeft van Google een technologiegigant gemaakt; Tweelingen zouden nog groter kunnen zijn.

Gn En Head