Im globalen Wettbewerb um mächtige Systeme mit künstlicher Intelligenz (KI) sendet Europa ein weiteres Projekt mit Openeurollm in das Rennen. Dahinter befindet sich ein Konsortium von 20 europäischen Forschungsinstitutionen, Unternehmen und Rechenzentren mit hoher Leistung (EuroHPC). Ziel ist es, eine Familie leistungsstarker, mehrsprachiger großer Sprachmodelle (LLMs) für kommerzielle, industrielle und öffentliche Dienstleistungen auf Open Source -Basis aufzubauen.
Werbung
Das Konsortium ist zuversichtlich: Der geplante transparente und mit EU-Recht konforme Open-Source-Modelle „wird den Zugang zu hochwertigen KI-Technologien demokratisieren und die Wettbewerbsfähigkeit europäischer Unternehmen auf einem globalen Markt stärken“. OpenEurollm zahlt sich der EU -Kommission an, „Wettbewerbsfähigkeit und digitale Souveränität Europas zu verbessern“. Das Projekt ist „ein hervorragendes Beispiel für die Art der Technologieinfrastruktur, die erforderlich ist, um die Hürden für die Entwicklung und Verfeinerung europäischer KI -Produkte zu reduzieren“.
Der internationale Wettbewerb ist natürlich auch bei Open Source LLMs großartig. Die Größen in diesem Markt sind Metas Lama, Google Gemma und zuletzt billig das Hyped -Modell R1 des chinesischen Newcomer Deepseek. OpenEurollm möchte jedoch mit der Tatsache bewerten, dass nicht nur der Code der Modelle, die zugehörige Software und die Bewertung vollständig für alle offen sind, sondern auch für die Trainingsdaten. Dies ist bei Wettbewerbern aus den USA und China nicht der Fall. OpeneUrollm sollte nicht nur leichter in den Ergebnissen zu erklären sein, sondern auch besser „an die spezifischen Anforderungen der Industrie und des öffentlichen Sektors angepasst“.
Training in 35 Sprachen
Die neuen Modelle werden in 35 Sprachen direkt im Plan geschult. Dies sind nicht nur die Sprachen aller EU -Mitgliedstaaten und Kandidaten, sondern auch aus Drittländern wie Arabisch, Chinesisch oder Hindi. Auf diese Weise sollte sich die sprachliche und kulturelle Vielfalt in der KI -Basistechnologie widerspiegeln, die auch in konkrete Anwendungen einbezogen werden kann.
Zu den Kampagnen aus Deutschland gehören das Ellis Institute und das University AI Center aus Tübingen, das Jüloich Research Center, das Fraunhofer Institute for Intelligent Analysis and Information Systems (IIIS), Alpha Alpha von Heidelberg und das Start-up-Start-up Ellamind von Bremen. Der tschechische Computer-Linguist Jan Hajič und Peter Sarlin vom finnischen Ki-Labor Silo AI, der jetzt zum US-Chip-Hersteller AMD gehört, haben die Projektkoordination übernommen.
Laut der EU -Kommission hat OpenEurolm derzeit einen Gesamtbudget von 37,4 Millionen Euro, 20,6 Millionen des Finanzierungsprogramms Digital Europe. In Ausschreibungsdokumenten aus dem Vorjahr wurden über mehrere Jahre 54 Millionen Euro erwähnt.
20,6 Millionen gegenüber 500 Milliarden
Die Brüsseler Regierungsinstitution hat das Projekt bereits am Montag mit dem Siegel der Plattform „Strategic Technologies for Europe“ (Schritt) ausgezeichnet. Dies ist eine Initiative für eine höhere Wettbewerbsfähigkeit der europäischen Industrie durch den Einsatz kritischer Technologien wie KI. Die Teilnehmer erhalten einen privilegierten Zugriff auf Supercomputing -Zentren aus Schritt, die die europäischen Werte von Transparenz und Offenheit berücksichtigen.
Im Vergleich zu den 500 Milliarden US-Dollar, die Chatgpt-Bludler Openai und Softbank innerhalb von vier Jahren als Teil des US-amerikanischen Projekts Stargate in AI-Rechenzentren platzieren möchten, ist das Openeurollm-Budget ein Geräusch. Es gibt jedoch mehr Zweifel, dass die beteiligten Parteien nicht über das Geld verfügen und dass so hohe Fonds möglicherweise nicht für die Entwicklung leistungsstarker LLMs erforderlich sind. Zumindest das Training von Deekseek -Modellen hätte deutlich billiger sein müssen.
Openeurollm hat eine enge Zusammenarbeit mit Open Source- und Open Science Communities wie Laion, Open-Sci und OpenML sowie anderen Experten in diesem Bereich angekündigt. Letztere sind bereits Teil eines Beratungsausschusses für strategische Partnerschaften. Das European Research Project OpenGPT-X, das im November den LLM Teuken-7b veröffentlicht hat, erwähnt OpenEurollm nicht direkt. Dies wurde mit den 24 Amtssprachen der EU ausgebildet. Es soll auch die Anforderungen europäischer Werte, Datenschutzstandards und sprachlicher Vielfalt erfüllen. Die Teilnehmerstrukturen beider Projekte überschneiden sich jedoch erheblich, so dass eine enge Zusammenarbeit kaum vermeidbar erscheint.
(OLB)