Nieuws en trends

Europese AI in opmars: OpenGPT-X publiceert "Teuken-7B"

27-11-2024

Vertaling: machinaal vertaald

OpenGPT-X heeft "Teuken-7B" gepresenteerd, een taalmodel dat is getraind in 24 officiële EU-talen. Met zeven miljard parameters en open source toegang is het gericht op het bevorderen van Europees AI-onderzoek en het verbeteren van gegevensbescherming.

Je hebt vast wel eens gehoord van ChatGPT, Gemini, Claude en co. Deze grote taalmodellen zorgen momenteel voor een revolutie in de manier waarop we met computers omgaan. De meeste van deze AI taalmodellen komen uit de VS. Het onderzoeksproject OpenGPT-X heeft zich tot taak gesteld om een Europees en vooral gegevensbeschermingsvriendelijker alternatief te ontwikkelen.

OpenGPT-X publiceerde onlangs een nieuw open source AI-taalmodel genaamd "Teuken-7B", zoals het Fraunhofer Institute for Intelligent Analysis and Information Systems IAIS aankondigde. Het is nu beschikbaar op Hugging Face voor download.

Training in 24 officiële EU-talen

Dit model is speciaal omdat het vanaf de basis is getraind met de 24 officiële talen van de Europese Unie. Dit betekent dat "Teuken-7B" bijzonder goed overweg kan met Europese talen. Er is zelfs aandacht besteed aan de representatie van niet-Engelse talen om het te onderscheiden van de modellen die in de VS en China zijn ontwikkeld.

"Teuken-7B" heeft zeven miljard parameters. Met dit aantal parameters kan het model complexe teksten begrijpen en genereren. Dit maakt het bijzonder nuttig voor tekstverwerking, vertaling en het beantwoorden van vragen. De ontwikkelaars van OpenGPT-X hebben benadrukt dat "Teuken-7B" specifiek is ontworpen om te worden gebruikt in verschillende gebieden van AI-onderzoek en -toepassing. Het taalmodel is getraind met behulp van de "Juwels" supercomputer in het Jülich Onderzoekscentrum in Duitsland.

Een kenmerk van "Teuken-7B" is het open source karakter. Dit betekent dat ontwikkelaars en onderzoekers wereldwijd vrije toegang hebben tot het model en het kunnen aanpassen en verder ontwikkelen volgens hun behoeften. OpenGPT-X hoopt dat dit de innovatie in AI-onderzoek verder zal stimuleren. Het open source model maakt het ook mogelijk om het model op een ethische en verantwoorde manier te gebruiken en verder te ontwikkelen. Het onderzoeksteam heeft al aangekondigd dat het zal blijven werken aan het verbeteren en uitbreiden van "Teuken-7B".

Wie zit er achter OpenGPT-X?

Het OpenGPT-X onderzoeks- en ontwikkelingsproject is begin 2022 opgericht. Het doel is om een AI-taalmodel te ontwikkelen dat gebaseerd is op Europese waarden en haar taalkundige diversiteit. Het wordt geleid door de twee Duitse Fraunhofer Instituten voor Intelligente Analyse en Informatiesystemen (IAIS) en voor Geïntegreerde Schakelingen (IIS). De Technische Universiteit van Dresden, het Jülich Onderzoekscentrum en bedrijven als Aleph Alpha en Ionos zijn er ook bij betrokken.

Mistral AI: Nog een Europese pionier op het gebied van AI

Het is vermeldenswaard dat "Teuken-7B" niet het enige grote AI-taalmodel uit Europa is. Het Franse softwarebedrijf Mistral AI heeft verschillende eigen open source taalmodellen ontwikkeld. Deze omvatten "Mistral 7B", "Mistral 8x7B" en "Mistral 8x22B". Het bedrijf werd in april 2023 opgericht door onderzoekers Arthur Mensch, Timothée Lacroix en Guillaume Lample, die eerder werkten bij Meta en Google DeepMind.

Omslagfoto: OpenGPT-X / LinkedIn

83 mensen vinden dit artikel leuk