• English

Nu blir de store sprogmodeller bedre

05. feb, 2024

Storsprogsmodeller i centrum af AI-forskningen

Store sprogsmodeller (Large Language Models, LLMs) er i fokus inden for AI-verdenen. De kan håndtere stor mængder og har stor kapacitet i forhold til tekstresumé, besvarelse af spørgsmål, kodning, indholdsoprettelse osv. Men der er udfordringer med træningsdatakvalitet og beregningsomkostninger.

Wrap som løsning

WRAP, web rephrase augmented pre-training,  er en ny metode udviklet af et forskerhold fra Apple og Carnegie Mellon University, som bruger en eksisterende, costum trænet LLM til at omformulere online sider i forskellige stilarter. Dette bidrager til forbedring af LLMs pre-training med både ægte og kunstigt omformuleret data. Altså at bruge eksisterende data og skabe nyt data på baggrund heraf, som er det man kalder syntetisk data.

Fordele ved wrap genererede syntetiske data

  • Syntetisk data reflekterer diversiteten i sprogbrug og forbereder modellen på en bred vifte af virkelige hændelser.
  • Kvaliteten af syntetisk data er ofte højere end den rå, webskrabet data og derved orbedrer træningsgrundlaget for sprogmodeller.

Konklusion og fremskridt indenfor llm pre-training

WRAP repræsenterer et betydeligt fremskridt indenfor pre-training af LLMs ved at bruge forskelligartet syntetisk data af høj kvalitet for at fremskynde træning og forbedre LLMs generelle præstation. Den præsenterer en banebrydende vej fremover i lyset af den overflod af lavkvalitets web data og ressource-intensive natur af klassiske LLM træningsmetoder.


Læs videre om...

15. mar, 2024

Mød Fremtidens Arbejdsstyrke: Autonome humanoide robotter

Figure 01, første kommercielt levedygtige autonome humanoide robot, revolutionerer arbejdsstyrken med dens menneskelige form og avanceret AI.
Læs mere
05. okt, 2023

AI og Immunoterapi: Revolutionen i Celleomprogrammering er Her

AI fremmer en revolution i celleomprogrammering og hvirvler nye vinde i forskning inden for immunoterapi. Gentag med mig – kausale...
Læs mere
04. okt, 2023

Mere Om GPT-4V: Kunstig Intelligens træder ind i en ny æra med billedanalyse

En ny æra inden for Kunstig Intelligens udvikling ruller ind over os med GPT-4V. Om GPT-4V GPT-4 med visionsfunktionen, bedre...
Læs mere
1 2 3 11