Kan I huske dengang Siri først så dagens lys, og vi alle var begejstrede over, hvor smart vores nye taleassistent var? Meget vand er løbet under broen siden da, og i nu bliver første sten lagt til en ny generation af AI assistenter, der kan se, høre og tale.
OpenAI har annonceret, at de er i gang med at udrulle en version, der byder på nye tale- og billedfunktioner i deres AI-assistent ChatGPT. Tanken er, at du nu kan snakke med din assistent med din stemme og vise den, hvad du snakker om – som om du talte med en nær ven.
En af de nye features inkluderer evnen til at tage og genkende indholdet af billeder. Det kunne f.eks. være et billede af et vartegn på din rejse, og få en dybdegående samtale om det. Det er alt fra historie, kultur og arkitektur. Helt sikkert noget der ville give din ferie et ekstra pift!
Det stopper ikke der. Tag et billede af indholdet i dit køleskab, og ChatGPT kan forslå, hvad du skal lave til din middag.
“…men hvad med en opskrift?”
Det er kun et opfølgnings-spørgsmål væk.
Vi har været der før. Snakker man med Siri, Alexa eller Google Home? Selvfølgelig gør vi det, men ingen af dem kan vi rigtig samtale med. De forstår kun kommandoer. Med ChatGPT er det en rigtig samtale, ikke en række af kommandoer. Det er bare dig, en kop kaffe og en interessant snak med din AI assistent. Venter vi spændt? Selvfølgelig gør vi det.
Og lad os ikke glemme muligheden for at få læst en godnathistorie højt, fortalt med den perfekte blanding af drama og spænding, der nok kan få dine børn til at gøre store øjne.
ChatGPT kan ikke kun føre en samtale, men den kan også analysere billeder. Du skal bare tage et billede, og så kan du have en dybdegående samtale om indholdet. Ikke kun det, men du kan også fokusere på en bestemt del af billedet, og tale specifikt om det.
Dette er drevet af multimodale GPT-3.5 og GPT-4-modeller, som benytter deres sprogbehandlingsfærdigheder til at analysere en bred vifte af billeder, lige fra skærmbilleder og dokumenter til selfies.
Nu tænker du sikkert: “Lyder godt, men hvad er bagsiden?”. Det er et godt spørgsmål, for der er altid en.
“Når noget lyder for godt til at være sandt, er det det for det meste.”, sagde min bedstemor altid. Og ofte havde hun jo ret.
OpenAI er helt klar over, at denne teknologi, som kan lave realistiske syntetiske stemmer ud fra blot et par sekunders tale, potentielt kan blive misbrugt. Forestil dig ondsindede aktører, der udgiver sig for at være offentlige personer eller begår svindel? Det kunne være et potentielt problem.
Det er derfor, OpenAI bruger denne teknologi specifikt til stemmechat og arbejder sammen med stemmeskuespillere i udviklingen.
Over de kommende uger kan Plus- og Enterprise-brugere forvente at få muligheden for at teste de nye tale- og billedfunktioner. Efterfølgende vil det blive rullet ud til andre brugergrupper, herunder udviklere. Så hold øje med din indbakke, for der kan snart dumppe en spændende invitation ind.
Der er ingen tvivl om, at dette er et spændende skridt fremad for OpenAI, og vi glæder os til at se, hvad det byder på. Vil chatbots i fremtiden erstatte alle vores interaktioner? Sandsynligtvis ikke. Men hvem ville ikke elske lidt ekstra hjælp med middagsplanerne?
Afsluttende guldkorn
Moralen af historien er, at teknologi er vores ven (indtil videre), og at den konstant udvikler sig. Inden længe vil vi måske have dybdegående samtaler med vores køleskabe om, hvad de synes, vi skal spise til aftensmad. Hvem ved? I hvert fald én ting er sikkert – Jeg er klar til at tage imod min nye assistent.