Hvad er DALL-E Mini, billedgeneratoren til kunstig intelligens, der har taget internettet med storm?

Det offentlige domæne DALL-E Mini blev skabt for at gengive resultaterne af OpenAIs tekst-til-billede-model på en meget mindre arkitektur.

Billeder skabt af en kunstig intelligensmodel til at konvertere tekst til et billede kaldet DALL-E Mini er for nylig dukket op på internettet.

På trods af det lignende navn er dette AI-værktøj ikke relateret til DALL-E-modellen udviklet af OpenAI.

Fremtidens mand

I 2021 skabte OpenAI DALL-E, en AI-model, der er i stand til at generere billeder baseret på simple tekstbeskrivelser. Den anden version hedder DALL-E 2 blev introduceret i april, hvilket OpenAI siger kan generere mere realistiske og nøjagtige billeder “ved fire gange opløsningen.”

Mens DALL-E fik opmærksomhed, blev der udviklet et andet projekt for at forsøge at replikere resultaterne af denne AI med en mindre arkitektur.

DALL-E Mini er skabt af maskinlæringsingeniør Boris Daima og er en open source kunstig intelligensmodel inspireret af OpenAI-teknologi, der kan skabe billeder ud fra tekstspor.

Modellen trænes ved at se millioner af billeder fra internettet med matchende billedtekster. Med tiden lærte modellen at tegne et billede fra tekstprompten.

Selvom dette ligner hvordan OpenAI-modellerne blev trænet, er der betydelige forskelle i både kvalitet og skala.

Dima sagde, at den første DALL-E Mini var 27 gange mindre end den originale DALL-E. DALL-E blev også trænet på 250 millioner par billede og tekst, mens DALL-E Mini kun brugte 15 millioner par.

Men i modsætning til OpenAI-modellen er DALL-E Mini tilgængelig for den brede offentlighed. Det førte til en bølge komedie såvel som mærkelig billeder distribueret over netværket.

Bekymringer om bias og stødende billeder

OpenAI sagde, at dens tekst-til-billede-model endnu ikke er åben for offentligheden, da den tester modellens begrænsninger og muligheder for “ansvarlig AI-udvikling og -implementering.”

Sidste måned afslørede Google Research også DALL-E konkurrentkaldet Imagen. Google-teamet bag modellen sagde, at den har en “hidtil uset grad af fotorealisme” og en dyb forståelse af sproget.

Men han tilføjede, at foreløbige analyser viste, at modellen koder for en række “sociale og kulturelle skævheder”, når der skabes billeder af handlinger, begivenheder og objekter.

Der er også rejst bekymring for, at denne form for teknologi kan hjælpe folk med at sprede misinformation online med falske billeder, der ser ægte ud.

Selvom billederne, der genereres af DALL-E Mini, ikke er så realistiske som mere kraftfulde AI-modeller, er der stadig en risiko for at skabe partiske og stødende billeder.

“Selvom mulighederne for billeddannelsesmodeller er imponerende, kan de også forstærke eller forværre sociale fordomme,” siger DALL-E Mini i sin rapport. Krammer ansigtsside.

“Selvom omfanget og karakteren af ​​skævheden i DALL-E Mini-modellen endnu ikke er fuldt dokumenteret, i betragtning af det faktum, at modellen blev trænet på ufiltrerede data fra internettet, kan den generere billeder, der indeholder stereotyper af minoritetsgrupper.

“Der arbejdes løbende med at analysere arten og omfanget af disse begrænsninger og vil blive beskrevet mere detaljeret i DALL-E Mini modelarket.”

10 ting, du skal vide, direkte i din indbakke hver hverdag. Abonnere på Daglig gennemgangfordøjelse af de vigtigste videnskabelige og tekniske nyheder fra Siliciumrepublikken.

Leave a Comment