Et kig på den nye Al Generative Art

Al Generativ kunst er en form for kunst, i de fleste tilfælde visuel, der er baseret på samarbejde mellem et menneske og et autonomt system. Et "autonomt system" er defineret som et Kunstig intelligens software, algoritme eller model, der er i stand til at udføre komplekse operationer uden behov for programmørintervention.

Fra de bizarre sammenstillinger af billeder skabt af Dall-E Mini til NFT marked, kommer billeder genereret af AI-algoritmer i stigende grad ind i den almindelige fantasi. Faktisk er to vigtige projekter om emnet, der fortjener at blive analyseret: midt på rejsen , DALL-E2.

Nyheden har naturligvis også fundet vej til Twitter. Blandt andre kommenterer Charles Hoskinson, der skrev:

AI genererede kunst. Jeg var i stand til at lave dette billede på få minutter. Jeg kan ikke forestille mig, hvor bemærkelsesværdig denne teknologi vil være om 3 år pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) Februar 1, 2023

Al Generativ kunst: tidlige eksperimenter og funktioner

Efter at have forstået, hvad generativ kunst er, er det vigtigt at understrege et af dets grundlæggende principper: tilfældighed. Hvilket er en grundlæggende egenskab ved generativ kunst.

Faktisk, afhængigt af typen af software, er det autonome system i stand til at behandle resultater, der altid er forskellige og unikke, hver gang genereringskommandoen udføres, eller det kan returnere et variabelt antal resultater som svar på brugerinput.

De første eksperimenter i Generativ Kunst går tilbage til 1960'erne med eksperimenterne af Harold Cohen og hans AARON program. Cohen brugte først stand-alone software til at generere abstrakte kunstværker inspireret af Pop Art silketryk. Cohens værker er nu udstillet i Tate Gallery i London.

En anden egenskab ved generativ kunst, men en som er mindre og mindre en prærogativ, er gentagelsen af mønstre eller abstrakte elementer leveret af programmøren og implementeret i softwarekoden.

Derudover har udviklingen af stadig mere komplekse neurale netværk, der opererer på tekst-billede-associering, muliggjort udviklingen af generative modeller, der er i stand til at skabe stadig mere realistiske og nøjagtige billeder. Det bedst kendte eksempel på denne kategori af generativ kunst er plade.

Dall-E er et multimodalt neuralt netværk baseret på GPT-3 dyb læringsmodel fra OpenAI, det samme firma, som også for nylig udviklede sig ChatGPT, chatbotten lanceret i november 2022 og optimeret med "overvåget" og forstærkende læringsteknikker.

Når vi vender tilbage til Dall-E, ser vi, at dette system er i stand til at generere billeder ud fra en tekstbeskrivelse, kaldet en "hurtig," baseret på et datasæt af tekst-billede-par.

Den første version af Dall-E, som blev præsenteret for offentligheden i januar 2021 og forblev privilegiet for et lille antal fagfolk på området, repræsenterede en reel revolution med hensyn til denne type generative model, der overgik innovationerne fra GPT- 3 selv.

Også af betydning er det faktum, at nøjagtigheden af resultaterne behandlet af Dall-E viste sig at være det perfekte grundlag for en anden OpenAI-løsning: CLIP (Kontrastiv sprog-billede fortræning).

Et billedklassificering og -rangering af neuralt netværk trænet på basis af tekst-billede associationer, såsom billedtekster fundet på internettet. Takket være CLIP's indgriben, som reducerer antallet af resultater, der er foreslået til brugeren pr. prompt, til 32, viste det sig, at Dall-E returnerede tilfredsstillende billeder i de fleste tilfælde.

Midjourney: design, menneskelig infrastruktur og kunstig intelligens

Som forventet, midt på rejsen er et vigtigt projekt, der er en del af det nye Al Generative Art-koncept. Helt konkret er Midjourney et uafhængigt forskningslaboratorium, der udforsker nye måder at tænke på og udvider den menneskelige arts fantasifulde kræfter.

At bruge det er enkelt: først skal der oprettes en konto på Discord, en platform, der er vært for forskellige fællesskaber, hvor Midjourney er et af dem. Inden i applikationen er de forskellige chatrooms, hvor man kan deltage aktivt eller ej i diskussioner.

Det er vigtigt at påpege, at for at prøve at bruge kunstig intelligens for første gang, skal man gå til "nybegyndere" kanaler, hvor 25 gratis gengivelser er tilgængelige.

En gengivelse svarer til genereringen af fire forskellige varianter genereret ud fra det samme tekstinput.

Således refererer de 25 gengivelser til 25 behandlingsjob udført af Midjourney-bot. Derfor kræver generering af billedet interaktion med Midjourney-bot'en via en tekstmeddelelse kaldet en "prompt", hvori der vil være nøgleord, der beskriver det billede, brugeren har i tankerne.

Du kan tilføje så mange detaljer som du vil, det vigtige er at opdele søgeordene med et komma. Når gengivelsen er færdig, returnerer computeren fire forskellige billeder baseret på beskrivelserne at vælge imellem.

Derudover kan du, når programmet er færdig med gengivelsen, kommunikere dine præferencer ud fra billederne og, hvis du ønsker det, få fire flere versioner genereret igen.

DALL-E 2: det nye AI-system til kunstværker

Udover Midjourney er DALL-E 2 også det nye AI-system, der kan skabe realistiske billeder og kunstværker ud fra en naturlig sprogbeskrivelse. Ikke nok med det, DALL-E 2 kan også kombinere koncepter, egenskaber og stilarter.

Styrken ved det nye AI-system ligger også i at kunne udvide billeder ud over, hvad der er i det originale lærred, og skabe nye ekspansive kompositioner. Derudover kan den foretage realistiske ændringer af eksisterende billeder fra en naturlig sprogtekst og kan tilføje og fjerne elementer under hensyntagen til skygger, refleksioner og teksturer.

DALL-E 2s muligheder inkluderer også at tage et billede og skabe flere variationer af det inspireret af originalen. DALL-E 2 har lært forholdet mellem billeder og den tekst, der bruges til at beskrive dem.

Det bruger en proces kaldet "diffusion", som starter med et mønster af tilfældige prikker og gradvist ændrer dette mønster mod et billede, når det genkender specifikke aspekter af det billede.

Så efter OpenAI introducerede DALL-E i januar 2021, genererer nu det nyeste system, DALL-E 2, mere realistiske og nøjagtige billeder med fire gange opløsningen.

DALL-E 2 startede som et forskningsprojekt og er nu tilgængelig som en beta-version. Sikkerhedsbegrænsninger, som systemet har udviklet og fortsætter med at forbedre, omfatter: begrænsning af systemets evne til at generere voldelige, hadske eller voksne billeder, og læringsbaseret fasedeployering.

Kilde: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/