đ€ŻâĄïžAI failar att klona det kĂ€nda, men nailar att Ă„terskapa det vi aldrig sett.
AI som objektsklonare Àr ett tankefel. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, avslöjar hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
-Midjourney slÀpper funktion för att ÄteranvÀnda skapade karaktÀrer
Midjourney har lanserat en funktion som möjliggör för anvÀndare att AI-generera karaktÀrer som ser likadana ut varje gÄng (Character consistency). Detta har lÀnge varit en utmaning inom AI-bildgenerering pÄ grund av att diffusionsmodeller genererar nytt innehÄll för varje inmatad prompt, vilket gör det svÄrt att upprÀtthÄlla konsekvens för specifika karaktÀrsdrag över flera bilder.
Character consistency möjliggör ett historieberĂ€ttande med en Ă„terkommande karaktĂ€r vilket gör att Midjourneys 16 miljoner anvĂ€ndare nu kan skapa bildserier som berĂ€ttar en historia med samma huvudkaraktĂ€r. Dessutom har de dominerande genererarna för video (RunwayML, PikaLabs) en funktion dĂ€r du laddar upp en bild som startbild. Consistent characters förenklar för AI-filmskapare att berĂ€tta historier dĂ€r det finns en huvudperson som ser likadan ut filmen igenom.Â
(Funktionen Ă€r slĂ€ppt till alla men det kĂ€nns att det Ă€r en alpha-version. Ăven om det Ă€r ett steg i rĂ€tt riktning sĂ„ fungerar den Ă€nnu inte tillrĂ€ckligt bra för att vara pĂ„litlig. KaraktĂ€rerna blir lika men inte riktigt samma, det Ă€r passable men kvaliteten pĂ„ bilderna blir ocksĂ„ sĂ€mre, sĂ„ intrycket blir ibland att ansiktena Ă€r gjorda med en Ă€ldre generationer av Midjourney.)
Detta förÀndrar ju allt
Midjourneys nyhet fÄr mig att reflektera över digitalisering och kloner. Men innan vi djupdyker i det sÄ tÀnkte jag introducera er som inte jobbar med AI-bilder till varför samma ansikte i flera bilder Àr en sÄ stor nyhet.
De flesta som inte anvĂ€nt AI-bildgenerering i arbetet tror att det Ă€r lĂ€tt att fĂ„ till vad som helst nu nĂ€r AI finns. Men i sjĂ€lva verket Ă€r det lika svĂ„rt att fĂ„ en bild som förestĂ€ller exakt det kunden har i huvudet som att valla katter. UtifrĂ„n ett anvĂ€ndarperspektiv Ă€r diffusionsmodeller som slot machines.Vi lĂ€gger in en prompt och drar i spaken för att se om det blir vinst. AI-bildgenerering med precision krĂ€ver mycket tĂ„lamod, villighet att experimentera och massor av timmar med felaktiga försök.Â
I sjÀlva verket Àr diffusionsmodeller vÀldigt pÄlitliga mönsterÄterskapande statistiska modeller. De har studerat hur en bild ser ut nÀr den blir mer och mer diffus (nÀr det adderas slumpmÀssiga prickar) för att bli helt enfÀrgad. Men det konstiga Àr att nÀr de spelar upp samma mönster baklÀnges sÄ blir det en bild. SÄ varje prompt blir kopplad till ett mönster i hur prickar brukar se ut baklÀnges nÀr de lÀggs pÄ en bild som Àr taggad med ord.
Om man förenklar. Bilder pÄ en katt hade ett mönster i hur den sÄg ut nÀr prickar lades pÄ som vi kallar A. Bilder pÄ en hatt hade ett mönster för hur den sÄg ut nÀr prickar lades pÄ som vi kallar B. SÄ promptar vi för en katt i en hatt sÄ lÀgger modellen ihop hur mönstret för A och B skulle kunna bli tillsammans. Men lÄt oss kalla det för vad det Àr, hÀxeri!
Jag har sjÀlv vÀntat lÀnge pÄ att fÄ ett bÀttre verktyg för character consistency och jag Àr inte ensam. PÄ Youtube finns mÀngder av tips och filmer om workarounds för att fÄ till bÀttre character consistency. En av de vanligaste frÄgorna i grupper om Midjourney Àr hur man kan fÄ kontroll över att en bild ska ha samma person som en annan bild. Det har till och med lanserats flera bildgenereringstjÀnster med enda sÀljargument att de Àr bÀttre pÄ character consistency. Det Àr förmodligen den förlösande funktionen för hundratusentals AI-filmskapare att faktiskt kunna skapa en AI-film som bygger pÄ Àkta storytelling istÀllet för bara surrealistiska musikvideoaktiga konstprojekt. Den enkla möjligheten att enkelt kunna klona ett utseende frÄn bild till bild Àr en grundlÀggande funktion för ökad precision och kontroll för alla bildskapare.
Det finns tvĂ„ angreppssĂ€tt för att klona nĂ„got. Antingen sĂ„ bygger vi ett objekt, till exempel en stol, som Ă€r sĂ„ lik förlagan som möjligt. Vi har en monteringsanvisning som beskriver material och visar var olika delar ska sitta. SĂ€tter vi ihop dem enligt monteringsanvisningen sĂ„ har vi klonat stolen. Eller sĂ„ bygger vi objektsskaparen, den maskin som producerar stolen. Om vi lyckas bygga stoltillverkningsmaskinen exakt kommer det inte vara nĂ„gon skillnad. BĂ„da angreppssĂ€tten kommer kunna leverera en perfekt klon av stolen.Â
Det nya med digitaliseringen var att det gick att skapa en perfekt klon. All information om den digitala filens sammansÀttning Àr kÀnd och det gick dÀrför plötsligt att göra en perfekt objektsklon. Musik.mp3 och kopian Musik_copy.mp3 var identiska. Produktionskostnaden för att producera en till kopia var dessutom nÀra noll, vilket gjorde att alla branscher som hade kloningsbara objekt skakade. För första gÄngen kunde vi ha kakan och Àta den. Digitaliseringen fokuserade pÄ kloning av sjÀlva objektet.
Generativ AI möjliggör kloning av fler typer av objekt Àn datafiler, sÄsom utseende, röster och visuella manér. DÀrför tÀnker vi att det precis som under digitalseringen kommer bli perfekta kopior som radikalt förÀndrar branscher med de nya kloningsbara objekten. Men det Àr möjligt att vi begÄr ett tankefel hÀr. För generativ AI kan inte göra perfekta kloner. Grejen med generativ AI Àr att den inte följer exakta monteringsanvisningar. IstÀllet möjliggör generativ AI att du utan exakta monteringsanvisningar kan fÄ hyfsat lika objekt varje gÄng. Det Àr objektskapare, stoltillverkningsmaskinen som vi bygger för att vi vet att den kan generera stolar men vi har inte full kontroll över resultatet. IstÀllet för att tÀnka utifrÄn digitaliseringsseran sÄ bör vi jÀmföra med tidig industrialism.
Industrialismen gav oss verktygen för massproduktion av produkter med hyfsat jÀmn produktionskvalitet. Generativ AI Àr vÄr tids nya verktyg för produktion av tjÀnster. Generativ AI kan inte göra perfekta kloner av tjÀnster men generativ AI kan reproducera funktionen av vissa tjÀnster tillrÀckligt bra för att vara bÄde komplement till tidigare produktionsmetoder och för att komma pÄ helt nya tjÀnster.
MÄnga tÀnker att det nya endast Àr att vi nu har teknik för att perfekt klona fler sorters objekt, men det Àr mer Àn sÄ. SÄ tÀnk istÀllet att det nya med generativ AI Àr att vi inte klonar skapelser, vi klonar skapare, och detta förÀndrar ju allt!
Vad kan du göra idag?
FörstÄ
Vi strÀvar efter att den nya tekniken ska kunna producera nÄgot vi specificerat exakt. Men det innovativa med generativ AI Àr istÀllet att den möjliggör att producera nÄgot vi inte kan specificera innan vi ser det. Till exempel: Den senaste i raden av AI-agenter som kan koda heter Devin. Det Àr den första som marknadsförs inte som co-pilot för kodning utan som en autonom mjukvaruingenjör. Du specar nÄgot du vill ha kodat och sÄ har den sin egen utvecklingsmiljö för kodning och egen webblÀsare för research. Kika gÀrna pÄ deras demo.
Planera
En uppenbar fördel med generativ AI Ă€r att anvĂ€nda den som utforskare av en mĂ€ngd olika möjligheter. IstĂ€llet för att bara fokusera pĂ„ att anvĂ€nda generativ AI för att producera â planera in hur tekniken kan fungera för att vidga antalet alternativ som ni hinner utforska. Det gĂ„r att göra skarp produktion med hjĂ€lp av AI, men för att fĂ„ verktyget att fĂ„ till den sista finishen krĂ€vs mycket resurser. Planera för ett produktionsflöde dĂ€r AI mer och mer automatiskt kan ta fram underlag för olika vĂ€gval, snarare Ă€n att planera för att generativ AI ska vara den slutliga produktionsmaskinen (det finns bĂ€ttre AI/ML modeller för det).Â
Gör
Kan du sĂ€ga nĂ„got som ChatGPT 4 klarar av som inte gratisversionen kan? Det Ă€r sĂ„ otroligt mĂ„nga som uttalar sig om AI som inte utforskat skillnaden mellan gratisversionernas och betalversionernas förmĂ„ga. Det Ă€r synd för ofta nĂ€r det kommer nyheter dĂ€r mĂ€nniskor uttalar sig om AI:s oförmĂ„ga sĂ„ baseras dessa pĂ„ en skev bild av AI:s kapacitet. SĂ„ veckans gör Ă€r att du tar reda pĂ„ om du sjĂ€lv kan se vad betalversionen av nĂ„gon av de olika AI-chattbottarna kan som inte gratisversionen kan.Â
LĂ€nkar
LÀs om Midjourneys nya feature hÀr (eller gÄ direkt till kÀllan som Àr Midjourneys Discord-kanal)
https://venturebeat.com/ai/midjourney-debuts-feature-for-generating-consistent-characters-across-multiple-gen-ai-images/
Mjukvaruagenten Devin, sign up
https://www.cognition-labs.com/blog
Vill du fÄ Ànnu mer perspektiv pÄ hur kloning och AI hÀnger ihop sÄ förklarar Scott Aaronson (som just nu jobbar extra med alignment pÄ OpenAI) hur vi mÀnniskor kanske eller kanske inte Àr kloningsbara.
Sedan sist vi hördes
Denna vecka har jag testat haiper.ai som Àr en ny video-genereringstjÀnst. Det blir jÀttefina resultat frÄn deras bÀsta modell, men den genererar bara 2 sekunder i taget Àn sÄ lÀnge. Gratis just nu men lÀr ju kosta pengar sÄ smÄningom som brukligt Àr.
Anthropic som har Claude har slÀppt en promptoptimerare. Den Àr i ett Google collab, men för dig som Àr intresserad av hur bolagen sjÀlva tycker att promptar ska skrivas för att fÄ deras AI att vara bra sÄ Àr det vÀl vÀrt en titt. https://colab.research.google.com/drive/1SoAajN8CBYTl79VyTwxtxncfCWlHlyy9#scrollTo=NTOiFKNxqoq2
HÀr Àr instruktioner för hur du anvÀnder det
https://twitter.com/moritzkremb/status/1766850258477482333
Ăr du en insiktsdelare?
KÀnner du nÄgon som Àr intresserad av att klona sin kunskap och förpacka den som en tjÀnst? Eller kanske nÄgon som Àr intresserad av att börja anvÀnda generativ AI för att berÀtta historier? Vem tÀnkte du pÄ? Skicka vidare!
SjĂ€lv vill jag rekommendera Fredrik Wass nyhetsbrev, dĂ€r han nu senast pĂ„pekade hur mĂ„nga som fotar slides med siffror som att de vore kĂ€llgranskade sanningar nĂ€r de ibland bara Ă€r lite lösa estimeringar.Â
Denna vecka blev jag sjÀlv jag ocksÄ inspirerad av att mingla med alla pÄ Berghs Unconference. Tack sÄ hemskt mycket till alla som kom och lyssnade pÄ min session (tror det var över 300 pers). De som var dÀr verkade gilla min session för det har strömmat in nya prenumeranter! Nu Àr ni över 1000 personer som prenumererar pÄ det hÀr nyhetsbrevet. (Det kÀnns vÀldigt stort för mig!)
InspirationsförelÀsning
Torsdag 11/4 kl 12:00-12:45 kör jag en inspirationsförelÀsning för betalande prenumeranter. Svara gÀrna ja pÄ den inbjudan jag skickat ut om du vill vara med. Jag kommer köra en del av det jag presenterade pÄ Berghs, men jag kommer att addera nÄgot mer ocksÄ eftersom det blir en lite lÀngre slot Àn pÄ Berghs.
Jag fÄr ibland frÄgan om vad jag egentligen gör och om man kan anlita mig. Just nu har jag uppdrag i ledningsgrupper som vill ha stöd nÀr de utreder AI-frÄgor. Jag gör ocksÄ förelÀsningar och workshops för styrelser dÀr syftet Àr att förÀndra verksamheten. Eftersom jag har bÄde kreativ och strategisk bakgrund sÄ har mina uppdrag varierat frÄn att ta fram beslutsunderlag till att skapa koncept för nya satsningar. Dessutom har jag jobbat mycket med varumÀrkesutveckling och konsumentbeteende. Mina kunder Àr organisationer som pÄ riktigt vill genomföra en större förÀndring och behöver bÄde inspiration och pragmatiska idéer pÄ hur de ska ta nÀsta steg. I detta spÀnnande teknikskifte skulle jag gÀrna bidra med mina kunskaper i en advisory board eller styrelseroll. Hör gÀrna av dig om nÄgot av detta kan vara till nytta i din organisation!
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):