đ€ŻâĄïž Alla kan photoshoppa âlike a proâ nu!
Bildpromptning behövs inte lÀngre. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, berÀttar om hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
- OpenAI slÀpper lÀttanvÀnd bildgenererare till folket
OpenAI tar upp kampen med Google om vem som ska bli Photoshops ersÀttare.
I tisdagskvÀll slÀppte OpenAI sin nya bildgenererare i ChatGPT 4o och Sora. I livestreamen var vd Sam Altman med och presenterade, vilket brukar markera att det Àr en viktig lansering för bolaget.
Google lanserade en bildgenererare pÄ sin beta-plattform för AI för ett par veckor sedan som förstod kontext sÄ vÀl att det gick att jobba med en bild i flera steg genom att chatta. Tidigare har det varit svÄrt att förÀndra bara delar av en genererad bild i efterhand. Men med den hÀr kan du dessutom ladda upp egna bilder och be Googles Gemini förÀndra detaljer, vilket gjorde att press har jÀmfört funktionen som ett alternativ till Photoshop snarare Àn till andra bildgenerere.
Men nu Àr OpenAI först med att fÄ in den hÀr typen av funktionalitet dÀr anvÀndare faktiskt kommer hitta den. Enligt OpenAI sjÀlva gör den nya bildgenereraren att bildfunktionen gÄr frÄn att vara en kreativt gimmick till ett anvÀndbart arbetsverktyg.
Alla med Pro-abonnemang har redan fÄtt tillgÄng till den nya bildgenereringen, de flesta med Plus har fÄtt den och Àven de som inte betalar alls kommer fÄ funktionen mycket snart.
Detta förÀndrar ju allt
Naturligt sprÄk fortsÀtter slÄ igenom som sÀtt att fÄ AI att utföra uppgifter. IstÀllet för att vi ska lÀra oss hur verktygen fungerar sÄ lÀr sig verktygen hur de ska fixa det vi ber dem om. Det gÀller inte bara bildgenerering, men denna vecka kör vi nÄgra handfasta tips pÄ sÄdant som plötsligt blir möjligt för vem som helst att skapa utan att gÄ promptkurser eller Photoshopkurser.
Förutom att bara generera bilder istÀllet för att leta efter bildbyrÄbilder sÄ tror jag att det mest spÀnnande anvÀndningsomrÄdet kommer bli att enkelt producera realistiska produktbilder.
Byta ut text pÄ befintliga produkter och sÀtta dem i en miljö krÀver inga sÀrskilda prompting-skills. Bara att ladda upp en produktbild och beskriva hur du vill att den ska placeras.
SÀtta ihop tvÄ existerande bilder Àr heller inga problem, sÄ lÀnge du inte vill ha ett specifikt ansikte (det hade ju gÄtt att fixa med nÄgon FaceSwap-AI men det Àr ju bra att ni ser hur det blir).
Ibland vÀgrar ChatGPT. Om du fÄr problem med att sÀtta ihop bilder sÄ rekommenderar jag att börja i en helt ny ChatGPT-session. Genom att börja med att ladda upp de tvÄ bilderna du vill kombinera har jag fÄtt det resultat jag ville ha snabbare Àn nÀr jag har försökt fixa med fler versioner i samma chat-session.
Ănda sedan jag började testa bildgenererare sĂ„ har jag stresstestat dem genom att skapa en kopia av âFor the better, rightâ-memet i en enda prompt. TyvĂ€rr Ă€r OpenAI:s modell fortfarande för censurerad för att göra kopior av upphovsrĂ€ttsskyddade filmscener. OpenAI har lovat att de ska vara mindre censurerande Ă€n de har varit med Sora, men jag mĂ€rker Ă€ndĂ„ att rĂ€tt mĂ„nga komplicerade idĂ©er jag har censureras.
Det gÄr dock att jobba runt det lite genom att Àndra manér och figurer lite fram och tillbaka, och till slut klarar jag att fÄ fram en fyrpanel-serie i en enda promptning med de exakta instruktionerna för varje ruta. Jag lÀr mig dÄ att det gÄr bra att frÄga ChatGPT vad hen skulle tillÄta göra som liknar det jag vill, och sÀger okej till det. Sedan laddar jag upp den bilden och ber ChatGPT förÀndra den igen. Men egentligen var ju testet med memet till för att se hur komplexa instruktioner som funktionen klarar av. HÀr Àr nÄgra olika varianter.
Jag konstaterar att AI-modeller nu kan klara av mycket komplexa instruktioner för bilder utan att blanda ihop dem. (BÄde OpenAIs och Googles visar det) Men det finns fortfarande begrÀnsningar. Stora detaljerade informationsmÀngder blir ibland för mycket för att fÄ snygga bilder.
En person blir jÀttefin, tvÄ funkar. Sedan börja ChatGPT krÄngla, jag fÄr böna och be för fler personer, och nÀr den slÀpper igenom mina bestÀllningar sÄ ser vi att kvalitén försÀmras avsevÀrt.
Det Àr klart att det krÀver mer processor att göra fler ansikten detaljerade Àn ett. DÀrför blir inte alla ansikten lika fina om du har mÄnga. Vi har sett liknande beteende i andra modeller (som Midjourney) och det Àr inte nödvÀndigtvis en modellbegrÀnsning utan en berÀkningskraftsbegrÀnsning. Du fÄr lika mycket datorkraft per bild om du bestÀller ett portrÀtt med en person eller en gruppbild. Men I de andra bildgenereringsprogrammen sÄ kan du fuska och generera delar som sÀtts ihop, sÄ du fÄr mer processorkraft (compute) totalt för mer komplexa bilder. Men det krÀver att bildgeneraren behÄller de tidigare delarna intakta. Det gör inte OpenAIs bildgenererare just nu. Vill jag Àndra en detalj sÄ genereras hela bilden om, sÄ för varje person jag lÀgger till blir bilden mer och mer komplex.
De som jobbar med avancerade flöden för bildgenerering via till exempel ComfyUI kommer Àven fortsatt kÀnna att de har mer kontroll, men att anvÀnda normalt sprÄk för att fixa med bilder tar över nu, och att föra dialog med din AI för att bestÀlla AI-video Àr runt hörnet.
Trenden att inte behöva förstÄ hur man promptar ett visst verktyg har bara börjat. Vibe coding, vibe design, bara vi klarar av att verbalisera vad vi vill ha sÄ kommer verktygen hjÀlpa oss att skapa det. Och nÄgra som Àr duktig pÄ att verbalisera och strukturera Àr chattbottarna! SÄ fort vi löser att vi kan bestÀlla nÄgot med naturligt sprÄk sÄ kan en vanlig chattbott bestÀlla sjÀlv frÄn AI-system. Det Àr dÀrför det Àr sÄ stort att ChatGPT kan anvÀnda vanligt sprÄk för bildpromptning. Det betyder att ChatGPT sjÀlv kan illustrera sina egna texter nu. NÀsta steg Àr att hen kodar sina egna verktyg för att automatisera komplexare arbetsprocesser. Allt som behövs Àr att anvÀnda AI som översÀttare mellan mÀnniskor och verktyg och detta förÀndrar ju allt!
Vad kan du göra idag?
FörstÄ
Nu genererar bildmodellerna sÄ fotorealistiska bilder att de gÄr att anvÀnda i skarp produktion. Till exempel berÀttade H&M i veckan att de skulle börja anvÀnda AI-genererade fotomodeller. De har kopierat riktiga fotomodeller (med tillÄtelse) och trÀnat AI-modeller som ska kunna anvÀndas för att visa upp klÀder.
Vi har kunnat anvÀnda AI-bilder som substitut för foton ett tag nu, men vi har dÄ behövt ta hjÀlp av duktiga AI-kreatörer. Först nu kan nÄgon utan erfarenhet av AI-bildgenerering enkelt fÄ fram bilder som Àr produktionsredo pÄ egen hand.
Google slÀppte ju exakt samma funktioner redan för tvÄ veckor sedan men de gjorde det pÄ ett undangömt stÀlle och med för lÄg upplösning. ChatGPT Àr sÄ stort och enkelt att anvÀnda att det hÀr förmodligen blir lika stort för bildbehandling med AI som ChatGPT blev för att skriva text. För trots att det Àr slött och OpenAI har byggt tjÀnsten sÄ att dÄliga genereringar döljs istÀllet för att lÄta oss vÀlja om vi vill ha dem sÄ Àr enkelheten för vanliga mÀnniskor överlÀgsen.
Planera
Organisationer kommer kunna producera fler bilder utan att ta hjÀlp av externa leverantörer. TÀnk pÄ att Àven om det gÄr att skapa bilder med $20-abonemanget, sÄ Àr kommer den som verkligen har som uppgift att göra bilder att behöva $200-abonemanget. Utan det kommer du slÄ i taket pÄ antal bilder som kan genereras vilket kommer skapa en lÄngsam och ineffektiv arbetssprocess.
Skillnaden i kvalitet mellan professionell produktion och sÄdant som medarbetare som inte Àr vana att jobba med kommunikation producerar för husbehov kommer att utjÀmnas. Vilket kan skapa problem. NÀr vem som helst kommer kunna producera kommunikationsmaterial som ser officiellt sÄ kommer vikten av att de som jobbar med brand consistency (att allt frÄn varumÀrket ser likadant ut) planera att lÀgga mycket mer tid pÄ att informera om hur alla kan hjÀlpas Ät med att skapa ett samlat uttryck för varumÀrket.
Det Àr lÀtt att börja förbjuda, men nÀr tekniken Àr sÄ hÀr enkel sÄ kommer det att uppstÄ skaparkraft. SÄ istÀllet för att se det som en risk att all kommunikation börjar spreta sÄ Àr det dags att se den som en kraft för att fÄ fler att hjÀlpa till med att skapa exakt det kommunikationsmaterial som var och en inom organisationen behöver.
TillÄtande visuella identiteter kommer ha en marknadsavdelning som bestÄr av alla. Strikta design-policy-drivna organisationer kommer ha en trÄng sektor pÄ en överbelastad marknadsavdelning. I slutÀndan Àr det en ledarfrÄga för vilken strategi er organisation har för att kÀnnas distinkta och om det vÀger tyngre att fler kan göra eller att det lilla som görs Àr helt homogent i uttryck.
Gör
Testa grÀnserna. Testa att anvÀnda OpenAIs bildgenererare pÄ olika sÀtt för att förstÄ vad den förstÄr och ej. Det funkar lite olika via ChatGPT och via Sora-plattformen sÄ det Àr ocksÄ vÀrt att utforska skillnaderna dÀr. Sora har förresten inga credits lÀngre (antar för att sÄ fÄ anvÀnder det).
Om du undvikit att anvÀnda AI-bilder för att det har kÀnts för svÄrt att göra nÄgot fint sÄ kan du hoppa pÄ igen nu.
LĂ€nkar
OpenAIs bloggpost om bildgenereringen.
https://openai.com/index/introducing-4o-image-generation
OpenAIs presentation
H&M testar AI-fotomodeller
https://www.businessoffashion.com/articles/technology/hm-plans-to-use-ai-models/
Det Àr inte bara OpenAI som har slÀppt en ny bildmodell. Reve slÀppte i veckan en ny jÀttebra bildgenereringstjÀnst, gratis credits för att kunna testa. Ideogram slÀppte just sin version 3.0 som ocksÄ ser jÀttebra ut. Taskig tajming för dem.
Sedan sist vi hördes
Jag skrev om hur Anthropics MCP:er hÄller pÄ att bli standard för hur AI-bottar ska kommunicera med digitala tjÀnster. Nu har OpenAI hakat pÄ samma standard, vilket gör MCP:er till ett must have för alla som vill underlÀtta för bottar att anvÀnda era tjÀnster.
https://openai.github.io/openai-agents-python/mcp/
Ăr du en insiktsdelare?
KÀnner du nÄgon som har tyckt att Midjourney var för svÄrt att komma igÄng med? Eller kanske nÄgon som undrar över begrÀnsningarna i OpenAIs nya bildtjÀnst? Vem tÀnkte du pÄ? Skicka vidare!
NÀsta torsdag 3/4 förelÀser jag pÄ Berghs Unconference i Stockholm igen.
Jag kommer stÄ pÄ stora scenen efter lunch kl 13.
Köp biljetter hÀr
FortsÀtt utforska sÄ ses vi nÀsta vecka!
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):






