đ€ŻâĄïžDrivkraften bakĂ„t driver oss framĂ„t
Dina gamla stillbilder blir film, film blir AR/VR. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, avslöjar hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
-Omvandling av foton till 3D-strukturer och film rasar vidare
Förra Äret utvecklades omrÄdet för omvandling av 2D-bilder till 3D-scener. NÀstan varje vecka kom rapporter om signifikanta framsteg. Med AI och tekniker som Neural Radiance Fields (NeRF) och Gaussian Splatting kan ett foto förvandlas till ett objekt eller person som vi kan se frÄn alla vinklar. Ett foto pÄ en miljö blir en hel vÀrld som vi kan röra oss i. I början av Äret var det mest datorspelsutvecklare som var intresserade, men i slutet av Äret hade Àven de som jobbar med verktyg för att generera rörliga bilder börjat se möjligheterna.
Mot denna bakgrund har forskare vid New York University och Intel introducerat âImage Sculptingâ, en ny metod för bildredigering som integrerar 3D-geometri och grafik. Denna teknik möjliggör ett mycket mer kontrollerat sĂ€tt att förĂ€ndra 2D-bilder. Först konverteras bilden till 3D för att kunna vridas eller flyttas, sedan konverteras 3D tillbaka till en snygg 2D-bild igen.
2D till 3D möjliggör ocksÄ bÀttre generativa videotjÀnster. BildtjÀnsten Midjourney har varje vecka Office Hours, en offentlig dragning dÀr chefen David Holz svarar pÄ frÄgor och berÀttar om vad de jobbar med. De senaste mÄnaderna har han Äterkommit till att 3D-objekt Àr nÄgot de forskar pÄ och att det hör ihop med hur de tÀnker skapa rörliga bilder. David har sagt att Midjourney ska visa upp sin videotjÀnst om nÄgra mÄnader. Releaser frÄn Midjourney har dock ofta blivit senare Àn vad David brukar estimera, men pÄ text-to-video finns det nu sÄ hög konkurrens att det förmodligen blir ett prioriterat omrÄde.
Image Sculpting Àr en viktig nyckel i hur kommande processer för att skriva en text för att automatiskt generera en lÄngfilm eller VR-vÀrld kommer att fungera.
Detta förÀndrar ju allt
Jag har följt det hĂ€r omrĂ„det och tycker att det Ă€r jĂ€ttespĂ€nnande. Men det Ă€r lite geekigt. Det Ă€r för tekniskt och nyttan av att ta bilder och göra om dem till objekt man kan snurra pĂ„ Ă€r inte sĂ€rskilt uppenbar. Ănda tills jag stötte pĂ„ Wist, en AR/VR-app (nĂ€ sluta inte lĂ€sa det blir bra). Wist labs utvecklar ett sĂ€tt att Ă„teruppleva sina minnen. Deras demofilmer visar pĂ„ en potential i ett anvĂ€ndningsomrĂ„de som jag inte riktigt hört nĂ„gon prata om, nĂ€mligen nostalgi.
Vi tar massor av bilder och filmer dagligen numera. För att dokumentera, för att minnas, för att kunna Ă„teruppleva. VĂ„ra digitala kamerarullar svĂ€mmar över och en av de största anledningarna till att bred allmĂ€nhet köper molnlagring Ă€r för att bevara foton. Trots detta Ă€r det VR-gaming som lyfts fram för att fĂ„ Metaverse att bli en grej. Varje pryl behöver en killer app, det Ă€r etablerat sedan gammalt. Du köpte inte en hemdator pĂ„ 80-talet, du köpte ett sĂ€tt att kunna anvĂ€nda kalkylblad. Smartphonens killer app var inte att du kunde ringa med den, det var att du kunde googla. Numera Ă€r det kameran som gör att du kĂ€nner att du behöver byta telefon. Men VR-headseten har famlat efter vad killer app Ă€r för massmarknaden.Â
Jag sjÀlv har ett Meta VR-headset som anvÀnds för att spela med varannan mÄnad kanske. SÄ jag har inte kÀnt nÄgot supersug för att köpa Apples skidglasögon. Fast nÀr jag stötte pÄ Wist sÄ insÄg jag att det enda som faktiskt fÄtt mig att gÄ igÄng lite pÄ Apples pryl Àr att jag skulle vilja ta VR-filmer pÄ barnen för att kunna se dem igen nÀr de blivit Àldre. Eller för att erbjuda möjligheten för barnen att se sig sjÀlva som smÄ med mina ögon nÀr de blivit Àldre. Vad Wist gör, och som jag gissar att alla andra kommer haka pÄ, Àr att de lÄter dig lappa ihop dina VR-filmer med verkligheten sÄ du kan gÄ omkring i ditt rum och till exempel se din gamla mamma sitta i soffan dÀr ni brukade sitta. Du kan gÄ och sÀtta dig bredvid henne. Men Àn sÄ lÀnge mÄste du ha tagit VR-filmer med Apples eller Wist egna system.
Det Ă€r hĂ€r som AI och Gaussian Splatting kommer att fylla i hĂ„len. Varje dag kommer nĂ€rmare att ett enda stillbildsfoto kan bli en interaktiv 3D-lĂ„ngfilm. Haley Joel Osment kommer kunna âsee dead peopleâ, Demi Moore kommer kunna dreja med spöken och du kommer kunna Ă„teruppleva din barndom med endast ett par AR/VR goggles matade med nĂ„gra fĂ„ gamla foton. Första versionerna kommer att kĂ€nnas som Wist gör idag, lite spöklikt med artefakter och konstiga skuggor. Men ge det nĂ„gra Ă„r sĂ„ kommer illusionen av att du Ă€r tillbaka i det förgĂ„ngna vara mycket realistisk.Â
Drar vi ut utvecklingen lite lÀngre sÄ behöver vi ju inte stanna i att vi gÄr omkring i det förgÄngna som passiva vÄlnader. Det mer troliga Àr ju att röster frÄn personerna i vÄra gamla filmer röstklonas sÄ de kan fortsÀtta prata lÀngre Àn filmsnutten vi tog. Data frÄn vÄra chattkonversationer och videos paras ihop till personligheter. SÄ vi gÄr frÄn att bara kunna loopa vÄra minnen till att leva i dem. DÄ kommer vi pÄ riktigt kunna Äteruppleva vÄr barndom. Men det hÀr Àr nÄgra Är bort.
I den nÀrmaste framtiden kommer integreringen mellan 2D och 3D att accelerera utvecklingen av kontroll. NÀstan alla som börjar med generativ AI för bilder börjar med att försöka fÄ till nÄgot som de vet hur det ser ut för att sedan bli besvikna. De laddar upp en bild pÄ nÄgot och vill ha en nÀstan likadan bild tillbaka. Eller skriver in vad de vill se i bilden i detalj och bli besvikna pÄ att deras noggranna instruktioner inte alls följs. Den mest efterlÀngtade funktionen för generativ AI för bilder Àr consistent characters. Om du laddar upp en bild pÄ en person som du vill att AI ska animera sÄ den springer (image-to-video) sÄ vill vi i de allra flesta fall inte att den personen samtidigt som den springer förvandlas Ätskilliga gÄnger till en annan person. Vilket Àr dagslÀget för Àven de bÀsta image-to-video om de genererar lÀngre klipp.
Det Ă€r fascinerande att fundera över hur grĂ€nsen mellan det förflutna och nutid kommer suddas ut i framtiden. Vi kommer att ha möjligheten att inte bara Ă„teruppleva utan ocksĂ„ interagera med vĂ„ra minnen pĂ„ sĂ€tt som vi tidigare endast har skrivit scifi om. Denna förmĂ„ga öppnar ocksĂ„ upp för ett helt nytt sĂ€tt att förstĂ„ och uppleva vĂ„r egen historia. Jag Ă€r övertygad om att det hĂ€r kommer att vara en stark drivkraft för alla techbolag att skynda Ă€nnu snabbare. MĂ€nniskans vilja att leva i det förgĂ„ngna accelererar oss snabbare in i framtiden, och detta förĂ€ndrar ju allt. Â
Vad kan du göra idag?
FörstÄ
Nostalgi var klassat som en psykisk sjukdom för 200 Ă„r sedan. Idag ser forskare det som en process att söka stöd och tröst. EvolutionĂ€rt förbĂ€ttras minnets effektivitet nĂ€r det belönas med kĂ€nslor och sociologer anser att det stĂ€rker grupptillhörighet och social identitet. Oavsett perspektiv sĂ„ behöver du förstĂ„ att nostalgi Ă€r en mycket stark emotionell drivkraft. I takt med att AR/VR-goggles blir mer som vanliga glasögon sĂ„ kommer behovet av att resa bakĂ„t i tiden att öka kraftigt. PĂ„ samma sĂ€tt som smartphones gjort fler mĂ€nniskor till regelbundna fotografer sĂ„ kommer lĂ€ttillgĂ€ngligt AR/VR att göra fler mĂ€nniskor till regelbundna nostalgiker. Det kommer finnas de som Ă€gnar det mesta av sin fritid Ă„t att grĂ€va ner sig i sitt eller andras förflutna.Â
Planera
TvÄ saker:
AR/VR Àr som en katt med 9 liv. Drömmen om att besöka andra platser och andra tider Àr för stark för att det ska försvinna trots otaliga misslyckade och missriktade lanseringar. Tekniken har definitivt inte hittat en tillrÀckligt bred killer application. Var du early adopter för nÄgra Är sedan sÄ vet du att det Àr dyrt att skapa VR-upplevelser, men det du mÄste förstÄ Àr att AI dramatiskt kommer sÀnka produktionskostnaderna för VR-upplevelser. Det Àr dock fullt möjligt att den största tiden som mÀnniskor anvÀnder AR/VR faktiskt kommer handla mer om att skapa sina egna upplevelser. SÄ om din organisation vill hoppa pÄ AR/VR igen, övervÀg att skapa resurser och verktyg för att fÄ fler att kunna skapa nÄgot istÀllet för att sjÀlv bygga upplevelser som bara ska konsumeras. Planera för att bli killer app istÀllet för att bli en till plattform.
Om vi lÀmnar AR/VR och bara funderar över nostalgi som drivkraft för framtiden. TÀnk pÄ att alla varumÀrken som pratar om AI behöver inte jobba med framtiden som huvudtema. Det var förra Äret. Fundera istÀllet över hur ökat intresse för det förflutna skapar möjligheter för din organisations kommunikation eller erbjudande.
Gör
Har du sjÀlv testat de senare versionerna av VR? Har du i sÄ fall testat att bara besöka andra riktiga platser i VR? Om inte be en kompis om ett studiebesök i deras headset, det gÄr faktiskt inte att bortse frÄn att det Àr hÀftigt nÀr man vÀl gör det. Om du redan har ett headset kan du stÀlla dig i kö till Wistlabs https://wistlabs.com/ för att fÄ en bÀttre kÀnsla för hur det kommer att vara nÀr du lÀtt kan besöka dina egna minnen i VR eller AR.
LĂ€nkar
Nyheten om Image Sculpting
https://www.marktechpost.com/2024/01/11/nyu-and-intel-researchers-introduce-image-sculpting-a-new-artificial-intelligence-framework-for-editing-2d-images-by-incorporating-tools-from-3d-geometry-and-graphics/
Vetenskapliga artikeln om Image Sculpting
https://arxiv.org/abs/2401.01702
Titta pÄ nÄgra Gaussian Splatts
https://poly.cam/tools/gaussian-splatting
Ăr du lite mer nördig sĂ„ förklarade Two Minute Paper Gaussian Splatting forskningen bakom nĂ€r det kom https://www.youtube.com/watch?v=TLK3TDDcJFU&t=4s&ab_channel=TwoMinutePapers
CSM 3D Àr ett exempel pÄ ett gratis verktyg dÀr du kan ladda upp en 2D bild och fÄ ett 3D objekt tillbaka. (Det finns jÀttemÄnga olika, men jag har inte haft nÄgot anvÀndningsomrÄde för den hÀr tekniken sÄ jag testar inte dessa rutinmÀssigt)
https://3d.csm.ai/
Till dess att Midjourney fixar consistent characters sÄ kan vi testa lite nya konkurrenter. Artflow har gjort en intressant process för hur de tÀnker att du skapar konsekventa karaktÀrer först och sedan anvÀnder dem i scener https://artflow.ai
Jag fick en frÄga om hur bildbyrÄer tÀnker kring sina fototjÀnster och AI nÀr jag förelÀste för betalande prenumeranter förra veckan. HÀr visar iStock hur de tÀnker sig att man vill erbjuda mer kontroll över bilder nÀr de lanserar sin nya tjÀnst tillsammans med NVIDIA https://blogs.nvidia.com/blog/nvidia-picasso-istock-generative-ai
Sedan sist vi hördes
Jag skrev ju om EU Act nĂ€r det bara var ett förslag  och planerade ett uppföljande nyhetsbrev den hĂ€r veckan men nĂ€r jag gick igenom EU Act ordentligt sĂ„ insĂ„g jag att det var ganska lite att sĂ€ga om det. I princip förbjuder det endast anvĂ€ndningsomrĂ„den som Ă€r filmskurk-onda. Allt annat Ă€r mer lösa riktlinjer som bör följas men inte förbjudas (sĂ„vida inte nĂ„got av EUs medlemslĂ€nder övertolkar det). I nulĂ€get bedömer jag det som att ingen organisation jag nĂ„gonsin stött pĂ„ skulle komma pĂ„ att anvĂ€nda AI pĂ„ sĂ„ lömska sĂ€tt som förbjuds av EU Act. Förslaget Ă€r skrivet som ett ramverk som gör det lĂ€tt att uppdatera nĂ€r tekniken utvecklas (lĂ€tt för att vara en EU-grej i alla fall). Jag förvĂ€ntade mig att det skulle vara mer hindrande och ogenomtĂ€nkt, men det var inte vad jag fann. Hur det blir med Sverige och de andra medlemslĂ€ndernas tillĂ€mpning av EU Act Ă„terstĂ„r förstĂ„s att se.Â
NĂ€r jag skrev om OpenAI:s slĂ€pp av GPTs sĂ„ sa de ju att det skulle komma en GPT Store, och nu Ă€r den hĂ€r. De ska slĂ€ppa revenue sharing (likt Spotifys modell) sĂ„ om din GPT blir mycket anvĂ€nd sĂ„ kan du tjĂ€na pengar. Till att börja med bara i USA. Ăn sĂ„ lĂ€nge gĂ„r det att se innehĂ„llet i de allra flesta GPTs och de som visas först i GPT Store har ganska lite arbete nedlagt pĂ„ prompterna. Det kĂ€nns bra att det Ă€r sĂ„ lĂ€tt att fĂ„ transparens i modellerna för att veta vad de gör, men det kĂ€nns svĂ„rt att se att det hĂ€r Ă€r en lĂ„ngsiktig affĂ€r. VarumĂ€rken borde ta tillfĂ€llet i akt och göra GPTs för att ranka i GPT Store, men det skrev jag ju om nĂ€r det slĂ€pptes.
Dagens nyhetsbrev blev inte heller ett nyhetsbrev om CES 2024. Ăven om det var non-stop nyheter dĂ€rifrĂ„n förra veckan sĂ„ kĂ€ndes det inte sĂ„ nyhetsvĂ€rdigt. Det som fick genomslag hos mig var robotarna. MĂ„nga av de stora varumĂ€rkena slĂ€pper robotar för hemmabruk och hushĂ„llsarbete. De flesta kommer med inbyggd AI och alla förvĂ€ntar sig att de kommer kunna hjĂ€lpa till med lite mer blandade uppgifter inom en snar framtid. Drivkraften att förverkliga Jetsons robot-hushĂ„llerska hĂ„ller ingenjörerna sysselsatta. Men jag har ingen specifik som jag kĂ€nner att jag villhöver Ă€n.
I mÄndags slÀppte Microsoft Co-Pilot för privatpersoner. https://www.microsoft.com/sv-se/microsoft-365/business/copilot-for-microsoft-365
Dessutom tar de bort minimigrÀnsen pÄ 300 licenser för företag och organisationer kan nu köpa styckvis licenser för $30/mÄnad enligt Verge
https://www.theverge.com/microsoft-copilot-pro-office-ai-apps Det hÀr Àr en viktig nyhet dÄ det blir mÄnga organisationers sÀtt att tillÄta anvÀndning av generativ AI för dagliga uppgifter.
Ăr du en insiktsdelare?
KÀnner du nÄgon som Àr intresserad av hur nostalgi kommer förÀndra vÄr framtid? Eller kanske nÄgon som Àr intresserad av nya möjligheter med AR/VR? Vem tÀnkte du pÄ? Skicka vidare!
Förra veckan körde jag en dragning för betalande prenumeranter. Vill du fÄ en inbjudan nÀsta gÄng sÄ fÄr du gÀrna ocksÄ bli betalande medlem. Jag lÀgger numera ungefÀr tvÄ arbetsdagar i veckan pÄ varje nyhetsbrev. Detta inkluderar research, kÀllgranskning och testning av nya tjÀnster. SÄ tycker du att kvalitén pÄ det hÀr nyhetsbrevet Àr acceptabel sÄ prenumerera gÀrna sÄ att jag kan motivera den nedlagda tiden. ($4.50 i mÄnaden om du köper Ärsabonemang)
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):