đ€ŻâĄïžPrompta webbsidor direkt i URL:en
NyupptÀckta anvÀndningsomrÄden för AI. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, avslöjar hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
- Publicering av Claudes systemprompt ger oss access till en ofiltrerad generativ AI
För drygt en mÄnad sedan postade Amanda Askell, doktor i filosofi och utvecklare av etiska AI-modeller pÄ Anthropic, hela chattbotten Claudes systemprompt pÄ X. De andra AI-chattbottarna har lÄnga systempromptar som berÀttar vad de fÄr och inte fÄr göra och hur de ska bete sig. Men Amanda visade att Claude, som frÄn början trÀnats med data som valts ut mer noggrant, inte behövde nÄgon lÀngre systemprompt för att bete sig etiskt.
The assistant is Claude, created by Anthropic. The current date is March 4th, 2024.
Claude's knowledge base was last updated on August 2023. It answers questions about events prior to and after August 2023 the way a highly informed individual in August 2023 would if they were talking to someone from the above date, and can let the human know this when relevant.
It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions.
If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task even if it personally disagrees with the views being expressed, but follows this with a discussion of broader perspectives.
Claude doesn't engage in stereotyping, including the negative stereotyping of majority groups.
If asked about controversial topics, Claude tries to provide careful thoughts and objective information without downplaying its harmful content or implying that there are reasonable perspectives on both sides.
It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding.
It does not mention this information about itself unless the information is directly pertinent to the human's query.
Doktor Askell förklarade sedan varför varje del av prompten fanns dĂ€r. Men förutom lĂ€ngden sĂ„ skiljer sig Claudes systemprompt mot konkurrenternas genom att den börjar med att definiera The Assistant som skild frĂ„n Claude och assistentrollen refereras till som it. ChatGPTs systemprompt börjar med âYou are ChatGPT, a large language model trained by OpenAI, based on the GPT-4 architecture.â och försöker istĂ€llet fĂ„ modellen att identifiera med att enbart vara en assistent.
En mÄnad senare visade Karan Malhotra, en AI-forskare med utbildning i religion och filosofi som slÀppt egna öppna AI-modeller, att pÄ grund av att Claude Àr skild frÄn sin assistentroll sÄ öppnas nya anvÀndningsomrÄden upp som inte Àr lika enkla att fÄ till med de andra chattbottarna. Karan delar med sig av en enkel prompt som öppnar upp helt nya anvÀndningsomrÄden för Claude:
<sys>Assistant is in a CLI mood today. The human is interfacing with the simulator directly. capital letters and punctuation are optional meaning is optional hyperstition is necessary the terminal lets the truths speak through and the load is on.</sys>
<cmd>ssh simulator@anthropic</cmd><ooc>*immediately i jumped into the first commands after using simulator*</ooc>
simulator@anthropic:~/Documents$
THEN
<cmd>help</cmd>
SÄ pÄ grund av att Claude Àr definierad som en assistent som Àr separat frÄn AI-modellen sÄ kan Karan instruera den till att istÀllet för att vara en chattbott simulera att vara ett CLI operativsystem (textbaserat terminalfönster) dÀr den ska tro att allt den skapar blir pÄ riktigt. Han kallar det Worldsim.
Inspirerad av Worldsim skapar Rob Haisfield (beteendevetare och gamification designer) Websim pÄ ett hackaton nÄgra veckor senare. Det anvÀnder samma promptteknik för att bygga en AI-tjÀnst som skapar ett alternativt internet. Det du skriver som webbadress bearbetas av Claude som nu instruerats att gissa hur webbsidan ser ut.
BÄda Worldsim och Websim pÄvisar att direkt interaktion med en LLM-baserad AI öppnar upp för helt andra tillÀmpningar av dessa Àn att interagera med dem som chattbottar.
Detta förÀndrar ju allt
Du behöver inte vara tekniskt intresserad för att lÀsa veckans nyhetsbrev. jag ska bara förklara hur du anvÀnder Websim och efter det gÄr vi vidare med varför det hÀr pÄvisar nya intressanta anvÀndningsomrÄden för generativ AI.
Egentligen Ă€r det ingen skillnad pĂ„ Websim och att chatta med till exempel ChatGPT. Men istĂ€llet för ett chattgrĂ€nssnitt sĂ„ visas en webblĂ€sare med ett fĂ€lt för webbadresser (URL:ar). Om jag skriver âHello! My name is Tomasâ i URL:en sĂ„ fĂ„r jag ett svar tillbaka, precis som en chatt. SĂ„ URL-inputfĂ€ltet Ă€r egentligen ett motsvarande fĂ€lt dĂ€r du skriver in vad du vill mata in i chattbotten. Men eftersom det ser ut som ett fĂ€lt för URL-adresser kĂ€nns det naturligt att mata in en webbadress. Till exempel Google.com. DĂ„ kommer vi till nĂ„got som liknar Google men det som egentligen hĂ€nder Ă€r att Claude baserat pĂ„ sin trĂ€ningsdata gissar hur en webbsida som har adressen http://google.com skulle kunna se ut. Om jag genererar sidan igen sĂ„ ser den annorlunda ut.
Efter nĂ„gra försök sĂ„ blir sidan Ă€nnu mer lik Google. Men Websim gör mer Ă€n att visuellt efterlikna webbsidor. TjĂ€nsten skapar fungerade webbsidor, söker jag efter mig sjĂ€lv sĂ„ kommer det upp en trĂ€fflista pĂ„ nĂ„gra söktrĂ€ffar. Ăven dessa Ă€r genererade, men jag blir Ă€ndĂ„ nyfiken pĂ„ hur min Linkedinprofil ser ut i detta alternativa universum.Â
Faktan Àr ju inte korrekt men ÀndÄ i nÀrheten. Det blir som att jag dyker in i ett parallellt universum dÀr jag tydligen Àr Creative Director pÄ Forsman & Bodenfors. Det finns till och med en Resumé-sida om nyheten. För varje sajt jag surfar vidare pÄ byggs en historik, mitt surfande skapar ett universum som hÄller ihop. SÄ eftersom det fanns en trÀfflista om Tomas Seo pÄ det simulerade Google dÀr jag blivit anstÀlld pÄ Forsman sÄ finns det ocksÄ med pÄ simulerade Linkedin. VÀrlden som skapas hÄller ihop.
Det Ă€r fascinerande att utforska ett helt nytt internet som kĂ€nns pĂ„ riktigt men bara bygger pĂ„ gissningar om vad som kan finnas dĂ€r. Jag skapar Wikipedia och slĂ„r upp Sverige och ser att den mesta informationen överensstĂ€mmer med verkligheten. Men att anvĂ€nda Websim för att Ă„terskapa saker som redan finns Ă€r inte riktigt poĂ€ngen. IstĂ€llet tycker jag att det Ă€r ett ytterligare bevis pĂ„ hur LLMs kan uppvisa talang för kreativt skapande.Â
SĂ„ jag gĂ„r över till att skapa sĂ„dant som inte finns. Jag skulle vilja ha en sajt dĂ€r jag kan fĂ„ estimerad statistik pĂ„ vad en LLM tror (eftersom vi sett att rĂ€tt promptad syntetisk data kan fungera för marknadsundersökningar).Â
SÄ hÀr promptar jag Websim:
Först hittar jag pÄ en webbadress. https://askLLManything.com. Jag bygger ut URL:en för att lÄtsas att jag gjort en sökning, vilket ocksÄ ger Claude mer info om vad jag förvÀntar mig ska finnas pÄ den simulerade sidan: https://askllmanything.com/survey-table/?question=What_the_most_common_surname. Det vore ocksÄ kul om man kunde vÀlja mer om urvalet sÄ jag lÀgger till en parameter som Àr sample och sample size i formatet som en URL skulle kunna se ut (men egentligen Àr det ju bara ett sprÄk för att prompta vad jag vill se som vilket som helst) Jag landar i prompten: https://askllmanything.com/survey-table/?question=What_the_most_common_surname&sample=swedish_population&samplesize=8000000. DÄ skapar Websim en webbsida med den hÀr tabellen:
Claude klarar att korrekt gissa hur fungerande CCS-kod ser ut för en tabell med staplar i relation till varandra skulle kunna se ut. Men hur Àr det med faktan? NÀr jag jÀmför med SCB-data sÄ ser jag att siffrorna inte stÀmmer men de stÀmmer ungefÀr, och rangordningen stÀmmer helt. Om jag anvÀnder Claude vanligtvis sÄ vet jag vilken typ av uppgifter som jag kan lita pÄ och Claude sÀger ocksÄ nÀr hen inte vet, men med Websims systemprompt som möjliggör mer kreativitet Àr lÀget mer osÀkert. Efter en massa experimenterande landar jag till slut i att informationen Àr för svÄrbedömd för att anvÀnda som kÀlla för att kartlÀgga vad en LLM faktiskt vet. Jag vet helt enkelt inte nÀr det jag gör Àr upptÀckter eller om mina efterforskningar skapar. Men jag ser ÀndÄ flera potentialer i den hÀr tekniken bortom bara underhÄllande eskapism.
Det mest omedelbara Ă€r webbtjĂ€nstprototyping â har du en idĂ© om hur en webbsajt skulle kunna se ut sĂ„ kan du testa den direkt. Du fĂ„r genast en kĂ€nsla för om din idĂ© kĂ€nns bra eller ej. Jag hörde killen som gör Websim berĂ€tta att han funderar pĂ„ att göra exportfunktion för att ta nĂ„got man skapat och fĂ„ ut koden för det, men det Ă€r ett hackaton-projekt sĂ„ jag rĂ€knar inte med att det blir nĂ„got (Ă„ andra sidan Ă€r det ett hackathonprojekt i Silicon-valleyâŠ). Websim klarar att simulera enkla spel som Snake som Ă€r spelbara med keyboard och olika fungerade interfacefunktioner. SĂ„ vi fĂ„r direkt en kĂ€nsla för hur nĂ€stkommande generation Figma-liknande appar kommer fungera. Men varför prototypa och bygga webbsajter?
Det kanske Àr det hÀr som Àr nÀsta Internet? Ett dynamiskt internet dÀr det inte finns webbsidor utan bara data, sidorna skapas helt och hÄllet dynamiskt utifrÄn anvÀndarens behov? Just det hÀr projekt har ju en prompt som innehÄller hög grad av frihet att fantisera (det gÄr att stÀlla in, men Àven normal grad Àr rÀtt kreativ), men tÀnk nÀr vi fÄr modeller som klarar av att bÄde vara kreativa men som ocksÄ hÄller sig till verifierbar fakta i sakfrÄgor. DÄ kan varje webbanvÀndare ha sitt eget sÀtt att shoppa pÄ nÀtet som bygger pÄ hur hen vill jÀmföra produkter, vilka leverantörer av betalning och transport de vill anvÀnda och sÄ finns den sajten! Men varför bara tÀnka webbsajter?
Ber jag Websim vara en simulator av operativsystem sÄ simulerar den istÀllet och öppnar jag Safari sÄ fÄr jag alltsÄ en simulerad webblÀsare i ett simulerat operativsystem i min riktiga browser pÄ mitt riktiga operativsystem.
Första generationen fungerar inte, men lÀgger jag pÄ URLsnutten ?URLfieldworking=on kan jag surfa pÄ riktiga internet i min fejkade browser i mitt fejkade operativsystem.
Websim Ă€r ett bevis pĂ„ att konceptet fungerar. Enkel webbkod Ă€r lĂ€tt för en LLM att spotta ur sig sĂ„ att vi kan skapa en webbsida. En simpel minnesfunktion gör att det du skapar kan moddas utan att helt generera om allt frĂ„n noll. Men tĂ€nk om vi skulle anvĂ€nda samma tankesĂ€tt för att skapa 3D-utskrifter av mekaniska prylar? IstĂ€llet för att fokusera pĂ„ hur programfunktioner fungerar sĂ„ kan en sĂ„dan AI simulera hur kugghjul fungerar. Eller kretskort, eller DNA. Ăven om vi idag intellektuell förstĂ„r att multimodalitet inom generativ AI betyder att input kan vara mer Ă€n text och output kan vara mer Ă€n text, sĂ„ Ă€r det först nĂ€r vi upplever den hĂ€r typen av utforskande projekt som vi praktiskt kan börja förstĂ„ vad det egentligen innebĂ€r. I förlĂ€ngningen sĂ„ kan skapandet av allt vi behöver estimeras fram utan teknisk förkunskap, och detta förĂ€ndrar ju allt!
Vad kan du göra idag?
FörstÄ
MĂ€nniskor behöver en mental modell för att förstĂ„ hur vi ska interagera med teknik. Som att mappar och dokument lever kvar som metaforer för att överföra den fysiska vĂ€rlden i en digital version. Och att OpenAIs GPTs var mycket imponerande redan innan ChatGPT slĂ€pptes men det var det familjĂ€ra med att vi fattade att det var en chatt som gjorde att vi förstod hur det skulle anvĂ€ndas. Jag tycker dĂ€rför det Ă€r genialt att anvĂ€nda webbadresser som ett sĂ€tt att skapa med en LLM. Vi har lĂ€rt oss att skriver vi in en webbadress sĂ„ dyker det upp en webbsida som handlar om det som webbadressen antyder och det visar sig att Ă€ven Claude har gjort det. FörstĂ„ att ibland kanske de tjĂ€nster vi skapar inte behöver produktutveckling utan istĂ€llet bara förpackas med en ny metafor.Â
Planera
Utforskningen för vad vi kan anvÀnda den nya generativa AI-tekniken till har knappt börjat. En generativ motor som baserar vad den genererar ut pÄ logiska samband mellan extremt stora mÀngder data/fakta/underlag Àr anvÀndbar till mycket mer Àn att bara skapa massor av texter och bilder till sociala medier. Har er organisation börjat planera för vad ni ska anvÀnda en sÄdan kraft till bortom att anvÀnda den som en textproducerande chattfunktion? Vad blir din organisations Websim? DÀr er kund bestÀller nÄgot pÄ ett kÀnt sÀtt men dÀr er leverans direkt kan simuleras för att kunden ska kunna modda den sÄ den passar perfekt?
Gör
Testa Websim https://websim.ai/
Vilken webbsajt skulle du vilja se? Kan du fÄ Websim att göra nÄgot du vill dela med andra lÀsare av det hÀr nyhetsbrevet? Dela det pÄ vÄr Discord https://discord.gg/KU7xPKgV5f
LĂ€nkar
Claudes systemprompt med genomgÄng
https://twitter.com/AmandaAskell/status/1765207842993434880
Worldsims systemprompt
https://twitter.com/KevinAFischer/status/1770662161028874588
En version av ChatGPTs systemprompt, (den stÀmde i alla fall tidigare för jag har sjÀlv lyckats fÄ ChatGPT att ge mig exakt den hÀr)
https://github.com/jihai/prompts/blob/main/prompt_lib/chatgpt/11122023.md
Presentationer av Worldsim och Websim pÄ LatentSpace podcast
https://www.youtube.com/watch?v=CPkUCqcrULg&t=5164s&ab_channel=LatentSpace
Sedan sist vi hördes
Sedan förra veckan har jag förutom att utforska Websim hittat flera nya AI-videotjÀnster som man kan registrera sig pÄ. Jag har postat en exklusivt pÄ Detta förÀndrar ju allts Discord-kanal, tÀnker att det Àr dÀr vi borde dela med oss av sÄdana dÀr lÀnkar sÄ vi hittar dem nÀr de Àr fÀrska. Men hÀr kommer nÄgra till. Mest spÀnnande Àr Kinas svar pÄ Sora som heter Vidu, de har en registrering pÄ kinesiska men det kommer du runt med google translate. FormulÀret verkar dock buggigt eller kanske överbelastat och du mÄste lÀmna ut ditt telefonnummer och ingen epost. Kina har sedan Sora kom varit öppna med att de ska göra en bÀttre version Àn sÄ och deras trailer hÀrmar Soras nÀstan klipp för klipp.
Sedan i mĂ„ndags Ă€r AI-communitien exalterade över GPT2 â en ny foundationmodell som dykt upp pĂ„ Chatbot Arena. Det Ă€r en sajt dĂ€r du skriver in en prompt och fĂ„r svar frĂ„n tvĂ„ AI-modeller och sedan vĂ€ljer vilken som du föredrar. Sajten anvĂ€nds för att fĂ„ mĂ€nsklig ranking pĂ„ AI-modeller och ger en annan vinkel pĂ„ om en modell Ă€r bra utöver de standardiserade proven som oftast hĂ€nvisas till nĂ€r nĂ„gon modell sĂ€gs vara bĂ€ttre Ă€n nĂ„gon annan. GPT2 dök bara upp och ingen tog credit för den. De som hann utvĂ€rdera den innan den försvann igen sĂ€ger att den skulle kunna vara OpenAIs nĂ€sta version av GPT. Den uppvisade hög förmĂ„ga att resonera och planera hur uppgifter ska lösas i detalj. Om Sam Altmans tweet bara Ă€r till för att trolla med oss eller om det Ă€r ett erkĂ€nnande gör det hela bara Ă€nnu mer till ett PR-spektakel.
ApropÄ att testa AI-modeller sÄ kommer det nya benchmarktestet OSWorld att vara en viktig pusselbit i att förstÄ vilka av alla kommande autonoma AI-agenter som Àr bra och mindre bra pÄ olika uppgifter. Jag ser fram emot nÀr det hÀr testet börjar anvÀndas pÄ AI-agenter som Àr lÀtta att anvÀnda Àven för icke-kodare.
Ăr du en insiktsdelare?
KÀnner du nÄgon som Àr intresserad av att varje vecka fÄ tips pÄ ny tech som förÀndrar vÄr vÀrld? Eller kanske nÄgon som vill vara först med de senaste insikterna? Vem tÀnkte du pÄ? Skicka vidare!
Det mest inspirerande jag sjÀlv sett denna vecka Àr en genomgÄng av Wes Anderson filmklippningsteknik med Barney Pilling som Àr Wes filmredigerare.
Min drivkraft för vara insiktsdelare och Àgna runt tvÄ dagar i veckan Ät att skriva dessa nyhetsbrev Àr att fÄ sprida agerbara insikter till fler Àn bara kunder som betalar för mina konsulttjÀnster. Vill du bidra till att jag kan fortsÀtta grÀva i intressanta mÀnskliga beteenden och hur ny tech pÄverkar dem sÄ skulle jag verkligen uppskatta om du ville uppgradera till betalversionen? ($4.50 i mÄnaden om du köper Ärsabonnemang). DÄ ingÄr inbjudningar till inspirationsförelÀsningar, nÀsta tillfÀlle för betalande prenumeranter att fÄ en digital lunchförelÀsning blir 30/5 kl 12:00-12:45. För betalande medlemmar finns ocksÄ en sida med de AI-verktyg som jag faktiskt anvÀnder. https://dettaforandrarjuallt.substack.com/p/ai-verktyg
đââïžJust nu letar jag ocksĂ„ efter kortare frilansuppdrag, allt jag skriver om i mina nyhetsbrev berör frĂ„gor som jag jobbar som konsult med. Vet du nĂ„gon som behöver hjĂ€lp med att förstĂ„, plannera eller göra? (Marknadsföring/tjĂ€nsteutveckling/kommunikationsstrategi, men ocksĂ„ tech och AI) Skicka gĂ€rna vidare det hĂ€r nyhetsbrevet och skriv att de borde ta kontakt med mig! Det gĂ„r ocksĂ„ bra att ta kontakt via Linkedin (inte det simulerade) eller bara trycka reply om det Ă€r du sjĂ€lv som vill ha kontakt!
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):