Kan man använda generativ AI för att återskapa tonalitet och imitera innehåll från ett myllrande internetforum som Familjeliv? Det ville tre utvecklare ta reda på under Prototypveckan.
Press to view video
Simon, Balthazar och Gustav ville först utforska möjligheten att skapa en jobbtitelgenerator med hjälp av AI. Efter research och labbande med Metas Llama 2-modell och resurser från Hugging Face, landade man i att använda OpenAI:s API för sitt projekt.
Men under tiden hade idén utvecklats, och teamet tog sig an en större utmaning. Man ville istället ge sig på att skapa en GPT med det populära, anonyma – och inte sällan konfliktskapande − föräldraforumet Familjeliv.se som inspiration och underlag. All data finns tillgänglig, och tonaliteten får sägas vara unik.
Teamet delade upp backend och frontend. I bakgrunden genererades ett svar på besökarens fråga, som därefter användes i en prompt till OpenAI. Det visade sig vara viktigt att tweaka prompten under veckans gång för att skapa mer träffsäker output i sann Familjelivs-anda.
En utmaning var att hämta forumets mastodontiska dataflod på ett strukturerat sätt. Teamet byggde en scraper som hämtade och sorterade alla forumtrådar i en vektordatabas. Ur denna kunde man skapa en egen språkmodell. Den här processen kallas ofta för RAG, eller Retrieval-Augmented Generation.
Arbetet var tidskrävande och gick inte alltid enligt plan, men eftersom projektets själva essens inte byggde på perfektion blev det istället en testprocess som teamet upplevde som både lärorik och underhållande.
Projektet handlade om att utforska hur mycket kontext och inramning man kan skapa hos en AI-modell för att efterlikna ett unikt och mångfacetterat språkbruk. Med FamiljeGPT visade teamet att det verkligen är möjligt.
Intresset för API:er och stora dataflöden – hela vägen från input till grafisk användarupplevelse – fick frodas under veckan, samtidigt som teamet fick möjlighet att verkligen fördjupa sig i hur språkmodeller och generativ AI fungerar under huven.
Projektet visar på kraften i verktyg som ChatGPT och ger inspiration kring hur man kan nyttja befintliga datakällor för att verkligen mejsla fram en egen kunskapsbank med säregen tonalitet.
Det finns gott om andra webbaserade forum eller databaser som skulle kunna nyttjas på samma sätt i framtiden – eller varför inte bygga en GPT av den interna Slack-historiken?
För Prototyps kunder är projektets lärdomar dock kanske framförallt applicerbara i utvecklingen av AI-modeller för inspirationsmaterial eller kundtjänstförfrågningar.
Vi använder kakor (cookies) för att ge dig en bättre upplevelse av vår webbplats. Du väljer själv om du godkänner kakor. Läs mer om hur vi hanterar kakor