22 maj 2009

Om att arbeta med maskinell textkodning

Brev, mail till företaget, bloggar mm används för textkodning.
Textdata är viktigt inom marknadsundersökningar då 80% av all data är i text. Förr när man arbetade med kodning av text fick en person gå igenom ett antal inkomna svar och hitta på lämplig kodning, och därefter koda hela materialet efter dessa koder. Problemet var då att det ofta visade sig en bit in i kodningsarbetet att man gjort för få, eller missvisande koder.

Både teori och teknik har utvecklats enormt

Numera har åtskilliga förbättringar kommit både vad gäller teorier om textkodning men framför allt inom teknologi, med Text Mining, kategorisering med hjälp av datorer. Dagens datorer och textverktyg kan koda enorma mängder av fritextsvar på mängder av olika sätt och skapa kluster av relevant information. Mjukvaran kan idag arbeta och kategorisera information kvantitativt, kvalitativt och psykologiskt. Det är lätt att missa vad som egentligen är problemet, om man i en undersökning bara har check-boxes med fasta alternativ, även om det är graderingar som 1-10 med. En survey genomförd på ett hotell visade att många kunder var missnöjda på ett antal områden. En närmare studie visade dock att de egentligen inte var missnöjda med det som de klagade på, men det fanns inga rutor att fylla i som motsvarade deras klagomål, så då valde de andra rutor. I fritextsvaren gavs förklaringen, men dessa kunde inte hotellet hantera, så de brydde sig aldrig om att läsa dem.

Många gånger fyller folk i fasta svarsalternativ som inte alls stämmer in på deras problem eller åsikt

Detta bara för att det saknas möjlighet att ge fritextsvar. Effekterna kan bli förödande om företag börjar försöka rätta till problem som egentligen inte finns, utan som enbart uppstår tack vare bristfälliga kundundersökningar.
Ett system för Text Mining som används är PCA, Psychological Content Analysis. Där kan programmet, genom analys av ordval, få fram vilken sinnesstämning en person är i när han eller hon skriver en text.
Ett annat verktyg är att arbeta med bilder, där varje situation illustreras med en bild, och de personer som besvarar frågorna får svara på vad de gjorde just före, under och närmast efter den situation som beskrivs på bilden.

Dove gjorde en kampanj som hette ”real beauty” med äldre nakna kvinnor

Kampanjen diskuterades på flera ställen på webben, bland annat på en diskussionssida som Dove satt upp enkom för ändamålet.Textanalysen visade vad som diskuterades, diskussionsmedlemmarnas åsikter samt olika psykologiska aspekter.

Dove kunde utifrån diskussionerna skapa tre eller fyra segment

Den vanligaste diskussionen var varför reklamfilmen var förbjuden i stora delar av USA, där det är ok att visa bilder på näst intill nakna tonårsmodeller, men inte på nakna äldre kvinnor. På så vis fick Dove reda på många av målgruppens tankar och åsikter, vilket var till stor hjälp då nya kampanjer skulle göras. Det går att få fram mängder av information från exempelvis LinkedIn, som är ett socialt nätverk där man rekommenderar forna kollegor och studiekamrater för varandra.

Skillnaden mellan manuell kodning och datamaskinell textkodning är enorm nu för tiden

Datorn kan både skapa fler och mer relevanta grupper. Datorerna kan även hitta små grupper av människor med helt avvikande åsikter, vilka normalt sållas bort i manuellt kodade textsvar eller texter på en diskussionswebbsida.

”Ett bra verktyg för textanalys kan löna sig mycket snabbare för företag som är intresserade av att få ut mer ur sina kundundersökningar och andra surveys.” Tom H C Anderson