Bokrecension: Mining den sociala webben

Vad kan någon ta reda på om dina tweets, och de människor som retweet och svara på dem? Ganska mycket: trots att begränsas till 140 tecken, tweets inkluderar metadata som vilken typ av teckenkodning som de använder, och en hel del mer.

Rörlighet, Hands-on med en Samsung Galaxy S7 Edge på Republic Wireless: En bättre Wi-Fi-samtal erfarenhet, först ta: En tuff Android tablett för krävande miljöer, rörlighet, Hands-on med Plantronics Backbeat GO 3 och Voyager 5200 headset: perfekt för den nya Apple iPhone

Du kan se hur vänliga människor på Twitter och hur de är sammankopplade. Du kan se hur inflytelserik person är och vem de påverkar, som påverkar dem, som de tror talar om något intressant nog att upprepa (utan att snedvrids av hur ofta det intressant person tweets), om de bara följa och svara på människor som liknar dem, oavsett om de är i en stor eller liten klick av anslutna användare, oavsett om de människor de talar med mest är deras närmaste vänner – och om något av detta är besvarad. Och du kan se det för många fler människor än du kan analysera bara genom att bläddra igenom deras Twitter-flöde.

Detta är den typ av information som verktyg som Klout använder för att rangordna och poäng Twitter-användare, men rådata är tillgängliga och du kan gruvan upp till de sista 3.000 tweets för offentliga användare att analysera så att du kan ställa dina egna frågor. Du kan definiera en profil och leta efter Twitter-användare som matchar den, eller ta reda på vilken tid på dagen någon är mest sannolikt att tweet eller retweet. Och du kan få steg-för-steg-instruktioner för att göra nästan allt detta, tillsammans med visualiseringar av anslutningar och relationer, med hjälp av anvisningarna i Matthew A. Russell Mining den sociala webben.

Russell täcker också vad du kan härleda från Linkedin-profiler. Detta är både mer begränsad, eftersom även om du kan få en hel del information om personer i din Linkedin-nätverk, du kan inte ens ta reda på om två godtyckliga människor har något samband (ett medvetet beslut från Linkedin för att skydda användarnas integritet), och mycket rikare på grund av mängden av detalj som släpps ut på deras profil och hur strukturerat att informationen är. Liksom att se vilka du känner som någonsin haft ett jobb på ett företag du vill använda för (sånt Linkedin är redan användbar för), kan du se där människor med särskilda titlar är baserade, för att se om det är värt byggnad ett företag eller kör en workshop inom ett visst område.

Kapitlet om Facebook påpekar att man kan få en utvecklartoken i tio minuter, och föreslår intressanta gruv idéer som att analysera hur många människor har flyttat bort från där de växte upp eller var utbildade. Russell inte försumma det sociala nätverket som har den mest intressant information – inkorgen.

Boken börjar med ett citat från Tim Berners-Lee om den ursprungliga sociala natur webben: “Vi klumpar i familjer, föreningar och företag Vi utvecklar förtroende över miles och misstro runt hörnet.”. De verktyg och tekniker här kan du se hur sant det är. Ingen av dem skulle hjälpa dig bända in information som inte var offentlig i första hand, men det är en stor demonstration av ganska hur mycket av den information som vi lägger in i nättjänst är offentliga och tillgängliga för gruvdrift på följande sätt.

Om du vill använda programmeringsexempel i denna täta men pacy guide, måste du vara bekväm med Python och med dykning i koden. Men vad du får är användbara verktyg snarare än leksaks exempel. Det finns en del intressant statistik (endast hälften av tweets innehåller antingen en hashtag eller annan twitterer namn), en bra översikt över mängdlära och fascinerande omläggningar på vad du kan och inte kan göra med naturligt språk (om du vill bryta bloggar brunn) och idéer den semantiska webben. Det enda problemet är att boken behandlar ett sådant brett utbud av tjänster och informationskällor som det är bara ett smakprov för vad du kan göra genom gruvdrift var och en av dem – särskilt Facebook.

Om du bara vill ha en guide till hur mycket information kan utvinnas från sociala nätverk med en måttlig mängd kunskaper i programmering, kan du hoppa över de kodande detaljer och koncentrera sig på de förklaringar och förslag för vidare analys och visualisering. Du kommer dyka upp med en realistisk syn på vad den sociala webben faktiskt kan berätta om anslutningar, interaktioner och de avdrag du kan göra av dem.

Mining den sociala webben: analysera data från Facebook, Twitter, Linkedin och andra sociala medier platser; Matthew A. Russell, O’Reilly Media, 360 sidor, ISBN: 978-1-4493-8834-8, £ 30.99

mary Branscombe

Hands-on med en Samsung Galaxy S7 Edge på Republic Wireless: En bättre Wi-Fi-samtal erfarenhet

Microsoft pigg, först ta: Skapa engagerande innehåll på din smartphone

Xplore Xslate D10, först ta: En tuff Android tablett för krävande miljöer

Hands-on med Plantronics Backbeat GO 3 och Voyager 5200 headset: Perfekt för den nya Apple iPhone