Cartografiant #ciutatmorta

Featured

La reproducció del documental Ciutat Morta el passat dissabte 18 de gener al Canal 33 sembla que ha tingut un ressó especial a Twitter que s’ha convertit en un repositori de nombroses reaccions. El matí següent a la projecció vaig iniciar un procés d’extracció de tweets amb la paraula clau “ciutatmorta” i, en el moment en que escric aquestes línies, ja s’han recollit prop de 79.000 tweets publicats per més de 26.000 usuaris.

La visualització que acompanya aquestes línies s’ha construit a partir de les mencions i els hashtags presents en els tweets. Quan un hashtag o una menció coincideixen amb un altre hashtag o menció en el mateix tweet s’estableix un vincle entre els objectes. A diferència d’altres visualitzacions de xarxes de hahstags en el que es ressaltava les comunitats en forma de colors, la xarxa de #ciutatmorta preten aflorar els elements centrals del debat posterior al documental com si es tractés d’un mapa de calor. Així, els elements en vermell que també destaquen per la seva mida consitueixen els elements més referenciats. Els menys recurrents apareixen en blau i més petits.

 

Captura de pantalla 2015-01-21 a les 22.28.39

D’aquesta manera podem observar com, de moment, els dos elements centrals del debat són #totciutatmorta que aludeix a la censura d’una part del documental i #4f que posa sobre la taula de discussió el cas que centra el documental. En un altre ordre de rellevància i en carbassa trobem un conglomerat d’usuaris i hashtags que es corresponen a temes i actors importants en la discussió: patriciaheras, albertmtnez, reobrimelcas, 4freoboertura, RaholaOficial, xaviertrias, HiginiaRoig, etc.

La presència d’usuaris i hashtags representatius del seguiment mediàtic que està tenint el reportatge i el cas també és especialment significatiu: tv3cat, La_directa, maticatradio, elmonarac1, elperiodico, canal_33, jordievole, eldiarioes, etc.

Metodologia

Les dades s’han recollit i analitzat fent servir el TCAT i la visualització amb Gephi. Per a establir els colors i els tamanys dels nodes s’ha utilitzar la betwenness centrality que és un indicador de la centralitat d’un node dins d’una xarxa. Per tal de fer-la més entenedora s’han filtrat els retweets i només es mostren els principals hashtags i usuaris més recurrents. El hashtag ciutatmorta s’ha exclós de les visualitzacions per fer-les més entenedores.

Els hashtags de quan es va trencar la unitat del 9N

Featured

El dia 13 d’octubre a la nit, els diferents liders dels partits polítics que fins aleshores havien treballat plegats per organitzar la consulta del 9N (CIU, ERC, ICV-EUIA i CUP) abandonaven la reunió al Palau de Pedralbes amb les cares llargues. La unitat exhibida fins aquell moment s’havia trencat i Artur Mas i CIU es quedaven “sols” per tirar endavant el nou 9 N, ara sota la fòrmula d’un “procés participatiu”. A partir d’aquell moment Twitter començava a bullir: només entre el 13 i el 14 d’octubre es van publicar més de 115.000 tuits aludint directament al 9N.

La visualització que acompanya aquestes línies és una xarxa que relaciona els hashtags a partir de la seva coincidència en un mateix tuit. D’aquesta manera quan un hashtag coincideix amb un altre, apareixen enllaçats amb una línia. El tamany de les etiquetes es correspon amb la seva popularitat. La proximitat i els colors entre les etiquetes denota que aquests hashtags coincideixen més vegades dins els tuits. Tot plegat es fruit d’un procés algorítmic amb l’objectiu d’identificar els temes dels que la gent parvala i la relació entre aquestes temàtiques.

grau-15

Tenint en compte que els colors identifiquen “famílies” de hashtags resulta interessant veure la distribució: tenim el verd que aglutina els hashtags relacionats amb el suport a la consulta i Artur Mas (estemconvocats9n, totsambelpresident, votarem, etc.), el groc que es correspon amb opcions més de “tirar pel dret” (dui, plebiscitàries, marxemja, desobeïm, etc.), el violeta que recull les etiquetes més unionistes i beligerants amb la consulta i el president (9nfail, masgameover, butifarrendum, etc.), el vermell que uneix un grup de hashtags favorables a la independència, el rosa que, curiosament, agrupa les dues úniques etiquetes en estranger i que podem relacionar amb la “internacionalització del procés” i, a dalt a l’esquerra, el turquesa que correspon amb noms de formacions polítiques (erc, ciu, pp).

Una de les coses que em criden més l’atenció és la centralitat de l’etiqueta presidentmas que pot explicar-se tant pel ressó de la compareixença d’Artur Mas el dia 14 d’octubre com pel protagonisme derivat d’haver-se quedat sol defensant el nou format de consulta. Un altre aspecte curiós és la proximitat és la ubicació del hashtag votació9nTV3 dins la comunitat més independentista i el de 9n8aldia dins del sector unionista.

Metodologia:

Durant els mesos previs a la consulta del 9N vaig estar capturant tuits a partir d’una sèrie de paraules clau relacionades amb la votació i el procés sobiranista fent servir el DMI-TCAT. Es tracta d’un data set de dimensions considerables que aglutina més de 5 milions de tuits que document un moment molt interessant de la nostra història recent.

Per analitzar una quantitat tant ingent de dades és necessari trobar maneres per fer reduir la quantitat d’informació i una de les fòrmules que m’està servint per trobar millors resultats és a partir de les dates. Addicionalment, s’han exclós tots els retuits i s’han filtrat aquells hashtags menys recurrents.

 

L’Assemblea Nacional Catalana aconsegueix una mobilització rècord a Facebook per la diada

Featured

El passat mes d’abril junt amb Emili Prado vam presentar un paper al Congrés de Comunicació Política de Catalunya en el que analitzàvem l’activitat dels usuaris a la pàgina a Facebook de l’ANC en el context de les mobilitzacions per la diada de l’any 2012 i 2013. Aprofitant que l’històric d’aquella recerca hem recopilat les de juliol i agost d’enguany amb Netvizz per tal de fer algunes comparacions entre aquest any i l’any passat.

Els resultats marquen un creixement molt important de l’activitat dels usuaris que es manifesta en diferents apartats. Per una banda el nombre d’usuaris diferents que fan like, comenten o comparteixen els continguts passa dels 11.595 al mes de juliol de 2014 als 28.765 d’aquest any. I, a l’agost, de 21.097 a 40152.

Si ens fixem en els likes veiem com al juliol és quadrupliquen els indicadors de l’any passat i a l’agost representen més del doble. L’increment és menys pronunciat amb les comparticions que passen de 19.625 al juliol de 2013 a 27.213 quest any. I a l’agost de 19.599 a 33.194.

Participació al Facebook de l’ANC: juliol

Fb-anc-julio

Participació al Facebook de l’ANC: agost

fb-anc-agost

Predicció o símptoma

Si atorguem valor de predicció a aquests indicadors es pot preveure una participació a la via catalana 2014 superior a la de l’any passat. Tanmateix, aquest increment de participació, que no és altra cosa que un recull de mostres públiques d’adhesió i de col•laboració en la difusió de la crida a la mobilització, pot ser també un reflex del neguit que s’ha viscut per omplir tots els trams de la Via Catalana 2014, la suposada incidència del Cas Pujol en el procés i la segura impugnació de la llei de consultes que s’ha manifestat amb una major implicació dels usuaris a l’hora de donar suport a l’ANC.

El cas Pujol a Twitter (I): Dinàmica temporal i referències informatives

Featured

Uns pocs dies després de l’esclat del cas Pujol vaig programar l’eina d’extracció de dades per fer-ne seguiment a través de la captura de tots els tuits que contenen les paraules “pujol” o “pujolisme”. Evidentment, això vol dir que pot haver-hi un grapat de tuits que facin referència a altres Pujol i que altres tuits que parlin del tema però sense fer menció a alguna de les paraules clau n’estiguin absents. Amb tot, en els primers 23 dies d’agost he recollit 443.961 tuits publicats per 104.228 usuaris diferents que permeten analitzar de manera consistent alguns aspectes generals sobre el ressó que ha tingut el cas Pujol a Twitter

Dinàmica temporal

En la gràfica de tuits i retuits observem com l’activitat durant els primers dies d’agost va ser molt elevada (feia pocs dies que havia saltat la notícia) i amb una clara tendència decreixent que podria fer pensar en un refredament del cas si no fos perqué a partir del dia 19 hi ha un rebrot d’activitat. Un altre aspecte que es pot veure en aquesta gràfica és quina part dels tuits eren “originals” i quina part retuits.

dinamica-pujol

Referències informatives

Dels quasi 440.000 tuits n’hi havia 224.933, més de la meitat que contenien enllaços a pàgines web que d’alguna manera consitueixen la referència informativa a Twitter del cas Pujol. Seleccionant els 25 dominis més enllaçats apareixen les principals capçaleres de la premsa digital a Espanya amb El Economista, Eldiario.es i ABC en les tres primeres posicions. Crida l’atenció l’absència de El Pais i El Mundo liderant el ranking i el paper secundari de les capçaleres “made in catalonia” com La Vanguardia, El Periodico o l’Ara.

dominis-pujol

Evidentment, les dades exposades són força superficials i més enllà de permetre flairar la magnitud del que s’està parlant i del tipus de mitjans referenciats no aporten gran cosa. En els propers dies espero poder aprofundir una mica més en l’anàlisi i veure fins on donen de si les dades recollides.

 

 

Tots els hashtags del president Mas

Featured

Aprofitant la visita d’Artur Mas a Mariano Rajoy vaig preparar l’eina dmi-tcat per recollir tuits que fessin referència a Artur Mas. L’interès, a més de veure la valoració que feien els tuitares de l’actuació del president de la Generalitat, era veure fins a quin punt el cas Pujol planava sobre la trobada i el procés. A partir de més de 22.000 tuits realitzats per més de 10.000 usuaris diferents em vaig fixar en els hashtags utilitzats i en com aquests convivien amb altres hashtags. Igual que en l’anàlisi de marca Catalunya i el Sónar la mida de les lletres i els nodes representa la seva recurrència i les línies que uneixen els hashtags vol dir que aquests han coincidit en un mateix tuit. Els colors identifiquen famílies de hashtags. És a dir, hashtags que estan més relacionats entre sí.

La majoria de hashtags es corresponen amb mostres de suport al president, al procés i a la consulta. L’excepció la trobem a la família d’etiquetes de color verd turquesa on l’ombra del Cas Pujol es fa més evident. És interessant, però, veure com a més Vivaespaña, ciugameover, pujolensroba apareixen vinculats 4 hashtags que identifiquen els casos de corrupció més notoris dels darrers anys: urdangarin, gurtel, eros i Pujol.hashtags-mas

La marca Catalunya a Twitter: xarxa de hashtags de la primera setmana d’estiu

Featured

Per trastejar una mica més amb l’eina d’extracció i anàlisi de dades de twitter DMI-TCAT he reproduit la metodologia utilitzada per representar la xarxa de hashtags del sònar de dia 2014 però en aquest cas amb un data set que inclou tots els tuits on apareix la paraula Catalunya en els diferents idiomes de la Unió Europea. Durant la setmana que va del 22 de juny al 28 s’han registrat més de 28.000 tuits publicats per 16.500 usuaris diferent.

Aprofitant les funcions que venen incorporades a l’eina he mirat de representar la xarxa de hashtags establint un enllaç entre cada un dels nodes cada vegada que un hashtag coincideix amb un altre en el mateix tuit. Els cercles -nodes- representen cada una dels hashtags i són més gran en funció de la seva recurrència. Les línies -arestes- marquen que un hashtag ha coincidit amb un altre en el mateix tuit, si és més gruixuda vol dir que ha coincidit més vegades. El color representa diferents famílies de hashtags és a dir aquells que estan significativament més entrellaçats entre ells que amb la resta de hashtags. La xarxa s’ha filtrat per mostrar només els hashtags més recurrents.

catint-setmana01

Si donem per suposat que els tuits i els hashtags representen d’alguna manera els temes de l’actualitat catalana podem dir que la primera setmana d’estiu ha estat com un anunci d’Estrella: sol, platja, festa i amor. La major part dels hashtags de la comunitat principal (verda) coincideixen amb tots els tòpics estivals (platja, love, sun, etc.), destins turísitics (Barcelona, Costa Brava, Sitges, etc.) i la revetlla de Sant Joan. A més, una altra festa ancestral com la Patum de Berga constituint una comunitat (vermella) junt amb el Corpus.

A més del turisme i la tradició podem observar un parell de hashtags directament relacionats (9n2014 i independència) amb el procés independentista que constitueixen una comunitat diferenciada (lila) i les etiquetes que delaten la important presència de fotos provinents d’Instagram.

 

La xarxa de hashtags del sònar de dia 2014

Featured

Una de les eines que estic fent servir per la meva tesis és el Digital Methods Iniative – Twitter Capture and Analysis Toolset (DMI-TCAT) desenvolupada per Erik Borra i Bernhard Rieder de la Universitat d’Amsterdam. Com el seu nom indicia l’aplicació permet capturar tweets a partir d’una llista de paraules amb la única limitació de que la consulta realitzada no superi el 1% del volum de tweets publicats a escala mundial i la impossibilitat d’accedir a tweets publicats previ a l’inici del procés de recollida de dades. A més, l’eina proporciona diferents outputs a partir de diferents models d’anàlisi que inclouen descripció estadística de les dades i arxius en format  graf apte per a la visualització amb Gephi. El DMI-TCAT està disponible a github i hi ha un magnífic paper que en descriu el funcionament i objectius.

Per trastejar una mica amb l’eina vaig programar una captura que contingués un seguit de paraules relacionades amb el sònar i hem pogut acumular un data set amb vora de 50.000 tweets realitzats durant l’edició d’enguany del Festival Sonar. Aquest cap de setmana, després d’un primer encontre amb les dades en una sessió handson, he pintat aquesta una visualització que correspon als hashtags més utilitzats en relació al sonar de dia.

Cada un dels nodes d’aquesta xarxa es correspon a hashtags i les arestes expressen la coincidència en el mateix tweet amb un altre hashtag. D’aquesta manera podem veure la relació entre artistes i escenaris, per exemple. Els colors identifiquen les diferents comunitats i es correspon amb els escenaris del sonar de dia i el sonard. També apareix representada una comunitat relacionada amb una activitat de nit com és el concert de massive attack.  S’han exclós del graf els hashtags genèrics del sònar i del sonàr de dia per mostrar més clarament les diferents comunitats i relacions entre hashtags.

graf-sonardia

El que agrada a Convergència i Unió

He seguit treballant amb les “like networks”, una de les funcionalitats més recents de Netvizz i que permet crear una xarxa de pàgines connectades a través dels “m’agrada” que s’han fet mutuament. En aquesta ocasió la visualització representa el “like network” de la pàgina a Facebook de Convergència i Unió.

Captura de pantalla 2014-02-20 a les 09.52.48

Igual que en la visualització de la xarxa de “likes” d’Iniciativa per Catalunya, els colors identifiquen pàgines que comparteixen els mateixos gustos. Així, el vermell és pels membres del partit, el taronja pels mitjans de la Corporació Catalana de Radio i Televisió, el blau i el blau verd per pàgines relacionades amb l’activitat cultural de Barcelona (amb el CCCB, el Festival Grec i la revista Time Out, per exemple) i a l’extrem esquerre, més allunyades, podem veure un blau gris que és per pàgines relacionades amb el Fútbol Club Barcelona.

La important presència dels mitjans de la Corporació i els clústers de la cultura barcelonina al graf resultant es deu més a la interconnexió dins el sector cultural que no pas a la seva relació directa amb la pàgina de CIU. En el procés d’extracció amb Netvizz es va optar per dos nivells de profunditat. És a dir, les pàgines que agraden a la pàgina de ciu més les pàgines que agraden a les pàgines que agraden a CIU. Crec que la distribució resultant és deu a haver topat amb algunes pàgines de Facebook molt ben connectades.

Repetint el procés amb un sol nivell de profunditat obtenim un graf més entenedor i que, probablement, s’ajusta millor a l’estructura interna de la formació.

ciu-like-network

El que agrada a Iniciativa per Catalunya

Fa uns dies vaig descobrir una nova funcionalitat de Netvizz que permet obtenir un graf amb totes les pàgines de Facebook que agraden a una determinada pàgina. Sense estar molt segur del que em podia trobar vaig crear aquest arxiu de la pàgina d’Iniciativa per Catalunya i després de treballar-ho una mica amb gephi vaig obtenir aquesta visualització.

like-graf-iniciativa

Els colors venen determinats per la modularitat, una mètrica que serveix per identificar comunitats dins les estructures de xarxa. En aquest cas identifica pàgines que s’agraden mutuament o tenen gustos similars i troba 5 comunitats. El blau correspondria a estructures del partit i polítics destacats, el vermell al sector juvenil de la formació, el groc a pàgines de diferents moviments ecologistes, el gris verdós a defensors dels animals (i a l’Eduard Punset!) i el taronja dona la impressió que engloba tota la resta.