dijous, 6 de juny del 2013

Estudi lexicomètric amb el programari Concordance

Concordance és una eina per a treballar un text en detall de qualsevol àmbit. Una "concordance" és un índex que ens porta a totes les ocurrències de cada mot en el text a estudiar. I així aquesta visió d'un mot en context permet establir comparacions i estudiar de moltes maneres el seu significat i ús.

Principalment, Concordance permet les següents operacions d'anàlisi de mots:

- llistar algunes o totes les paraules d'un text i reordenar-les sota diverses perspectives i mostrar el nombre d'aparicions al text.
- pot cercar i mostrar llistes de mots on cada aparició de cada mot es mostra en el seu context, extret del mateix text estudiat.
- es pot demanar fer la "concordança" de tot el text treballat.
- podem cercar el o els mots que vulguem a la llista amb opcions de cerca avançada.
- podem tenir oberts al mateix temps i interactuar sobre el text original, la llista dels mots seleccionats i les "concordances". 
(Joan Campàs: Breu tutorial del Concordance Escriptures hipertextuals) 

El blog que he escollit per fer l’anàlisi Concordance ha estat “Deu Mil en xarxa per l’Autodeterminació”. Nascut arrel la publicació de l’article “Perplex, jo?” d’Enric Canela, la iniciativa ha sorgit de la societat civil sense el paraigües de cap partit polític, mantenint l’esperit d’iniciativa popular.  L’objectiu perseguit per l’entitat és aconseguir l’autodeterminació de Catalunya i la formació d’un Estat propi, que formi part de ple dret a tots nivells en el pla internacional.

Els post analitzats amb el programari corresponen a cinc entrades del blog: 


En la taula mostrada, les paraules corresponen, feta la tria i rebutjats adverbis, pronoms, connectors, nexes, etc. (mitjançant l'opció stoplist) a les més utilitzades en les cinc entrades. La columna del centre són el nombre de repeticions de les paraules i la columna de la dreta el percentatge que representa cada una sobre el total. 

El nombre total de paraules ha estat de 4.120, de les quals 1299 s'han donat per bones. S'han descartat per ser irrellevants en l'anàlisi també les de una sola repetició, quedant com a més significatives les que es repeteixen, almenys, un parell de vegades. 

Finalment, i com era d'esperar, donades les característiques del blog, les paraules Catalunya, Espanya, Independència o Estat... són les que es troben al top list amb 18, 10, 10 i 8 repeticions cada una. 

A banda, també tenen una presència destacada paraules relacionades amb l'àmbit polític com consulta (5 rep.), PP (4 rep.), polític/a (3 rep.), parlament (3 rep.) o diputat (2 rep.)

Veiem doncs, que el programari Concordance ens serveix per elaborar llistats i ordres de preferència, cosa que pot ser molt útil quan hi ha molts text a revisar per tal de discriminar temàtiques

1 comentari:

  1. El primer nom propi és Duran. És el coco de l'independentisme? De veritat és tant important? O és una excusa, una manera de culpabilitzar algú si això no tira endavant?

    ResponElimina