
aDResearch ESIC
34
Nº 4 Vol 4 · Segundo semestre, julio-diciembre 2011 (Pág. 28 a 48)
do del segundo de González (23,05% por enci-
ma de la media) y el primero de Aznar (11,18%
por encima de la media). El más corto es el ter-
cero de González (17,61% por debajo de la me-
dia). No hay diferencias significativas en las lon-
gitudes dependiendo de que haya mayoría abso-
luta (9159 palabras en los discursos 3, 4, 5 y 8) o
de que no la haya (9251 palabras en los restantes).
Las palabras más frecuentes
La mayor parte de las palabras existentes en un
discurso pueden calificarse de palabras vacías
o palabras instrumento, correspondiendo a los
adjetivos indefinidos, artículos, adverbios, excla-
maciones, interjecciones, preposiciones y los pro-
nombres (demostrativos, indefinidos y relativos).
Hay 13 palabras, todas ellas son palabras va-
cías (stop words), que se repiten más de 1000
veces y que constituyen el 34,5% del total de las
palabras de los textos. Entre paréntesis se indica
la frecuencia de estas palabras: de (7115), la
(4685), y (3128), que (2967), en (2895), el (2578),
los (1904), a (1899), las (1407), del (1122), una
(1012) y para (1004). Este porcentaje aumenta
al 40,6% si incluimos las palabras un (986),
con (930), se (746), por (673), al (423) que se
encuentran entre 400 y 100 veces y los adver-
bios no (548), como (499), más (465) y el adjetivo
posesivo su (465). Los programas de ordenador
a veces consideran también como palabras va-
cías los verbos auxiliares (ser, haber) y los verbos
modales (deber, poder, saber, soler y querer).
Las palabras plenas o llenas con una frecuencia
mayor de 100 son los sustantivos política (391),
Gobierno (376), España (272), Estado (225), socie-
dad (208), años (168), ciudadanos (150), Señorías
(147), desarrollo (142), empleo (141), Cámara
(139), sistema (136), país (133), Comunidades
(125), económica (125), problemas (118), Consti-
tución (117), proceso (117), esfuerzo (112), políti-
cas (111), reforma (111), países (110), economía
(109), acción (108), legislatura (108), las formas
verbales es (618), ha (258), han (153), ser (139),
debe (127), son (125), hay (121), hemos (113),
hacer (103), y los adjetivos (excluyendo los pose-
sivos) social (180) y españoles (107).
Si analizamos las cien palabras más frecuen-
tes comprobaremos que suman 49814 ocurren-
cias, es decir, constituyen el 54,1% del total de
las palabras utilizadas.
3. Vocabulario especíco y palabras
características
La mayor información desde el punto de vista de
la comunicación no la proporciona el conoci-
miento del lenguaje común sino la determina-
ción del lenguaje propio de cada discurso y/o
cada orador. Un hapax (Tabla 1) es una palabra
que solamente aparece una vez en un texto. El
índice de reparto de Hubert y Labbé (1990) es
un instrumento para extraer las palabras que
aparecen de forma regular, aquellas que son co-
munes a todos los oradores y que se repiten de
forma homogénea dentro de los discursos.
En algunos casos, las palabras utilizadas de-
penden de aspectos formales, la forma de expre-
sarse del orador y que se repiten a lo largo del
tiempo, aunque no es fácil determinar qué parte
es formal y qué parte es intencionada. Por ejem-
plo, si la utilización de la primera o tercera per-
sona es solamente un aspecto formal o muestra
dos ideas distintas de formas de gobernar, la pri-
mera más personalista o presidencialista y la se-
gunda basada en un equipo de gobierno. Si ob-
servamos los números y fechas en la última
columna de la Tabla 1, podemos comprobar que
mayoritariamente aparecen en el discurso de
Suárez debido a la estructuración de su exposi-
adResearch_4_lib.indb 34 02/06/11 12:15