INVESTIGACION

Estadistica
Mas documentos

Portada - Arqueología, Prehistoria Plan docente en la pagina oficial del Departamento de prehistoria, Universitat Autónoma de Barcelona Datos personales - curiculum academico Investigación arqueologica, proyectos, artículos, ensayos...
 
 
 
Juan A.Barcelo
Profesor titular de prehistoria
Facultat de Lletres. Edifici B (B9-119) Bellaterra, SPAIN
 
   
  ARQUEOLOGÍA: Tecnica y Tecnología
 

LA NECESIDAD DE LOS MÉTODOS CUANTITATIVOS EN LA INVESTIGACIÓN ARQUEOLÓGICA

(1999)

 
1.¿Para qué Sirve la Estadística en Arqueología?  
La frecuente publicación
de aplicaciones estadísticas en Arqueología, más allá
de ser una simple moda o justificación de la “cientificidad” de nuestra
disciplina, como algún autor supone, indica la considerable madurez
teórica y metodológica de la investigación arqueológica
contemporánea.

Durante mucho tiempo arqueólogos y arqueólogas han permanecido absolutamente ajenos/as a esta cuestión. O bien no se les ocurría que sus datos arqueológicos podían ser interpretados con ayuda de métodos matemáticos, o bien negaban explícitamente esa posibilidad, creyendo que lo único que había que hacer era encontrar una fecha para los cacharros que desenterraban. En los últimos años, sin embargo, son muchos los investigadores y las investigadoras que han descubierto la necesidad de sustituir explicaciones tradicionales por estudios más completos e interdisciplinarios.

Ahora bien, el uso de las matemáticas y los números no es ninguna panacea. Podemos usar la estadística sin finalidad alguna, como si el mero hecho de traducir en números nuestras observaciones arqueológicas fuese ya bastante. ¿Qué sentido tiene decir que han aparecido 700 fragmentos de cerámica, o que el peso de todos los huesos de ciervo encontrados en esa cueva llegaba a los 5.123 gr.? Esta forma “a-crítica” de usar la estadística y la cuantificación en arqueología es resultado de una visión, desgraciadamente muy generalizada, que considera a la arqueología como una "Ciencia" de segundo orden que debe aceptar sin rechistar lo que otras disciplinas, mejor equipadas, conocen mejor. De ese modo, se han usado las viejas teorías antropológicas y/o históricas como si se tratase de axiomas fundamentales de la dinámica social. En muy pocos casos se ha intentado reevaluar esas teorías a la luz de los descubrimientos arqueológicos. Aún peor, prácticamente nunca se ha señalado el ámbito específico de la arqueología en el estudio de la sociedad humana. ¿Qué es lo que las matemáticas pueden añadir, como no sea introducir una nueva forma de descripción?

No es mi propósito aquí resolver una cuestión que afecta a todos y todas los/las profesionales de la arqueología, sino abordar un pequeñísimo aspecto de esa cuestión. ¿Qué es lo que la estadística y las matemáticas pueden aportar al debate sobre la naturaleza propia de la investigación arqueológica?

Para describir la estructura interna de las sociedades humanas, no me cabe la menor duda que antropólogos y sociólogos están mucho mejor preparados que nosotros, arqueólogos y arqueólogas. ¿Quiere esto decir que debemos resignarnos a una función de meros comparsas en este juego? Mi respuesta es un rotundo NO. Existen muchas brechas en el modelo sociológico, debidas, fundamentalmente a dos cuestiones: el excesivo particularismo propio de los estudios etnográficos y sociológicos, y la ausencia de un adecuado tratamiento del aspecto dinámico de los procesos implicados. El análisis sociológico se basa en el examen sincrónico de una estructura social, y en tanto que descripción exhaustiva del mismo, sus posibilidades son mucho mayores que las de los estudios arqueológicos, limitados por la naturaleza de sus datos (una reducidísima parte de la llamada Cultura Material). Por otro lado, el interés y la profundidad de ese análisis sincrónico lleva a olvidar cuestiones dinámicas, diacrónicas, consideradas "menores" y aptas para disciplinas de ”segundo orden” como la Historia.

Arqueólogos y arqueólogas, si somos algo, somos historiadores e historiadoras. Debemos aceptar que ninguna Ciencia Social puede existir por sí sola, al margen de las demás. Por consiguiente, nuestro objetivo debiera ser completar la visión propuesta desde la antropología y la sociología. La nuestra no debiera ser una visión alternativa, sino complementaria a la ofrecida por otras disciplinas. No debiéramos intentar la descripción sincrónica una sociedad en una época y lugar concreto, sino estudiar la dinámica de esa sociedad a lo largo de dilatados periodos de tiempo. El registro arqueológico es demasiado limitado como para que podamos reconstruir con fidelidad la manera en que intercambiaban objetos los grupos sociales del Bronce Final en el sur de la Península Ibérica, pongamos por caso. Se ha perdido demasiada información como para que perdamos el tiempo aventurando qué es lo que pudo haber pasado. No obstante, aunque parciales e incompletos, nuestros datos nos permiten inferir qué secuencia de cambios y transformaciones tuvo lugar. La pregunta a resolver es, en realidad, si detrás del simple desplazamiento espacial de un objeto puede revelarse la multiplicidad de explicaciones posibles de los mecanismos que han causado tal desplazamiento. No hay nada herético en esa pretensión: un átomo no puede ser observado y sin embargo se sabe que existe por las evidencias indirectas (rastros de energía) que deja a su paso. Eso es lo que debemos averiguar: qué rastros deja un determinado proceso histórico en el registro arqueológico, aunque dicho proceso no sea observable.


 
2. Causas y Efectos.  
En otras palabras, el objetivo de la
Arqueología consiste en estudiar los cambios que experimenta una sociedad
a través del tiempo, determinando el esquema de regularidad que pudiera
existir en la secuencia de esos cambios, y el grado de dependencia entre
la sociedad del presente (el mundo en el que vivimos) y la secuencia de sociedades
que la han antecedido. Lo que nos interesa es una investigación de
las causas de los fenómenos sociales que observamos aquí y
ahora.

Una explicación causal es, sin embargo, algo más que una simple cadena de inferencia que lleva de un hecho a otro considerado como su efecto. Hay que admitir diferentes tipos de causalidad. En ocasiones, el acontecimiento A será causa del acontecimiento B por la simple razón de que uno es la traducción, en otro nivel de descripción, del restante. Otras veces, “causa” tendrá un significado de causalidad física: cuando dos procesos se cruzan y las modificaciones producidas persisten tras la intersección, ésta recibe el nombre de interacción causal. Por consiguiente, un proceso causal es aquel que transmite información y es capaz de propagar una modificación en su estructura como resultado de una interacción. Por ejemplo, cuando dos acontecimientos aparecen asociados, y además existe un acontecimiento previo que es la causa común y que explica la falta de independencia entre ambos. Existe una relevancia causal directa entre dos acontecimientos o dos procesos si podemos descubrir al menos un proceso causal que los conecte y si ese proceso causal es responsable para la transmisión de influencia causal de uno a otro. Existe una relevancia causal indirecta si dos acontecimientos o dos procesos son resultado de una causa común.

Imponer una tal estructura causal como representación de los cambios formales que a lo largo del tiempo ha experimentado el registro arqueológico permite explicar la Dinámica Social, ya que situamos el fenómeno en su nexo causal, describiendo los procesos causalmente relevantes y las interacciones que lo han llevado a tener la forma particular que manifiesta ante nosotros.

La afirmación de procesos causales, entendidos como “relaciones” entre los elementos discretos en los que se puede descomponer analíticamente la realidad social, es más adecuada que determinar la existencia de relaciones funcionales y/o de compatibilidad entre esos mismos elementos. Por esa razón, si queremos explicar la acción humana, esto es, hablar acerca de nosotros mismos, tendremos que señalar los procesos causales (históricos) que nos han llevado a la situación directamente perceptible que pretendemos tratar.

Es precisamente aquí donde entran las Matemáticas, ya que constituyen la única manera de analizar las relaciones de causalidad. En otras palabras, usaremos cálculos matemáticos para conocer qué actividades, que fenómenos sociales están relacionados entre sí, y cómo esas relaciones generan modificaciones, propagando una determinada estructura causal.

 
3. Variabilidad y medición de la Causalidad.  
¿Cómo podemos llevar
a cabo esa investigación de las causas y efectos de la Interacción
Social? A través del estudio estadístico de la variabilidad
existente en los datos arqueológicos. La variabilidad es la característica
fundamental que poseen los individuos de determinado conjunto, según
la cual, sus propiedades son diferentes de un individuo a otro. La ESTADÍSTICA
es aquel modo de razonamiento utilizado en la descripción e interpretación
de esa variabilidad.

El diccionario define variabilidad mencionando que está relacionada con la calidad de variar, esto es, de cambiar y transformar. Algo variable es algo que cambia. ¿Qué es lo que cambia en nuestro caso? Los DATOS, o sea, las observaciones puntuales que hemos ido haciendo en el registro arqueológico (vasijas, puntas de flecha, tumbas, muros, poblados, etc.). Por consiguiente, la variabilidad existente en un conjunto será un resultado del tipo de ordenación que podamos establecer entre los elementos de dicho conjunto. Es aquí donde entran las matemáticas, ya que, en realidad “matemática” significa Ciencia del Orden Calculable.

¿Por qué decimos que la Investigación Arqueológica es una disciplina matemática? Porque el registro arqueológico, en tanto que evidencia de una actividad social pasada puede expresarse en términos de ordenaciones de objetos. Aquí matemático significa: “de acuerdo con un orden calculable”.

Hemos de tener bien presente que la Matemática no es una propiedad de la naturaleza. No hay cosas y fenómenos de tipo matemático y otros que no lo sean, sino que siempre que expresemos una idea por medio de relaciones de orden entre sus componentes, estaremos expresándola matemáticamente. La Matemática es, por tanto, un lenguaje artificial usado para representar cosas. Los enunciados




2 2 = 4
la cerámica está barnizada


son formalmente idénticos, aunque su contenido no
sea intercambiable fácilmente. Teóricamente, puedo expresar
una suma en palabras, al igual que puedo expresar las calidades de un objeto
mediante números, pero ello supondría forzar los límites
del lenguaje. ¡Sería como usar bombas atómicas para matar
mosquitos!

Convengamos, pues, que cada tipo de lenguaje sirve para representar fenómenos distintos. Por extensión, diremos que un fenómeno que sólo puede expresarse matemáticamente es un fenómeno matemático, no porque lo defina una propiedad "numérica", sino que es distinto de los fenómenos describibles mediante palabras.

Estudiemos las características principales de este lenguaje matemático. Su unidad significativa básica (el signo) es un concepto que recibe el nombre de CANTIDAD. El uso habitual de la palabra indicaría que es un tipo de propiedad: ciertas entidades tienen cantidades y otras no. Podríamos definirla entonces como: aquella propiedad de las entidades que admite una gradación; en definitiva, cualquier propiedad que permita una ordenación de las entidades es una cantidad. Por consiguiente, la cantidad será el opuesto de aquellas propiedades absolutas que no admiten grados y que no generan ordenaciones. Llamaremos MEDICIÓN a la operación de asignar números que representen el grado en que un objeto o fenómeno tenga la propiedad CUANTITATIVA a la que se ha hecho referencia.

Los filósofos no están de acuerdo a la hora de investigar estos conceptos. Para algunos (enfoque positivista), la cantidad es una propiedad inherente a los objetos, por lo que existe antes que tenga lugar la operación de medir. La cantidad no sería una consecuencia de la observación, ni sería el observador el que la impondría, sino una característica propia e intransferible del objeto observado. Para otros filósofos (enfoque subjetivista) la cantidad no existe antes que el proceso de medición tenga lugar. No hay cantidades en la naturaleza, sino operaciones de medida artificiales, que proporcionan unos resultados más o menos coherentes. Como en todo, siempre hay terceras vías; así, según los partidarios del enfoque relacional, una cantidad existe si y solo si existe una relación cuantitativa entre dos objetos. Un objeto tendrá, pues, una cantidad de algo si toma parte en una relación cuantitativa. Pero, ¿qué es una RELACIÓN CUANTITATIVA? Una relación de orden, tal que:




A  es mayor en q  que B
A  es igual en q  que B
A  es menor en q  que B


Por ejemplo, un objeto A es de menor tamaño (q )
que otro objeto B. "Tamaño" es aquí una cantidad. Pero no todas
las cantidades son iguales, sino que variarán según la relación
de orden que se pueda establecer. Los usos de las distintas cantidades serán,
obviamente, distintos. Consideremos el siguiente ejemplo: un objeto A es
del mismo color (q ) que otro objeto B. Aquí "color" es una cantidad,
ya que permite una relación cuantitativa, si bien ésta es muy
distinta a la establecida por la propiedad "tamaño". Las cantidades
basadas en la relación (“igual que”: =) son, en realidad pseudo-cantidades;
las cantidades "reales" son aquellas basadas en los tres operadores de orden
(“igual que”=,”menor que”<,”mayor que”>).

En definitiva: existe una CANTIDAD si cierta propiedad permite ordenar un conjunto de objetos y esta relación de orden cumple las propiedades algebraicas clásicas (Reflexiva, Antisimétrica, Transitiva). Llamaremos MEDICIÓN a la asignación de números a ciertos objetos o acontecimientos de acuerdo con un criterio objetivo. Es decir, no podremos medir un objeto aislado (que no forme parte de un conjunto “ordenado”), a no ser que lo comparemos con los objetos existentes en un conjunto de materiales ordenados de referencia. Es esa “ordenación de referencia” a la que nos referiremos como “criterio objetivo” de la medición. Ya que toda asignación de números es una función, dicho criterio objetivo podrá expresarse por medio de la función que explique la ordenación de objetos o acontecimientos. En otras palabras, la función matemática es la regla que necesitamos para asignar números a objetos de acuerdo con su ordenación. Dispondremos de una ESCALA DE MEDIDA si y sólo si disponemos de un criterio de ordenación relevante y de una función aritmética, algebraica o proposicional que lo represente. Si esa función es aritmética o algebraica, el orden de los objetos será numérico, y todas las relaciones de orden se expresarán mediante números (ESCALA NUMÉRICA). Si por el contrario, la función es proposicional, asignaremos tan sólo valores de Identidad o Diferencia (Si, No, Presente, Ausente). La escala resultante será NOMINAL.

Son precisamente los cambios en la apariencia física o en la ubicación espacial de los artefactos arqueológicos los que nos permiten ordenarlos. Denominaremos, por tanto, VARIABLE al aspecto (o concepto) cuyos cambios sucesivos condicionan la ordenación. Es fácil de ver, que el término variable es sinónimo del de propiedad cuantitativa. MEDIDA es la técnica de observación y registro que nos permite registrar esos cambios, siempre y cuando pongamos en relación un objeto con cierta “variabilidad” previamente conocida (la de un conjunto de referencia).

Para “medir” conjuntos de individuos usamos la analogía con ordenaciones consideradas de referencia. Las escalas de medida habituales (el metro, el kilo, el grado centígrado) constituyen ordenaciones de objetos según las propiedades cuantitativas longitud, peso, temperatura. Podemos medir la longitud, el peso y la temperatura de cualquier individuo porque se han obtenido previamente unas ordenaciones de objetos (varillas o bolas de metal, columnas de mercurio). Por ejemplo, para ordenar una serie de objetos de acuerdo a su temperatura, necesitamos de una ordenación de materiales (agua) en diferentes estados. El punto de partida de la ordenación (hielo) ocupa el lugar 0; el último lugar (100) se ha reservado arbitrariamente para otro estado físico del agua (vapor). Llamaremos instrumento de medición, a un aparato que implemente de algún modo la ordenación considerada de referencia. En resumidas cuentas, lo que hemos de hacer es definir ordenaciones “teóricas” y a continuación establecer analogías entre los elementos ordenados en esa escala de referencia y los objetos que deseamos ordenar en un nuevo conjunto.

Dada una población cualquiera de datos, son innumerables las ordenaciones que podemos hacer con los mismos. No sólo hay cantidades tales como longitud, tamaño, peso, etc., fácilmente mesurables por la universalidad de sus instrumentos de medición. Toda ordenación esconde una cantidad; pero muchas de ellas son muy difíciles de descubrir, ya que no hay acuerdo entre los científicos a la hora de construir los imprescindibles instrumentos de medición.

¿Qué significa, entonces, "medir" la conducta humana? Simplemente ordenar los resultados o efectos de la misma, de acuerdo con escalas de referencia previamente construidas. Lo único que debemos tener presente es que la ordenación de los objetos sociales es distinta a la ordenación de los objetos físicos, porque unos y otros tipos de objetos son distintos, y las propiedades cuantitativas en las que se basan las relaciones ordinales son distintas. No tiene sentido medir la longitud de una acción social, pero sí su intensidad, por ejemplo. Los problemas en Ciencias Sociales radican en los Instrumentos de Medida, no en las ordenaciones; y esos problemas pueden resolverse convirtiendo las ordenaciones en funciones matemáticas y usándolas como si de un instrumento se tratara

 
4. Medición de la actividad social  

Si una medida es el resultado de una ordenación previa,
¿de quién depende esa ordenación? ¿Acaso las
medidas son entidades reales, o el resultado del capricho del investigador?
¿Qué crédito mereceremos si nos inventamos las mediciones?
En definitiva, ¿cómo ordenaremos los objetos para construir
instrumentos de medida y así poder observar propiedades cuantitativas?

No parecen haber problemas a la hora de “medir” la antigüedad de un artefacto arqueológico (radiocarbono), o ciertas propiedades cuantitativas tales como la “extensión” de un poblado, el “volumen” de una cerámica, o la “longitud” de una espada, pero qué sucede con propiedades cuantitativas como la “división social del trabajo”, la “complejidad” o el “poder”, o la “intensidad” de determinado conflicto social. Si nuestro propósito es estudiar la causa de dicho conflicto social, no usaremos medidas tales cómo la longitud de espadas o el volumen de ciertas vasijas, sino medidas acerca de la “intensidad” de ciertas propiedades cuantitativas de la propia estructura social. Debemos construir, pues, instrumentos de medida sociales.

¿Cómo se construye una escala de medida? Analizando la regularidad existente entre distintas medidas de una propiedad cuantitativa observadas en un conjunto considerado de referencia. Tengamos presente tan sólo una cosa: que toda medida por muy exacta que pueda parecer, será fiable tan sólo en la medida en que sean fiables las observaciones en las que se basa. Si observamos mal, si creemos percibir cierto fenómeno, pero lo describimos incorrectamente, o alteramos su naturaleza mediante nuestra descripción, las medidas resultantes, por numéricas que puedan ser, no servirán para nada. Por consiguiente, la clave no está en los números (las escalas de medida), sino en la manera en que investigadores e investigadoras usan esos números para describir ordenaciones de objetos que ven o creen percibir.

¿Qué ordenación es fruto de una observación y cual no? Sólo observaciones experimentales llevarán a ordenaciones útiles y a medidas relevantes. Es decir, necesitamos ordenaciones de datos registradas en circunstancias controladas. CONTROL es la palabra clave. Consideraremos una situación experimental, aquella en la que las condiciones de observación han sido controladas. Sólo en las siguientes condiciones podremos obtener una medición correcta:

la ordenación de objetos ha sido observada en circunstancias experimentales
el criterio de ordenación se ha establecido en términos formales (aritmético, algebraico o proposicional)
existe una función que asigna un número a cada uno de los lugares ordinales observados de acuerdo con el criterio de ordenación.
Supongamos que para un estudio arqueológico estamos interesados en analizar las causas de la “interacción social”. Un criterio observable de ese concepto es el intercambio de objetos entre distintos agentes sociales (ya sean individuos [tumbas], familias [casas], o grupos [poblados]). Por consiguiente, si medimos la intensidad de la Interacción social partiendo de la cantidad de bienes intercambiados, necesitaríamos las siguientes “medidas sociales”:

Cantidad de bienes de uso de fabricación no local
Cantidad de bienes de prestigio de fabricación no local
Diversidad de bienes de prestigio de fabricación no local
Diversidad de materias primas de origen no local
Diversidad de subsistencias de origen no local
Cantidad de bienes producidos por un único taller especializado
Grado de desgaste de los bienes de intercambio
Valor de cada uno de los bienes de intercambio
Grado de complejidad -cantidad y complejidad de trabajo- de cada uno de los bienes de intercambio encontrados.
Grado de diversidad de las actividades de producción
Grado de Autosuficiencia y segmentación de las actividades productivas
Grado de complejidad de los bienes de producción encontrados
Densidad de estructuras de residencia en cada punto
Proximidad subjetiva a la fuente de materias primas (dificultad de acceso)
Proximidad subjetiva al centro de producción (dificultad de acceso)
Similaridad de cada uno de los bienes de prestigio encontrados en ese punto con los elaborados en el centro de producción más cercano.
Grado de control de accesos de los centros de producción y fuentes de materias primas
Extensión del área de influencia y dominio alrededor de cada yacimiento
La mayoría de estas medidas son de “nivel medio”, ya que ni son tan simples como la “longitud de una espada”, ni tan abstractas como “grado de complejidad de una sociedad”, o “intensidad” de las relaciones de poder. Existen instrumentos de medida para todas ellas. Así, en muchos casos se trata tan sólo de frecuencias relativas de aparición (estandartizadas con respecto a la superficie del yacimiento excavada); en otros casos se trata de medidas de distancia espacial o de diversidad, esto es, el número de individuos distintos en un conjunto. Fijémonos que las entidades medidas son distintas en cada caso. En algunos casos ordenamos artefactos (bienes de intercambio), en otros ordenamos asentamientos (control de accesos, extensión del área de influencia). Las medidas más complejas son las que hacen referencia al “grado” de control, o de “complejidad”. En esos casos podemos hacer referencia a escalas de medida existentes o construidas ex-profeso, por ejemplo, un artefacto es tanto más complejo cuantas más actividades distintas (obtención materia prima, separación mineral-metal, fundición, ....) sean necesarias para su producción. Un yacimiento es más “complejo” que otro cuanta mayor sea la inversión en edificios suntuarios, por ejemplo. Estas medidas son, claramente, ordenaciones relativas (primero, segundo, tercero) antes que absolutas.

 
5. El Análisis de las Relaciones de Causa y Efecto
 
5.1. Introducción  
¿Cómo podemos llevar
a cabo esa investigación de las causas de la Interacción Social?
A través del estudio de la variabilidad existente en las medidas
que hemos tomado y por medio de la CO-VARIACION, esto es, comparando variables,
y observando de qué manera los cambios de una coinciden con los de
otra, hasta el extremo de preguntarse si los condicionan o no. La comparación
de individuos y objetos es el mecanismo fundamental para resolver nuestros
problemas de índole causal. ¿Por qué la “comparación”
y no otro método?
 
5.2. El concepto de COMPARACIÓN.  
Estas palabras la usamos en Arqueología
cuando intentamos responder a preguntas como:

¿Hay alguna diferencia significativa entre la cerámica X1 del Nivel I y la cerámica X2 del Nivel II?

¿Procede esta muestra de útiles líticos de una población conocida cuya característica principal es la de ser raspadores de 12.5 cm. de diámetro?

¿Es diferente la proporción de cerámicas del Tipo A en tumbas femeninas en estas cinco necrópolis?

Como veremos en las páginas que siguen, lo que hacemos al plantear esas preguntas es comparar medidas. Sin embargo, esa comparación es un tanto peculiar, ya que no se reduce a decir si 2 es igual o menor que 2.5, sino comparar si aquellas medidas que caracterizan un conjunto de datos son diferentes o no de las medidas que caracterizan otro u otros conjuntos. Además, debemos asegurarnos que los resultados de esas comparaciones sean significativas, esto es, la intensidad de las diferencias debiera superar la que sería de esperar si dichas diferencias estuviesen provocados al azar.

En estadística, las comparaciones reciben el nombre de pruebas de comparación, ya que formalmente son muy complejas al integrar un cálculo de la diferencia y una prueba de la no aleatoriedad de los resultados.

 
5.3. Midiendo la “intensidad” de la variabilidad  
Si estamos interesados en “comparar”
el esquema de regularidad existente en la variabilidad de ciertas propiedades
cuantitativas en distintos conjuntos de materiales, lo primero que habremos
de hacer será describir esa variabilidad. Existen varias formas de
hacerlo.

La primera de ellas es gráfica: por medio de histogramas o “diagramas-de-tallo-y-hoja” (Stem-and-leaf plots), medios de representación que nos proporcionan una primera “impresión intuitiva” del grado de variabilidad en ciertos datos. Así, si deseamos saber si todas las cerámicas descubiertas proceden de un único taller, construiremos un histograma de diversas propiedades cuantitativas de ese conjunto de materiales:

longitud del Dm. máximo
longitud del Dm. de cuello
altura de la vasija, etc.
La segunda manera de describir la variabilidad es métrica, es decir, “mediremos” su intensidad. Para ello disponemos de varios instrumentos de medida. La media de un conjunto de datos es igual a la suma de todas las medidas, dividida por la cantidad de individuos medidos. Precisamente porque se trata de un valor calculado, la media no tiene por qué coincidir con un dato concreto. Denominaremos mediana a aquel individuo situado en el centro exacto de la distribución, esto es, que el 50 % de los datos sean mayores que él y el 50 % menores. En algunos casos, no obstante, media y mediana coincidirán. La media es un índice estadístico que permite situar la posición de una distribución, ya que proporciona el valor de la variable hacia el cual tienden a agruparse los datos. Ahora bien, saber cual es el centro geométrico (mediana) de los datos nos dice muy poco acerca de la variable. Si lo usáramos como un "resumen" de todo lo que contiene esa variable, estaríamos reduciendo demasiado el alcance de nuestra investigación y, probablemente, estaríamos ignorando gran cantidad de información.

Una forma de estudiar la variabilidad es describiendo el grado de dispersión de las medidas con respecto a un punto de referencia. Cuanto mayor sea dicha dispersión, mayor será la variabilidad. Por consiguiente, construiremos una medida de la variabilidad si construimos una medida del grado de dispersión. Nada más fácil. Empezamos definiendo el punto de referencia; lo más sencillo es que coincida con el centro geométrico de la ordenación, esto es la media. A continuación restaremos cada observación de dicho punto medio, haciendo caso omiso del signo, y sumaremos todas las diferencias. Asumiendo que la diferencia de una medida con su media es resultado del grado dispersión (distancia entre ese individuo y el centro de la variable), sumando la dispersión de todos los individuos, obtendremos el grado de dispersión de la variable (varianza).

 
5.4. El concepto de Relación  

Imaginemos que en nuestra investigación debemos averiguar
si la distancia a que un poblado se encuentra de cierta cantera de sílex
es la causa de la cantidad que de dicho silex se encuentra en el poblado.

Analizar la “relación” de causalidad entre estas dos variables equivale a averiguar la probabilidad que los valores de esas dos variables aparezcan juntos. Tendremos valores para cada una de las fases cronológicas del poblado; si a lo largo del tiempo no han aparecido nuevas fuentes de sílex, y la única causa de la cantidad de silex en el poblado fuese la distancia desde la cantera, los valores de ambas variables (Distancia, Cantidad) permanecerían constantes. En términos matemáticos, lo que nos planteamos es conocer la probabilidad que exista determinada cantidad de sílex en una fase cronológica específica, y si esa probabilidad es distinta de la que se produciría al azar.

En resumidas cuentas, pretendemos averiguar si la distancia que separa el poblado de la cantera nos permite predecir con mayor fiabilidad la cantidad de sílex que hay en ella. Si la distancia no afecta para nada a la probabilidad de una cantidad específica de sílex, entonces, las variables Distancia y Cantidad de sílex serán independientes. En el caso contrario, diremos que son dependientes.

Un uso semejante es el de la palabra asociación. Por "asociar" se entiende juntar una cosa con otra de modo que concurran a una misma finalidad. Dos cosas están asociadas, por tanto, cuando al mover una, se mueve la otra, o bien, cuando cambia de color una, también lo hace la otra. En el caso de la Investigación Arqueológica pasa lo mismo: dos propiedades estarán asociadas cuando al cambiar las medidas de una cambian las de la otra. O también, dos atributos o variables estarán asociados cuando contribuyan a definir una categoría analítica; definirán esa categoría cuando ésta se diferencie de otras debido, precisamente, a la presencia de esas variables o atributos. El esquema básico que seguiremos es el siguiente:





  CATEGORÍA A  CATEGORÍA B
atributo x
Si 
No
atributo y
No
Si


Lo que nos preguntamos es si es más probable que
el atributo x aparezca en elementos de la categoría A, o si por el
contrario la probabilidad de que x aparezca en B es mayor que la anterior.
Usando esta terminología tendríamos:

HIPÓTESIS NULA: la probabilidad que el atributo x aparezca en A es igual que la probabilidad de que aparezca en B.
HIPÓTESIS ALTERNATIVA: la probabilidad que el atributo x aparezca en A es distinta a la probabilidad de su aparición en B.
Cuando se observa un comportamiento como el anterior, esto es, cuando los valores de las dos variables disminuyen simultáneamente, o aumentan en paralelo, o cuando uno aumenta el otro disminuye, etc., diremos que ambas variables están relacionadas. En definitiva, existe relación entre dos propiedades cuantitativas cuando éstas varían conjuntamente. Ejemplos de propiedades relacionadas los leemos cada día en la prensa: fumar produce cáncer, leer la prensa causa depresión, ver la televisión provoca aburrimiento, etc.

¿Qué diferencia existe entre relación y asociación? Formalmente, ninguna. Asociación y relación son términos sinónimos, ya que la definición de asociación se cumple para todos aquellos fenómenos que están relacionados. En cualquier caso, restringiremos el término relación para indicar aquellas asociaciones ente variables cuantitativas. Dos objetos no tienen por qué estar "relacionados" ni “asociados” si son blancos, han sido adquiridos por la misma persona o tienen el mismo uso, sino que lo estarán cuando varíen conjuntamente y esas variaciones cruzadas no se deben al azar. Dado que una variable cuantitativa tiene más modalidades que una variable cuantitativa, las relaciones serán más complejas que las asociaciones, básicamente porque la necesidad de que los cambios en una variable estén ligados a los cambios en otra variable es mucho más restrictiva en el caso de variables con muchas medidas no muy diferentes entre sí (1, .25, 36, 63, 15.5, 22.4,....), que entre variables con categorías (empresas de manufactura, empresas de servicios).

 
5.5. La Complejidad de las Relaciones Causa/Efecto. Una Introducción a la Multi-dimensionalidad  

Solemos emplear la palabra complejidad sin que nos paremos a pensar en lo que significa. El diccionario dice que se trata de un "fenómeno compuesto por elementos diversos". Según esta definición, "complejidad" es un resultado de "diversidad". Es cierto que un fenómeno complejo es un fenómeno con muchos componentes (partes):

no es necesario que sean diversos entre sí, basta con que los mismos componentes aparezcan en ubicaciones distintas simultáneamente. Todo problema de decisión es complejo, ya que se compone en realidad de muchas minidecisiones relacionadas: la causa en las variaciones temporales (históricas) de la cantidad de determinado útil está provocada por variaciones temporales en: los procesos de trabajo, las circunstancias climáticas, el estado de los recursos, la competencia de comunidades vecinas por esos recursos, el grado de centralismo político, etc.
el rasgo fundamental de la complejidad no es la cantidad y la diferencia de los componentes, sino la manera en la que están relacionados. Siguiendo con el ejemplo anterior, para averiguar la causa de las variaciones temporales (históricas) de la cantidad de determinado útil, debemos averiguar si paralelamente a esos cambios, se registran variaciones en el número, distancia y densidad de las comunidades vecinas (cuantos más vecinos, menos cantidad, por ejemplo), cambio en los procesos de trabajo agrícolas, ganaderos, artesanales, etc.
Todo investigador o investigadora debe plantearse dónde reside la complejidad en su investigación. Pudiera pensarse que son los datos los que son complejos: más de 10000 fichas de fragmentos cerámicos, de muros y/o estructuras, cada uno de ellos descritos por medio de decenas de variables; ahora bien, recordemos que los datos no existen por sí mismos, sino que somos nosotros los que los producimos con el fin de convertir en "observable" un proceso o fenómeno de interés. En definitiva, la complejidad es una propiedad característica del proceso o fenómeno que estudiamos. Dado que los componentes del proceso o fenómeno son las variables con las que lo hemos descrito, investigaremos la existencia de complejidad en las relaciones entre dichas variables. Por consiguiente, hablaremos de Bases de Datos complejas tan sólo en el caso en que para describir un proceso complejo necesitamos tablas de datos con muchas variables muy distintas entre sí. El análisis de la complejidad es, en realidad, la búsqueda de una estructura relacional multidimensional determinada en una base de datos.

¿A qué vienen todas estas reflexiones "abstractas" y alejadas de la práctica cotidiana? A lo largo de las páginas anteriores hemos visto cómo plantear el estudio de las relaciones entre variables. No obstante, en la mayoría de casos se trataba de relaciones extremadamente simples entre dos componentes; forman parte de la llamada estadística bidimensional. Ciertamente, algunos fenómenos pueden ser descritos adecuadamente con un número muy restringido de propiedades cuantitativas, pero en la mayoría de los casos no tendremos suficiente con experimentos de juguete, sino que deberemos estudiar el fenómeno de interés en toda su complejidad. En estos casos, la investigación deberá empezar por identificar la menor cantidad de variables que describa el fenómeno a nuestra entera satisfacción.

Vamos a estudiar un fenómeno de “crisis histórica”: el despoblamiento en determinada área geográfica durante bastantes siglos, cuando en la fase anterior su ocupación está claramente demostrada. Deseamos averiguar qué proceso es responsable de ese despoblamiento: por qué la gente abandono sus poblados de origen. Obviamente la "causa" de la crisis es un proceso inobservable (si supiéramos cómo es ya no iniciaríamos la investigación). Por lo tanto, estudiaremos la causa a partir de aquello que sabemos acerca de sus efectos: los yacimientos que han sido desocupados durante el periodo de referencia. El estudio, pues, se reduce a una comparación entre diversos individuos (yacimientos). Supongamos que de 250 yacimientos analizadas, 50 capearon el temporal y no fueron desocupados ni manifiestan evidencias de “crisis” alguna. Los otras 200 yacimientos arqueológicos se comportaron cómo se esperaba y fueron abandonados en un momento u otro del periodo estudiado. Hay pues, como mínimo, dos poblaciones en nuestra base de datos: yacimientos que fueron abandonados y yacimientos que siguieron siendo ocupados. Nuestro objetivo, sin embargo, no es crear una clasificación o tipología de lugares arqueológicos, sino usar las diferencias entre los que subsistieron y los que no, con el fin de averiguar cual fue la causa de la "crisis".

Si el fenómeno fuese simple, con estudiar un par de variables tendríamos bastante. Por ejemplo, supongamos que toda la culpa es del clima: una sequía prolongada. Describiendo la vinculación que tiene cada yacimiento con el clima (dependencia de recursos sensibles a un cambio en el régimen pluviométrico) tendríamos bastante. Pero aunque a algunos les entusiasme esta teoría, no creo que sea cierta. La causa de la crisis es un fenómeno complejo, que no puede definirse con arreglo a unas pocas variables, debido a su diversidad. Necesitaremos, pues, un larga serie de variables para definir cada uno de sus "componentes".

Es preciso tener presente, sin embargo, el tema de la redundancia. No por el mero hecho de utilizar muchas variables estaremos describiendo la complejidad. Por el contrario, las diferentes variables que seleccionemos habrán de ser lo menos redundantes posibles, es decir, harán referencia a aspectos diversos. A título de ejemplo, podemos citar variables tales como: volumen de producción de subsistencias, volumen de producción de bienes de intercambio, grado de inversión de fuerza de trabajo en obras públicas, grado de inversión de fuerza de trabajo en obras suntuarias, eficacia de los procesos productivos, etc.

De lo que se trata es de averiguar de qué manera la dispersión de cada variable contribuye a definir dos grupos en la base de datos; en qué se diferencian los yacimientos que fueron abandonados, de aquellos que no lo fueron. El objetivo no será, pues, calcular qué yacimientos no fueron ocupados durante “la crisis” (ya lo sabemos), sino en qué se parecen aquellos que fueron afectadas por “ella” y en qué se diferencian de los que la superaron. Obviamente, este análisis hace referencia a la relación entre las variables: ¿tienden a aparecer los valores altos de una variable (por ejemplo, VOLUMEN DE LA PRODUCCIÓN DE BIENES DE INTERCAMBIO) en el grupo de yacimientos que sobrevivieron y valores bajos de la misma variable en el grupo de poblados que desaparecieron? ¿Hay diferencias en la media y la varianza de cada variable en cada uno de los dos subgrupos? ¿Tiene el grupo de yacimientos en quiebra la misma variabilidad interna que el grupo de yacimientos supervivientes?¿Podemos definir una función matemática con aquellas variables que más contribuyen a diferenciar a las dos poblaciones? Precisamente porque la causa del fenómeno es compleja, podemos encontrarnos con muy poca estructura multidimensional. En otras palabras, la solución al problema puede que radique, precisamente, en la falta de solución: "mueren" aquellos yacimientos con valores extremos en cada una de las variables, y no aquellos poblados con valores medios. Es decir, los grupos humanos más flexibles son capaces de capear el temporal, y aquellos más especializadas, o más ligados a un único recurso o medio de producción son las que no resisten a su desaparición.

Así pues, la necesidad de estudiar la "complejidad" empieza en la descripción de los datos y en la manera de medirlos. Pero también en la selección de los mismos: ¿qué evidencias debo elegir para estudiar las causas en la variación del régimen pluviométrico?¿Y para investigar la calidad de manufactura de un producto? Esa investigación seguirá con la descripción de la "compleja" estructura que adoptan las relaciones entre las variables. Esa estructura no es más que una forma de ordenación peculiar, resultante de las correlaciones y co-variaciones existentes entre las variables. Recibe el nombre de estructura multidimensional. Se trata de una medida (recordemos que una medida no es más que un criterio específico de ordenación) cuya función o criterio es una combinación de las medidas originales. En definitiva, la estructura multidimensional es una ordenación de ordenaciones, o bien, la variabilidad producto de la suma de variabilidades parciales. Por consiguiente, un análisis de la multidimensionalidad presente en los datos no será más que un análisis de la variabilidad de los datos que es común a la variabilidad de todas las propiedades cuantitativas.

Los métodos analíticos multidimensionales ó multivariables nos dicen que en los datos hay una estructura "significativa", cuando la variabilidad de la población resultante de la combinación de las variables cumple ciertos requisitos, esto es, resulta significativamente distinta de la estructura que se obtendría si esas combinaciones se hubiesen producido al azar. Se trata de averiguar si la estructura multidimensional puesta de manifiesto es o no producto de la casualidad.

En definitiva, el objetivo del análisis multidimensional no es desvelar los grupos que puedan existir en nuestros datos (tipología), sino obtener una nueva ordenación de los mismos cuya media y desviación típica sea una combinación de la media y la desviación típica de las variables originales. La variabilidad de esa nueva ordenación, que no tiene por qué ser lineal, sino multi-lineal, nos dará información acerca de la complejidad del proceso que investigamos. El análisis de la complejidad es, pues, un estudio descriptivo de todas las relaciones entre las variables que definen los datos.
 
6. A Modo de Conclusión.  
De lo dicho en páginas anteriores
se deduce que lo realmente importante en la Arqueología Cuantitativa
no es el cálculo de determinadas ecuaciones, ni la ejecución
de unos gráficos, sino el planteamiento de problemas históricos
solubles por medio de un análisis de las relaciones causales. En este
trabajo no se han aducido fórmulas. No quiere decir esto que no existan
ni que debamos prescindir de ellas, sino tan sólo que la parte “calculable”
de una investigación cuantitativa es la más sencilla y breve.
Mayor dificultad implica saber qué es lo que deseamos averiguar y,
a continuación “medir” el registro arqueológico, intentando
percibir fenómenos difícilmente observables. Recordemos que
nuestro objetivo, en tanto que arqueólogos y arqueólogas, consiste
en averiguar las acciones que tuvieron lugar en distintos momentos del pasado
y que explican (causalmente, históricamente) las acciones que hoy
en día tienen lugar (aquí y ahora). Pero el registro arqueológico
no es un registro de acciones, sino de algunos efectos (parciales, además)
de esas acciones. La tarea más compleja de la arqueología cuantitativa
consiste, pues, en crear instrumentos de medida. Algo se ha avanzado en ese
sentido, pero aún falta mucha investigación en esa dirección.
 
7. Para Saber más.  

Especialmente para conocer los cálculos  y las fórmulas  que se emplean en Arqueología Cuantitativa a la hora de descubrir relaciones causales, se pueden consultar los siguientes libros:

SHENNAN, S.J., 1988, Quantifying Archaeology. Edinburgh: Edinburgh University Press.

ORTON,C., 1980, Mathematics in Archaeology. Londres: William Collins Ltd.

ALDENDERFER,M., (ed.), 1987, Quantitative Research in Archaeology.  Progress and Prospects.  Beverly Hills: Sage Publications

BAXTER,M.J., 1994., Exploratory Multivariate Analysis in Archaeology.  Edinburgh University Press.

DJINDJIAN,F., 1991., Méthodes pour l’Archéologie.  Paris: Armand Colin.

BARCELO, J.A., 1997, Arqueología Automática. Una Introducción a los usos de la Inteligencia Artificial en Arqueología.  Barcelona: Ed. Ausa/UPF.