viernes, 4 de mayo de 2012

Población, Población Objetivo, Población Marco, etc. y Universo Estadísticos (I)


Por Hugo Casanova

Resumen

Los términos población y universo se usan indistintamente para referirse a un conjunto de individuos, sin embargo existe una ambiguedad aparente pues también se refieren a conjunto de características y modelo teórico. Por otra parte existen otros tipos de población como población objetivo, marco, etc. Estos dos artículos exploran este asunto y se proponen aclarar posibles confusiones

Contenido

  1. Dos términos varios conceptos
  2. Conjunto de individuos o de características
  3. El viejo asunto de lo teórico vs lo fáctico
  4. Población infinita, universo infinito

Dos términos varios conceptos

Generalmente los términos población y universo tienden a considerarse sinónimos, son incontables los textos que hablan indistintamente de ellos, sin embargo hay algunas diferencias teóricas y metodológicas que aclarar. Los términos población y universo los discutiré en esta primera parte, las diversas adjetivaciones las dejaré para la segunda.

Azorín y Sánchez Crespo (1986, 17) afirman que según el diccionario de Kendall y Buckland (1971) población (o universo) se refiere a “cualquier colección finita o infinita de individuos o elementos”. Nótese que establecen el sinónimo entre población y universo. Según esta definición cualquier grupo de individuos (personas, animales o cosas) que puedan considerarse como una colección será, entonces, una población (o universo).

Sin embargo declaran que…

A veces se ha dado distinto significado a los términos universo y población, indicando con el primero un conjunto de elementos, individuos, unidades, seres y objetos, y con el segundo un conjunto de números obtenidos midiendo o contando ciertos caracteres de los mismos (citan a Tang, 1951)

Por su parte Leslie Kish (1972, 28) dice que…

Evitaremos usar la palabra universo[1] como sinónimo de población. Aquella denota un conjunto hipotético infinito de elementos generados por un modelo teórico, esto puede ser una operación ideal que se repite interminablemente, como lanzar al aire, sin fin, una moneda. Detrás de cada población de encuesta hay un universo hipotético, explícito o implícito, definido o indefinido

Igualmente Kish (1972, 27) define la población como agregado de elementos (y estos como las unidades de las que se toma información, es decir los individuos). Pero también la práctica sugiere que el término población se usa como modelo teórico. En un ejercicio de inferencia estadística, tomado de forma casual, Guenther (1968, 116) dice en uno de los pasos del ejercicio “La población de la duración de bombillas se distribuye normalmente con n = 100…”

Tenemos entonces dos aspectos distintos, por una parte población y universo como conjunto de individuos (colección) y, por la otra, población y universo como modelo teórico (hipotético). Obviamente la diferencia estriba en la dualidad de conceptos no en la sinonimia. Tenemos un concepto de conjunto y otro de modelo, uno práctico y otro teórico, un inductivo u otro deductivo (si se quiere). Es decir el problema parece estar no en el hecho de ser sinónimos, población y universo, sino en la distribución de ellos en dos conceptos distintos.

Conjunto de individuos o de características

Antes de seguir, resolvamos el problema de considerar a la población o universo como individuos o como valores medidos o contados de un conjunto determinado. Al respecto diré que no hay problema pues al considerar a la población o universo como conjunto de individuos o colección invocamos necesariamente a una clase de equivalencia (esto es sus elementos deben ser simétricos, reflexivos y transitivos), en otras palabras están igualados o diferenciados por una cualidad (cuantificable o no). Es decir pertenecer a una clase o colección requiere poseer una característica que los iguale o diferencie de modo cualitativo o en grado. Por ejemplo el conjunto (o clase) de estudiantes, la de docentes, o clases más amplias como la de los mamíferos, etc. Conjunto de individuos invoca a conjunto de características, no directamente comunes, pero si de clase. Se puede ser más o menos fumador pero se pertenece a la clase de fumadores, se puede vivir en distintas ciudades (no comunes), pero se pertenece a tal región o país. De otra parte si partimos de los valores medidos necesariamente debemos declarar la clase a la que pertenecen. No podríamos decir, “pesa 50 kilos” sin referirnos al sujeto (al ¿Qué es lo que pesa 50 kilos?) o elemento de la clase (tal animal, esta persona o tal cosa).

Finalmente debemos observar que este asunto de vincular conjunto de individuos con conjunto de valores de características trae toda la discusión sobre definición denotativa y connotativa, conjunto por comprensión y extensión del conjunto, dominio y contradominio de tales conjuntos e incluso, en términos metodológicos, dominio epistémico. Por ejemplo a un conjunto de individuos Xij le corresponde biunivocamente un conjunto de características xij (característica i valor j). Por ejemplo a un conjunto de 5 hombres le corresponden cinco valores {j = 50, 78, 54, 12, 73) de sus pesos (i = 1= peso), ó 5 valores de sus estaturas (i = 2 = estatura), etc. De este modo existen múltiples poblaciones para los mismos individuos. Esto es realmente una dinámica de poblaciones que no trataremos acá. Ahora volvamos al problema original.

El viejo asunto de lo teórico vs lo fáctico

Realmente tenemos el viejo problema de considerar lo teórico vs. lo empírico. Creo que Kish lo evita concientemente (“evitaremos usar la palabra universo como sinónimo de población”) pues va al problema operacional de población y fundir población empírica (real o medida) con población teórica (modelo matemático) es absurdo, por lo tanto, deja el término universo para lo segundo y población para lo primero. Lamentablemente ese esfuerzo ha sido vano, textos actuales definen (con-funden) población y universo como sinónimos y como conjunto empírico, lo teórico aparece solo en inferencia. De este modo cuando se habla de población se refiere a ambos conceptos, el de conjunto empírico de valores y el de modelo teórico.

En esto pareciera existir un acuerdo tácito de considerar población con esas dos acepciones estadísticas, el conjunto de características observables que se desean medir y su distribución teórica (el universo para Kish).

Pero esto trae un inconveniente, un conjunto cualquiera de individuos o valores puede modelarse o no, puede ajustarse (o no) mediante un modelo de probabilidad (binomial, normal, etc.) problema que se complica cuando tal conjunto de características son multivariables (o n-tuplas, pares, tríos, etc. ordenados) la suposición de distribución multivariante es realmente dificultosa, Por ejemplo decir que el peso de las personas se distribuye como una normal con tal media y varianza es posible hacerlo, pero decir que la distribución conjunta de peso, talla y edad es normal multivariante es otro problema. Sin embargo esta insuficiencia o carencia potencial en la suposición no afecta la dualidad del concepto de población. De este modo (como conclusión) si de la probabilidad se dice que es un Jano Bifronte que tiene una cabeza teórica y otra empírica, no es menos cierto para población. ¿Y el universo?

De este diremos que la experiencia indica que se usa como un total, como un número, el universo es un total. Se dice “de un universo de tantos individuos se extrajo una muestra de tantos”. Así universo es una cota superior convenientemente fijada y se refiere al total de los individuos existentes de los cuales se toma la muestra. En este sentido tiene que ver con la población cuando esta se operacionaliza (o se define la extensión o denotación), pero no cuando se define o connota (darle significado a la población según los objetivos). Por ejemplo la población “escuelas de la universidad tal” (connotación o significado) tiene como extensión {biología, administración, medicina, derecho,…, estadística}, es decir, contadas da un universo N de tantas, pero este puede ser menor según el significado, la población podría ser “escuelas de la universidad tal que tengan matemática en sus programas”. Entonces universo es término instrumental para muestreo y para costos de investigación.

Población infinita, universo infinito

Esto tiene una secuela importante, no podría haber un universo infinito, solo habría población infinita definida en el modelo teórico ya que las leyes de probabilidad son asintóticas, no podría haber una extensión infinita de una población si de ella se va a tomar la muestra. No se le podría poner un marco y llamarla población marco o marco muestral. No tendría sentido práctico decir que la extensión de la población de vehículos que pasan por el Peaje de Tazón es infinita mas sí de su modelo teórico (de existir). No tendría sentido porque una vez eliminado el peaje o llegado el fin del mundo (tiempo finito) habrán pasado tantos cuatrillones de vehículos y ese valor o su potencia de 1000 no se parecerá en nada a infinito. El uso del término infinito como “número grande” es abusivo y confunde a los estudiantes. Población infinita (que no sea la del modelo) no puede definirse por extensión y si tal población es indeterminada (como muchas) pues al operacionalizarla hay que delimitarla (por ej. Se estima que por el Peaje de Tazón pasa un promedio de tanos vehículos al día por lo que la muestra será de tantos, delimitación temporal). Por otra parte las ecuaciones de muestreo están hechas para introducir estimadores, errores calculados y un N (bien finito).

En la famosa ecuación de Muestreo Aleatorio Simple (MAS) donde se ajusta la muestra (a n=n0) se hace necesario considerar la población como infinita (N → ∞) solo en el terreno del cálculo diferencial, para demostrar la igualdad de n y n0, pero aritméticamente o para efectos de cálculo N solo tiene que ser grande. Es decir.


Aritméticamente el término N de población no requiere “tender” a infinito sino “ser” grande (la diferencia entre tender a infinito y ser grande es la misma entre teórico y fáctico), tanto que ese cociente (n0/N) es despreciable (0) y no aporta mucha información a n con valores relativamente pequeños de N (1/2 = 0.5; 1/3 = 0.33; 1/10 = 0.1; 1/100= 0.01; 1/1000 = 0.001), cualquier valor de N que sea mucho mas grande que n0 (N>>n0) hace al cociente despreciable (y no tiene porqué llamarse infinita a la población de la que procede N)

Finalmente delimitar la población (y trabajarla, operar con ella) es otro asunto que requiere de experiencia y ciertas acotaciones convenientes. Es decir delimitarla con definiciones alternas e instrumentales de población objetivo o teórica, población marco, población encuesta (Kish), etc., es cosa que trataré en la segunda parte de este artículo.

[1] Cursiva del autor

Bibliografía

Azorín Poch, Francisco; Sánchez Crespo, José Luís. (1986). Métodos y Aplicaciones del Muestreo. Alianza Universidad. Textos. Madrid

Lelie Kish. (1972). Muestreo de Encuestas. Ed. Trillas. México

Guenther, William. (1968). Introducción a la Inferencia Estadística. McGraw-Hill. México

No hay comentarios:

Planificación Estadística II

Por: Hugo Casanova Variables Demográficas vs. Psicográficas Otro aspecto importante a tener en cuenta en la planificación estadística,...