.
.-
i l
1 . .
‘1 3
c
4
, *
1 e
-*
CLASIFICACI6N
Y ANÁLISIS DE LOS DATOS DE
ESTADÍSTICA
VITAL
Por FORREST E. LINDER, Ph.D.
Jefe Auxiliar de la División de Estadística Viital, Oficina del Censo, Wtbhington, D. C., E. U. de A.
(1) EL PROBLEMA DE CLASIFICACIÓN
El análisis estadístico de los datos de nacimientos y defunciones, recogidos primordialmente por su valor como documentos legales individuales, da lugar inmediatamente a problemas de clasificación. La necesidad de tal clasificación se debe a la imposibilidad de interpretar correctamente varios conjuntos de datos desordenados. Este hecho evidente puede ilustrarse con un ejemplo muy sencillo: Examínese la lista de cifras que aparece a continuación, la cual representa la edad a que falleció un cierto número de personas.
CUADRO 1 .-Lista no ctasijicada de edades de personas fallecidas, tomadas al azar:
1940
73 85 12 78 77 62 74 79 SO 51 77 89 57 56
91 68 85 71 78 11 63 80 17 72 86 82 71 37
48 58 23 43 54 80 83 80 22 60 73 82 80 85
59 82 61 1 74 57 79 74 26 81 70 72 *
41 75 t 79 69 42 61 55 64 58 85 86 81 77
75 62 67 47 S2 79 26 51 75 56 18 78 74 82
86 67 76 82 60 70 74 59 69 53 77 72 81 87
75 54 82 70 30 84 85 86 74 $ 78 87 85 74
91 79 90 76 * 52 55 1 69 78 41 18 44 22
81 76 79 60 20 77 79 9 49 83 90 72 75 60
92 74 56 83 84 62 81 64 67 74 81
*Desconocida. f4 meses. $1 mes.
No es fácil obtener de una lista semejante de datos una impresión clara de los hechos principales relativos a la edad al morir de dicho grupo de personas.
Naturalmente, que el primer paso necesario para el estudio de tales datos consiste en agrupar las defunciones de personas de una misma edad, o más o menos de la misma edad. Con este proeedimiento se reducen las cifras a un pequeño cuadro. (Ver cuadro 2).
Cuando se emplea un sistema de clasificación al agrupar los datos, es posible, de una ojeada, saber a qué edad más o menos murió la mayor parte de las personas y si predominaban los jóvenes o las personas de mayor edad. Se hace igualmente fácil comprender otras características generales de la distribución por edades de las defunciones de este grupo.
687
.
688
OFICINA SANITARIA PANAMERICANA [AgostoLa clasificación de esos datos es relativamente simple. A veces con- viene clasificar las defunciones en grupos etarios más pequeños, o hacer que los grupos comprendan otras edades distintas. En general, sin embargo, la clasificación de los datos cuantitativos, tales como edad, peso, y presión sanguínea no tiene nada de difícil. Los problemas de clasificación más complicados surgen cuando el fenómeno en estudio es difícil de medir o evaluar, o cuando la información o datos dependen en gran parte del conocimiento y opinión del observador, o cuando no hay concordancia general en cuanto a las varias fases de los hechos que han de clasificarse. La clasificación de enfermos en grupos de acuerdo con los varios estadios de la enfermedad pudiera diferir nota- blemente según el médico que la haga. En tanto que un médico puede que clasifique las defunciones por accidentes de acuerdo con la causa fisiológica de muerte, un educador pudiera mostrar preferencia al tipo de accidente, y un ingeniero de seguridad a las razones físicas responsables del mismo.
CUADRO 2.-Edades de 160 personas fallecidas, lomadas al azar y clasificadas en
amplios grupos etarios
Grupo etario Número de defunciones
o-19 años 10
20-39 IC 8
40-59 “ 25
60-79 “ 64
so-99 “ 41
Desconocido 2
Como la función principal de todo sistema de clasificación consiste en la reducción de un amplio conjunto de datos a proporciones más com- prensibles, es esencial que el sistema sea sencillo y práctico. Una clasificación que contuviera miles de grupos distintos no tendría mayor valor que el material original en desarreglo. Hay que reconocer, sin embargo, que
la
reducción de datos que produce la agrupación acarrea cierta perdida de detalles, y que ésta aumenta a medida que el número de grupos disminuye. Debido a esta pérdida de información a veces no conviene confiar exclusivamente en las conclusiones que se derivan exclusivamente de datos clasificados. A menudo es necesario conocer algunas otras fases de los hechos que no puede revelar la agrupación.Cada asunto o materia tiene sus propios problemas de clasificación. Al seleccionar o confeccionar el sistema de agrupación debería tenerse en cuenta antes que nada, el fin a que se destinan los datos. Si se van a emplear los mismos datos en varios estudios, quizás sea necesario agru- parlos en varias formas distintas. En el campo de la estadística vital hay varios principios que deben tenerse presentes al juzgar la convenien- cia y utilidad de cualquier disposición clasificada de datos.
-.
_-
l L
.* ,;
‘i y
1943 1 DEMOGRAFfA
689
‘a * :
. .
i -.
(a) Corrección del sistema de clasificación.-Para que sende verdadera utilidad todo sistema de clasificación debe ser correctamente planeado, si ha de disminuir tangiblemente el volumen de los datos.
Debería también servir para presentar la información en forma com- prensible y compacta. Las clases no deben reflejar ambigüedad, y deberfan definirse de tal modo que se excluyan mutuamente. Deben ser escogidas de tal manera que los datos que pertenezcan a una clase sean relativamente homogéneos, aunque dotados de la amplitud necesaria para que las frecuencias en dicha clase sean lo suficientemente extensas para análisis e interpretación.
Además, la clasificación debe prestarse para los fines específicos que persigue. Una clasificación de defunciones por grupos detallados de ocupaciones puede ser ideal para el estudio de ciertos riesgos industriales pero puede resultar inadecuada para el estudio de la mortalidad por clases económicosociales. Las defunciones clasificadas en amplios grupos etarios no revelarían fluctuaciones a intervalos de un año solamente.
(b) Clasificación basada en una sola variable.-Es difícil y con- fuso emplear un solo sistema de clasificación para presentar datos sobre distintos aspectos del mismo problema. Hablando en términos matemáticos, cada clasificación debe referirse a una sola dimensión o earacterfstica. Como regla de clasificación, este principio puede considerarse como lógicamente correcto, pero a menudo se desatiende en la práctica. Por ejemplo, frecuentemente se agrupan las defunciones por accidentes en las siguientes clases que han sido denominadas “lugar del accidente.”
(1) Defunciones debidas a accidentes en el hogar. (2) Defunciones debidas a accidentes en lugares públicos. (3) Defunciones debidas a accidentes profesionales.
Esa agrupación ha resultado del deseo de combinar en una escala sencilla dos características distintas, a saber, el lugar del accidente, y la relación de éste a la ocupación. El hecho de que pueden ocurrir accidentes profesionales en sitios públicos y hasta en el hogar, introduce ambigüedad y confunde la interpretación de una clasificación semejante de muertes.
690
OFICINA SANITARIA PANAMERICANA[Agosto
aparato circulatorio; Clase VIII, Enfermedades del aparato respiratorio; etc. Otros grupos se basan principalmente en otra característica, la edad: Clase XV, Enfermedades peculiares al primer año de vida; y Clase XVI, Senilidad o vejez.
Esa mezcla en la clasificación puede encontrar algunas razones justifi- cativas. Por ejemplo, el rasgo principal de ciertas enfermedades puede que sea la región afectada. En otras, la localización no importa, o quizás ni se pueda determinar, y en cambio el agente causante es esencial; y en otras enfermedades apenas definidas, la edad característica pudiera ser de sumo valor. Con frecuencia, a fin de evitar la clasificación mixta, puede que sea necesario emplear una clasificación doble. En estudios detallados de la mortalidad profesional, puede que sea indispensable clasificar en primer término las ocupaciones como tales, y luego el tipo de industria. El riesgo de accidente o salud de un operario de máquina, por ejemplo, podría variar notablemente según la industria de que se trate.
(c) Exactitud de los datos originales.-No puede implantarse ningún procedimiento estadístico que invente hechos a satisfacción. El resultado final siempre tendrá las limitaciones que le impone el ma- terial original, por cuya razón no se puede considerar a la clasificación como método que se pueda emplear para mejorar datos que originalmente eran pobres. Sin embargo, la precisión y exactitud de los datos originales pueden ser factores importantes al seleccionar el plan clasificador. Da- tos exactos pueden ser clasificados y tabulados en clases precisas y detalladas, pero si la información original es imperfecta e inexacta, los grupos de clasificación tampoco tendrán exactitud o pulimento.
(d) Proporción y tratamiento de los desconocidos.-Aunque alguna partida pudiera aparecer corrientemente con suficiencia y pre- cisión, en algunos casos puede ser absolutamente desconocida. Una proporción elevada de casos desconocidos puede viciar el valor de un cuadro satisfactorio en otros sentidos. Los “desconocidos” son a menudo tan poco frecuentes que se pueden desatender, pero cuando esto no es posible a veces se puede hacer una suposición razonada de su distribución, y de este modo combinarlos con el material corrientemente clasificado.
(e) Comparabilidad con clasificaciones de población-la mayor parte de los cuadros bioestadísticos se usan conjuntamente con los cuadros correspondientes de población. Los principales valores de las estadísticas de mortalidad y natalidad se pueden obtener de los coefi- cientes que resultan de la relación del número de defunciones o naci- mientos de una clase dada con la población de la misma clase. Para hacer esto, es lógico que en la tabulación de la estadística vital y de la estadística de población se empleen sistemas semejantes de clasificación, y que los grupos sean determinados mediante los mismos principios.
(Continuarú)
-.
.*
l *
‘W
. .