Revista Peruana de Reumatología: Volumen 2 Nº 3, Año 1996 LIMA-PERÚ

 

Artículos Originales

Validación de una versión peruana de la dimensión física del Cuestionario de Evaluación de Salud (HAQ)

Franz Calvo A, Enrique Vega E, Raúl Cusi, Maribel Visaga, Felix Romero, Alfredo Berrocal K y Armando Calvo Q.


Resumen

Objetivos: Traducir la sección de discapacidad física del Cuestionario de Evaluación de Salud (HAQ) al español, adaptarlo a la realidad local y validarlo, proponiendo un cuestionario (HAQ-P) adecuado a las condiciones peruanas.

Métodos: En un total de 83 pacientes con artritis reumatoide (AR) del Hospital Nacional Cayetano Heredia se estudió: a) validez de criterio por correlación mediante coeficiente de Spearman (R) de la observación domiciliaria del paciente contra el puntaje del cuestionario autoadministrado; fiabilidad comparando los índices del cuestionario autoadministrado con los obtenidos mediante entrevista médica; b) validez de constructo por correlación del HAQ-P con la escala de Steinbrocker, dolor e índice articular; c) credibilidad; d) viabilidad, estudiando la proporción de pacientes que pueden completar el cuestionario autoadministrado y el tiempo que emplearon.

Resultados: La correlación entre la observación domiciliaria y el cuestionario autoadministrado mostró un coeficiente R=0,90, la fiabilidad tuvo un R=0,87, en la validez de constructo se obtuvo para el índice de Steinbrocker R=0,67, para el dolor R=0,51 y para el índice articular R=0,38, todos p<0,01. La validez de credibilidad no fue óptima para dos preguntas. El 100% de los pacientes letrados o analfabetos con acompañante letrado pudo completar el cuestionario en un promedio de 9 minutos.

Conclusiones: El HAQ-P es un instrumento fiable y válido para medir discapacidad funcional en pacientes peruanos con AR.

Palabras clave: Evaluación de la discapacidad, Evaluación de procesos y resultado, Artritis Reumatoide, Calidad de vida.

 


Correspondencia: Dr.Armando Calvo, Universidad Peruana Cayetano Heredia, Honorio Delgado nº 430-Lima 31


Rev. Perú Reum. 1996; 2 (3): 93-101

 

Introducción

La evaluación de pacientes con artritis reumatoide (AR) incluye la valoración del proceso patológico, del pronóstico y de los resultados de la enfermedad (traducción del término inglés "disease outcome"). Son hoy reconocidos como resultados, el sufrimiento y la pérdida de salud experimentada por un individuo como consecuencia del proceso de la enfermedad; para evaluarlos se han identificado como las principales dimensiones cuantificables a la discapacidad física, la muerte, el disconfort, las reacciones adversas al tratamiento y el impacto económico (1).

Los reumatólogos han reconocido la importancia de la discapacidad física desde los primeros días (2), aunque medidas más confiables y válidas no fueron desarrolladas sino hasta 1980 (3, 4, 5, 6). Un instrumento hoy ampliamente usado para medir discapacidad funcional es el Cuestionario de Evaluación de Salud, conocido internacionalmente como "HAQ", acrónimo del inglés Health Assessment Questionaire. Éste mide la capacidad del paciente para vestirse, levantarse, alimentarse, caminar, asearse, alcanzar, coger y otras actividades de la vida diaria. Numerosos estudios evidencian que el HAQ detecta cambios del estado clínico adecuadamente y por ello la sección de discapacidad es utilizada como uno de los principales indicadores de resultado en los ensayos clínicos de artritis reumatoide.

El cuestionario es autoadministrado y en algunas poblaciones toma menos de 5 minutos completarlo (7). Su confiabilidad y validez ha sido demostrada en diferentes lenguajes y contextos (8, 9, 10), llegándose a la conclusión que se requiere de adaptaciones regionales o locales.

El objetivo del presente trabajo fue traducir la sección de discapacidad del HAQ al español (a la que denominaremos HAQ-P), adaptarla a la realidad de los pacientes peruanos y validarla. Con este fin hemos utilizado los criterios de validez para seleccionar índices de ensayos clínicos propuestos por Tugwell y Bombardier (11)

Materiales y métodos

Tamaño muestral. Se calculó según la fórmula n = z2 * s 2/ d2, asumiendo: 1) el caso extremo de una población infinita, 2) un intervalo de dimensión d = 0,16 -la mitad de la diferencia entre 0,98 y 1,3, variaciones de los promedios del índice de discapacidad halladas en estudios anteriores (3, 12), 3) una desviación estándar s =0,62 (3) y 4) un intervalo de confianza de 95% (z =1,96). Al reemplazar estos valores se obtiene un tamaño muestral mínimo necesario de 57,7 pacientes.

Población de estudio. Se incluyen 83 pacientes que acudieron en forma consecutiva al Servicio de

Reumatología del Hospital Nacional Cayetano Heredia (HNCH) durante los meses de febrero y marzo de 1995 y febrero de 1996, y cumplieron con los siguientes criterios: 1) Diagnóstico definido de AR (3), 2) Paciente o acompañante letrados, 3) No estar gestando, 4) No tener otra enfermedad articular, 5) No tener anormalidades significativas del sistema cardiovascular, respiratorio, gastrointestinal y hematológicas; y 6) No haber tenido cirugía mayor recientemente.

En los primeros 66 pacientes (Grupo 1) se estudió validez de constructo, validez de contenido, validez discriminatoria y fiabilidad como parte de la validez de criterio. En 36 pacientes (Grupo II, de los cuales 19 también pertenecían al grupo anterior) se estudió validez de criterio.

Descripción del instrumento. La versión propuesta HAQ-P y el HAQ inglés se muestran en la Figura 1. Estos instrumentos formulan dos o tres preguntas en ocho áreas de actividades de la vida diaria: vestirse y arreglarse, levantarse, comer caminar, higiene, alcanzar, coger y otras actividades. Se utilizó el sistema de puntuación del HAQ original, según la escala: "sin dificultad" = 0, "alguna dificultad"= 1, "gran dificultad" = 2, "imposible" = 3. El puntaje de cada componente es determinado por la anotación más alta de cualquiera de sus preguntas. La dependencia de aparatos o asistencia física implica un puntaje mínimo de 2 en ese componente. El índice se calcula sumando los puntajes de las ocho áreas y dividiendo entre 8.

 

Concordancia entre la pregunta del HAQ-P y el HAQ original

Marque la (respuesta) que describe mejor la facilidad o dificultad que haya tenido durante la última semana:
SIN dificultad ALGUNA dificultad GRAN dificultad IMPOSIBLE

VESTIRSE Y ARREGLARSE (DRESSING AND GROOMING)

-Vestirse incluye amarrar los zapatos y abotonar la ropa (Dress yourself, incluiding typing shoelaces y and doing bottoms? - - - -
-Lavarse el cabello
(Shampoo your hair)
- - - -

LEVANTARSE (ARISING)

-Levantarse de una silla sin apoyar los brazos (Stang up from an armless straight chair) - - - -
-Subir y bajar de la cama (Get in and out of bed?) - - - -

COMER (EATING)

-Cortar la carne (Cut your meat) - - - -
-Levantar una taza o vaso lleno hasta su boca (Lif a full cup of galass to your mouth?) - - - -

CAMINAR (WALKING)

-Caminar en la calle en una superficie plana.(Walk outdoors on flat ground?) - - - -
-Subir 5 escalones (Climb up five stairs?) - - - -

HIGIENE (HYGIENE)

-Lavar y secar todo su cuerpo(Wash and dry your entire body? - - - -
-Usar la ducha (Take a tub bath?) - - - -
-Sentarse y levantarse del water (Get on and of the toilet? - - - -

ALCANZAR (REACH)

-Bajar un objeto de 2 Kg. (como una bosa de azúcar) ubicado más alto que la cabeza (Reach and get down a five pound object (such as a bag of sugar) from just above your head) - - - -
-Bajar un objeto de 2 Kg (como una bosa de azúcar) ubicado más alto que la cabeza (Reach and get down a five pound object (such as a bag of sugar) from just above your head) - - - -

COGER (GRIP)

-Abrir puertas de carros (Open car doors?) - - - -
-Abrir frascos ya anteriormente abiertos (Open jars wich have been previously opened) - - - -
-Abrir y cerrar caños de agua (Turn faucets on and off?) - - - -

ACTIVIDADES (ACTIVITIES)

-Ir de compras al mercado (Run errands and shop?) - - - -
-Entrar y salir del carro (Get in and out for a car?) - - - -
-Realizar tareas de la casa (barrer, aspirar, etc) (Do chores such as vacuuming or yardwork? - - - -


Traducción y adaptación cultural del HAQ. La traducción la realizó un traductor consciente del objetivo del cuestionario, buscando la mejor equivalencia idiomática. Algunos ítems cuestionables fueron discutidos y resueltos por dos reumatólogos bilingües con experiencia en el uso de instrumentos en estudios clínicos. En la mayoría de preguntas bastó la traducción, sin embargo seis de ellas precisaron la adaptación a la realidad local: a) "stand up from an armless straight chair" fue cambiada a "Ievantarse de una silla sin apoyar los brazos"; b) "open a new milk carton" fue cambiada por "abrir un paquete de galletas"; c) "take a tub bath" fue cambiada por "usar la ducha", d) "reach and get down a five pound objetct (such as a bag of sugar) from just above your head" fue cambiada a "Bajar un objeto de 2 Kg (como una bolsa de azúcar) ubicado más alto que su cabeza", e) "run errands and shop" fue cambiada a "ir de compras al mercado"; f) "do chores such as vaccuuming or yard work" fue cambiada a "realizar tareas de la casa (como barrer, aspirar). En la sección de aparatos: "jar opener" fue eliminado por no existir en nuestro medio.

Estudio del instrumento. Al Grupo I se le aplicó 2 cuestionarios por paciente: uno autoadministrado que se denominará "formato cuestionario", y el segundo, idéntico al primero, para ser Ilenado por el médico tratante durante la consulta habitual, se le denominará "formato entrevista".

El formato cuestionario se repartió a los pacientes luego de una breve explicación sobre el modo de Ilenarlo, cualquier duda durante el llenado era aclarada en el momento. Los 31 pacientes iniciales completaron el cuestionario autoadministrado en primer lugar y los siguientes 35 pacientes fueron primero entrevistados.

Al grupo II se le aplicó sólo el formato cuestionario y se le visitó en su hogar para verificar la veracidad de la información vertida. Estas evaluaciones se realizaron desde las 09:00 hasta las 16:00 horas, para evitar el efecto de la rigidez matutina y la fatiga vespertina. El intervalo entre las dos evaluaciones varió de 1 a 16 días; el promedio de tiempo transcurrido fue 5,6 días. Fueron comprobados los 9 componentes del instrumento mediante la observación del desempeño del paciente en 15 tareas: cortar "carne" de plastilina, abrir frascos con tapa rosca de varios tamaños, bajar una bolsa de azúcar de 2 Kg ubicada más alta que la cabeza, utilización de sus utensilios y aparatos habituales para caminar, recoger una ropa del piso, barrer, "lavar y secar todo su cuerpo" y "lavarse el cabello" fueron simulados pidiendo al paciente que simule el lavado de la espalda, pies y pelo. Se empleó el sistema de calificación ya referido. No se verificaron las preguntas "usar la ducha", "sentarse o levantarse del water (retrete)", "abrir puertas de carros", entrar y salir de un carro" ni "ir de compras al mercado.

Se investigaron 6 tipos de validez:

Validez de criterio. Se evaluó con los pacientes del Grupo II, correlacionando las respuestas del cuestionario autoadministrado con la habilidad demostrada para realizar estas labores en su hogar. También se evaluó la concordancia total cuestionario/observación domiciliaria, de dos formas: 1) Análisis del porcentaje de concordancia entre el cuestionario y la observación domicililaria. 2) Aplicación del estadístico Kappa ponderado usando como ponderaciones las diferencias de puntos entre las 2 mediciones (cuestionario/ observación domiciliaria). La fiabilidad de la autoadministración fue evaluada con los pacientes del Grupo I, correlacionando los índices de los formatos cuestionario y entrevista. El efecto del orden de administración del instrumento fue estudiado comparando los coeficientes de correlación de ambos subgrupos mediante la transformación z de Fisher.

Validez de constructo. Un constructo es un concepto que tiene el significado añadido de haber sido liberada y conscientemente inventado o adoptado para un propósito científico especial. Para estudiarlo se correlacionó la discapacidad funcional del cuestionario de los pacientes del Grupo I con la escala de discapacidad funcional de Steinbrocker y con variables de actividad de la enfermedad: dolor, rigidez matutina e índice articular. El dolor de la última semana fue cuantificado mediante una escala visual análoga horizontal (EVA) de 10 cm. autoadministrada. La rigidez matutina fue registrada en minutos. Se utilizó un índice articular simplificado de 28 articulacio-nes (14).

Credibilidad ("face validity"). Se aplicó el análisis de factor a la respuesta de las 20 preguntas utilizando la técnica de análisis de los componentes principales. Las respuestas empleadas fueron obtenidas al promediar aquellas de los formatos entrevistas y cues-tionario.

Validez de contenido ("content validity"). Se estudió la coherencia entre los componentes y el índice de discapacidad, examinando las correlaciones entre estos. También se investigó la concisión del instrumento analizando las correlaciones existentes entre los ocho componentes del cuestionario de los pacientes del Grupo I.

Validez discriminante. Fue estudiada observando el promedio y la desviación estándar de los puntajes del HAQ-P en el formato cuestionario.

Viabilidad ("feasibility"). Se observó que porcentaje de los pacientes pudo llenar el cuestionario autoadministrado. Se registró cuantos pacientes habían necesitado la ayuda de un familiar. En 14 pacientes se midió el tiempo empleado en Ilenar el cuestionario.

Métodos estadísticos. Exceptuando 2 situaciones al estudiar el efecto del orden de administración del cuestionario y en el análisis de componentes principales, donde se usó el coeficiente de correlación de Pearson (r), hemos utiIizado el coeficiente de correlación por rangos de Spearman (R) para estudiar las correlaciones porque las mediciones de las respuestas no son realmente de tipo intervalo (15). Los análisis estadísticos fueron realizados utilizando el software SPSS para Windows versión 6.0 (16).


Resultados

La tabla I muestra algunas características demográficas y clínicas de los pacientes evaluados en el Grupo I.

Tabla 1
Pacientes Medias (DS)
Demográficas:
Edad (años) 48.6 (12.7)
Sexo
hombres 8.2% -
mujeres 91.8% -
Educación
analf. y primaria 41.0% -
secundaria 39.3% -
superior 19.7% -
Duración de la enfermedad(años) - 9.36 (8.29)
Variable estudiada:
Clase Funcional 2.05 (0.80)
I 25.0% -
II 48.2% -
III 23.2% -
IV 3.6% -
Dolor (0-10) - 4.8 (2.95)
Indice articular - 13.6 (14.9)
Rigidez matutina (min) - 17.0 (27.9)

 

Validez de criterio. En la Tabla 2 se comparan el formato cuestionario contra la observación domiciliaria de los pacientes del Grupo II. Todos los componentes correlacionan bien (R fluctúa entre 0,71 y 0,87) y tienen una mínima diferencia entre sí. La comparación de los índices del cuestionario y del observador exhibe un coeficiente de Spearman R = 0,90.


Tabla 2

Grupo II. Cuestionario versus observación domiciliaria
Promedios, desviaciones estándar y correlaciones entre métodos
  Vestirse
P1
levantarse
P2
comer
P3
caminar
P4
higiene
P5
alcanzar
P6
coger
P7
actividades
P8
ID
Cuestionario (FC)
X 1.11
1.06
1.25
1.22
0.72
1.28
0.94
1.08
1.09
DS (1.12) (1.01) (1.02) (0.99) (0.97) (1.11) (0.86) (1.05) (0.81)
Observación(FD)
X 0.11
1.14
108
1.31
0.72
1.53
1.11
1.03
1.13
DS (1.06) (0.96) (0.94) (1.01) (0.81) (1.03) (0.95) (0.97) (0.75)
DFC-FO 0 -0.08 0.17 -0.09 0 -0.25 -0.17 0.05 -0.04
Correlación* 0.79 0.82 0.71 0.82 0.87 0.82 0.75 0.78 0.90

*Coeficiente de Spearman. Todos los valores p « 0.01

 

El porcentaje de concordancia entre las respuestas del cuestionario y la observación domiciliaria fue de 72,8%; cuando existieron diferencias, estas fueron en el 82% de las veces de un punto. El estadístico Kappa ponderado fue 0,06.

El análisis de la fiabilidad de la autoadministración se muestra en la Tabla 3, se observa que las correlaciones entre los componentes del formato cuestionario y el formato entrevista oscilan entre 0,55 a 0,84, siendo la correlación final entre índices de discapacidad de 0,87.


Tabla 3

Grupo I. Cuestionario versus entrevista
Medias, desviaciones estándar y correlaciones entre métodos

  vestirse levantarse comer caminar higiene alcanzar coger actividades  
P1 P2 P3 P4 P5 P6 P7 P8 ID
Cuestionario (FC) 
 
X
0.89 0.96 0.96 1.08 1.02 1.34 1.15 1.29 1.09
DS (0.94) (0.90) (1.07) (0.97) (1.06) (0.95) (1.00) (0.79) -
Entrevista
 
X
0.91 0.97 1.09 1.02 0.88 1.41 1.27 1.32 1.11
DS (0.91) (1.10) (1.12) (0.87) (0.99) (1.22) (1.16) (1.14) (0.93)
DFC-FE -0.02 -0.01 -0.13 0.06 0.14 -0.07 -0.1 -0.03 -0.02
Correlación* 0.74 0.80 0.74 0.84 0.65 0.69 0.55 0.69 0.87

*Coeficiente de Spearman. Todos los valores p « 0.01


El orden de administración del instrumento no produjo efecto significativo en el índice de discapacidad. r= 0,86 para la correlación entre los índices de los formatos en los 31 pacientes que primero llenaron el cuestionario y r=0,91 en los 35 pacientes que primero fueron entrevistados. La hipótesis de igualdad entre ambos exhibe una probabilidad de significación p=0,93.

Validez de constructo. En la Tabla 4 encontramos correlación con la escala de discapacidad funcional de Steinbrocker, con la escala de dolor y menor correlación con el índice articular. No hubo correlación demostrable con la rigidez matutina.

Tabla 4

Validez de constructo del HAQ-P
Correlación con otros parámetros de seguimiento

Variable Coeficiente de Spearman p
Clase funcional ARA 0.67 <0.001
Dolor (EVA) 0.51 <0.001
Indice articular 0.38 0.002
Riguidez matutina -0.02 0.90


Tabla 5

Coeficientes de los componentes principales

Pregunta
1.º componente
prinpical
1.º CP2 2.º componente
principal
2.º CP2
P1 0.84 0.71 0.08 0.01
P2 0.83 0.69 -0.09 0.01
P3 0.86 0.74 -0.38 0.14
P4 0.81 0.66 -0.15 0.02
P5 0.82 0.67 0.10 0.01
P6 0.81 0.66 0.30 0.09
P7 0.69 0.48 0.54 0.29
P8 0.86 0.74 -0.34 0.12
P9 0.82 0.67 -0.22 0.05
P10 0.85 0.72 0.00 0.00
P11 0.78 0.61 0.15 0.02
P12 0.84 0.71 -0.08 0.01
P13 0.84 0.71 -0.05 0.00
P14 0.81 0.66 -0.29 0.08
P15 0.85 0.72 0.32 0.10
P16 0.81 0.66 0.39 0.15
P17 0.78 0.61 0.36 0.13
P18 0.81 0.66 0.31 0.10
P19 0.81 0.66 -0.09 0.01
P20 0.88 0.77 0.07 0.00
Eigenvalue   13.50   1.30
% de la varianza 67.6%   6.7%



Credibilidad. Apreciamos en la Tabla 5 que el primer componente principal del índice de discapacidad exhibe coeficientes ("factor loading") altos positivos y aproximadamente iguales para todas las preguntas. El 68% de toda la variabilidad entre personas es explicada por esta única dimensión. El segundo factor explica un 7% adicional de la variabilidad total.

Validez de contenido. En la Tabla 6 se observa la correlación de los componentes entre sí y con el índice de discapacidad, evaluación aplicada al Grupo I para el formato cuestionario. Las correlaciones con el índice son todas positivas y no exceden de 0,82. Las correlaciones entre componentes tienen valores moderados, ubicándose el 90% entre 0,52 y 0,79.


Tabla 6

Grupo I: correlaciones entre componentes y de componentes versus el índice para el formato en cuestionario
  P1 P2 P3 P4 P5 P6 P7 P8 ID
P1 1.00               0.81
P2 0.62 1.00             0.82
P3 0.65 0.60 1.00           0.78
P4 0.63 0.79 0.58 1.00         0.81
P5 0.66 0.55 0.56 0.55 1.00       0.79
P6 0.52 0.69 0.52 0.61 0.53 1.00     0.80
P7 0.54 0.47 0.54 0.49 0.59 0.61 1.00   0.76
P8 0.53 0.58 0.56 0.65 0.67 0.61 0.72 1.00 0.82



Validez discriminante. En la Tabla 3 se observa que los valores promedio de los componentes y el índice de discapacidad del formato cuestionario se agrupan alrededor de la unidad, y sus desviaciones estándar son amplias.

Viabilidad. Se observó que durante el llenado del formato cuestionario los pacientes no encontraron preguntas ambiguas. El 100% de los pacientes fue capaz de llenar el HAQ-P autoadministrado. Observamos que 9 de los 66 pacientes (14%) requirieron ayuda de su acompañante. El tiempo promedio para Ilenar el cuestionario fue de 9 minutos en 14 pacientes. El cálculo del índice de discapacidad puede ser realizado manualmente en 1 minuto.

 

Discusión

Aunque el impacto de una enfermedad es intuitivamente comprensible, realmente no es cuantificable como tal. Las investigaciones en los últimos 20 años han mostrado que lo mejor es medirlo como áreas o dimensiones que representan resultados de la enfermedad distintos pero interrelacionados. Estas dimensiones varían según los autores, generalmente se incluyen las siguientes: disconfort, distress (dolor), efectos adversos del tratamiento, discapacidad física y psicológica, insatisfacción, costo monetario y muerte (17).

En el caso de las enfermedades reumáticas no aparece claramente una dimensión medible como la principal. Para tener una real idea del resultado de la enfermedad se necesita más de un criterio de medición de ellos. La discapacidad física o funcional es posiblemente uno de los más importantes al evaluar los resultados de la artritis (18).

Por su trascendencia la discapacidad física ha sido reconocida en consenso por la OMS y la Liga Internacional Contra el Reumatismo (ILAR) en Génova, 1993, como una de las mediciones esenciales para cualquier ensayo clínico en pacientes con AR (ver Tabla 7).


Tabla 7
Consenso OMS/ILAR. Mediciones esenciales para los ensayos clínicos de artritis reumatoide
1. Dolor
2. Evaluación global por el paciente
3. Discapacidad física
4. Articulaciones hinchadas
5. Artiulaciones dolorosas
6. Reactantes de fase aguda
7. Evaluación global por el médico en estudios
    de duración mayor a un año
8. Radiografías de articulaciones


De todos los instrumentos desarrollados para determinar la capacidad, el HAQ (creado en la Universidad de Stanford en 1980) es el más utilizado en estudios epimiológicos de evaluación a largo plazo de morbilidad (19), como predictor de muerte (20) o utilización de servicios médicos (21) y como medida de discapacidad laboral (22); pero sobre todo es empleado para la detección de cambios en ensayos clínicos. Aunque el HAQ ha sido adaptado al español en Europa(9) y en México (10), las diferencias transculturales existentes hacen necesaria la validación de este instrumento antes de emplearlo en ensayos clínicos con pacientes peruanos (23).

Las diferencias socioculturalres entre los Estados Unidos de Norteamérica y Perú explican la necesidad de modificar varias preguntas en esta versión peruana del HAQ. Un traductor encontraría considerable diferencia entre la versión original y el HAQ-P en 6 preguntas. Esto ya ha sucedido cuando adaptaciones similares han sido realizadas para diferentes países o medios culturales (9). Algunas diferencias culturales entre los peruanos y los norteamericanos son las siguientes: en Perú se utiliza más la ducha que la tina, usualmente se barre en lugar de aspirar, no es común que se cultive un jardín en la casa y normalmente utilizamos el sistema métrico (gramos) en lugar del sistema inglés (libras). Además es inusual consumir leche de caja (se produce confusión con la caja que contiene latas de leche).

Tabla 8

Criterios Metodológicos para evaluar medidas de resultados.*

Criterios de la psicología Criterios biomédicos
1. Validez de criterio 1. Precisión (Accuracy)
2. Validez de constructo 2. Sentido Biológico
3. Validez de aspecto (Face validity) 3. Credibilidad
4. Validez de contenido 4. Amplitud(Comprehensiveness)
5. Validez discriminante 5. Sensibilidad al cambio
6. Viabilidad (Feasibility) 6. Viabilidad

*Adaptado de Bombardier C and tugwell P. Measuring disebility: guidelines for rheumatology studies. J Rheumatol Suppl. 1993, 10:68-73

 

En la Tabla I se observa que demográficamente la muestra estudiada es representativa de la población de pacientes con AR atendida en el HNCH (24) y en Lima (25), con un mejor nivel de educación formal, por haber excluido a los pacientes analfabetos sin acompañante alfabeto.

Tugwell y Bombardier propusieron en 1982 seis tipos de validez que debe poseer un instrumento utilizable en ensayos clínicos. La terminología de estos criterios metodológicos fue adquirida mayormente del campo de la psicología y aunque a primera vista es desconcertante, fácilmente puede relacionarse a los más familiares criterios metodológicos biomédicos (8).

La validez de criterio investiga la precisión, fiabilidad, estabilidad o consistencia del instrumento y puede ser evaluada de diferentes formas (26). Un método de estudiar la validez de criterio es comparar el desempeño del instrumento con el de otra medición más precisa. En esta investigación se comparó contra la verificación directa de las actividades preguntadas. La validez de criterio del HAQ-P queda demostrada por la alta correlación (R = 0,90) entre las respuestas de los pacientes del Grupo II y la observación domiciliaria. También apoya este tipo de validez, la alta correlación (R = 0,87) encontradas al comparar el instrumento autoadministrado versus la entrevista.

En general las escalas funcionales desde el punto de vista de la validez de criterio, son tan o más fiables que muchas variables clínicas como el recuento articular, la VSG o las pruebas inmunoló- gicas (17).

La búsqueda de la validez de constructo es el criterio metodológico más importante para validar esca-las funcionales, se estudia al comparar el desempeño del instrumento contra otras mediciones similares. Como no hay patrones de oro (gold standards) se hace una comparación del instrumento que está siendo pro-bado con otros disponibles que midan conceptos si-milares.

Al comparar el HAQ-P con variables reconocidas de actividad de la AR (Tabla 9), encontramos correlación con el índice de Steinbrocker, con el dolor, y con el índice articular, esto en forma similar a los trabajos revisados. A diferencia de la literatura, no se halla correlación con la rapidez matutina, esto podría explicarse por la rigidez matutina se puede controlar con antiinflamatorios no esteroideos sin lograr impacto sobre la discapacidad funcional.

Tabla 9

Coeficientes de correlación entre el HAQ-P y variables de la artritis reumatoide. Se comara con las versiones inglesa (28), sueca (29), brasilera (30), norteamericana y española.

Variable Peruana
R
Inglesa
R
Sueca
R
Brasilera
r
Americana
r
Española
r
Clase funcional ARA 0.67* - - 0.608 - 0.61*
Dolor (EVA) 0.51 0.64* 0.60* -0.30** 0.60* -
Índice articular 0.38* 0.58* 0.43* - - 0.54*
Rigidez matutina NS 0.40* - - - 0.27*

NS: no significativo, R: coeficiente de correlación de Pearson
*p<0.01
**p<0.05



La credibilidad implica que el instrumento y sus partes mensuren el objeto a medir de un modo razonable. Debido a que no hay patrones de oro perfectos, se apela al juicio del investigador o se evalúa este ítem, verificando si es correcta la agregación de las preguntas individuales en un puntaje sumario.

En este trabajo se analizó la agregación de las preguntas en un índice único mediante la técnica estadística de análisis de factor; con el objeto de disminuir la variación aleatoria se emplearon las medias de los formatos cuestionario y entrevista (Grupo 1) y se utilizaron las 20 preguntas para lograr una máxima sensibilidad. Este análisis permite identificar factores no evidentes comunes a las variables (preguntas) examinadas y calcula el porcentaje de la variabilidad interpersonal total del cuestionario que es explicada por cada factor. Cuando se analiza un instrumento homogéneo (una prueba altamente homogénea mide aIguna habilidad o algún otro aspecto igualmente bien en todas sus partes) una considerable mayoría de su variabilidad total debe ser explicada por el primer factor y este debe exhibir un fuerte coeficiente ("factor loading") para cada una de las preguntas. El gran porcentaje de la variabilidad interpersonal total (68%) explicada por el primer factor y sus altos y aproximadamente iguales coeficientes para cada una de las 20 preguntas corroboran que el HAQP es una prueba homogénea e inferimos que la forma de obtener el índice de discapacidad -una suma con ponderaciones iguales para los 8 componentes es adecuada.

Las preguntas "cortar carne" y "abrir puertas de carro", aunque estadísticamente inmejorables, no satisfacen totalmente a la validez de credibilidad. Así, algunos pacientes no habían abierto puerta de automóvil y otros no habían cortado carne de res en la última semana, pero respondieron a las preguntas suponiendo el grado de dificultad que tendrían.

La sensibilidad de un instrumento para detectar cambios cIínicamente útiles entre paciente o en un mismo paciente luego de un período de observación, es lo que se ha denominado validez discriminante. Igualmente esta validez debería buscarse por comparación con una medida de cambio de precisión reconocida, la cual es inexistente para el área de discapacidad funcional. Sin embargo, el que los valores medios de los componentes y del índice de discapacidad para el formato cuestionario están alejados del cero (Tabla 3), indica una adecuada sensibilidad del instrumento para los niveles mixtos de anormalidad existentes en esta población. Las sustanciales desviaciones estándar indican que las respuestas están individualizadas en lugar de estereotipadas. La adecuada sensibilidad del HAQ para detectar cambios en el tiempo ya ha sido demostrada en otros estudios.

La viabilidad de un cuestionario es su posibilidad de administración. En el diseño del HAQ-P se ha incluido una variante en su forma de administración que permite mejorar su viabilidad; los acompañantes pudieron ayudar a los pacientes en el Ilenado del cuestionario, logrando así que el 100% de los pacientes que cumplían los criterios del estudio completaran el HAQ-P.

En conclusión este estudio sugiere que la versión evaluada de la discapacidad del HAQ es un instrumento válido, fiable y viable para medir capacidad funcional en pacientes con AR en Lima-Perú. Sus propiedades métricas son comparables a las de la versión norteamericana original, así como a aquellas desarrolladas en otros países. Se debe considerar la posible mejora de las preguntas "cortar carne" y "abrir puertas de carros".

 

Agradecimiento

Al Dr. Miguel Campos por brindamos valiosa asesoría en los aspectos metodológicos del trabajo.


Bibliografía