Aproximadamente el 98 por ciento del genoma humano está formado por ADN no codificante, incluidos potenciadores, promotores y otros elementos que regulan la actividad de los genes. Los métodos para estudiar estas regiones tienden a ser costosos, requieren mucho trabajo y son en gran parte de bajo rendimiento.
Sin embargo, para comprender realmente la geografía funcional del genoma no codificante, los investigadores necesitan una forma de aislar y caracterizar miles de millones de elementos reguladores de ADN en su interior de manera simultánea, rápida y en alta resolución. La necesidad es grande, ya que más del 90 por ciento de las variantes identificadas en los estudios de asociación de genoma de rasgos y enfermedades se encuentran en el ADN no codificante.
Al fusionar dos poderosos ensayos basados en secuenciación con una herramienta basada en aprendizaje automático, un equipo de investigación liderado por Xinchen Wang y los miembros asociados Melina Claussnitzer y Manolis Kellis en los programas de Metabolismo y Epigenómica de Broad , respectivamente, ha diseñado un nuevo y poderoso enfoque para medir individualmente la capacidad de los segmentos de ADN no codificantes para controlar la expresión génica, y hacerlo a escala masiva y de alta resolución.
Llamado HiDRA (para la disección de actividad reglamentaria de alta resolución), el enfoque reúne una serie de herramientas ampliamente utilizadas:
- ATAC-seq (Ensayo para la cromatina accesible por transposasa con secuenciación de alto rendimiento), una técnica desarrollada por el miembro asociado de Broad, Jason Buenrostro, que busca en todo el genoma regiones de ADN desenrolladas y transcribebles;
- STARR-seq (Secuenciación de la Región Reguladora Activa de Autotranscripción), un ensayo desarrollado por Alexander Stark, del laboratorio de Kellis, para medir la actividad de promoción de la expresión de segmentos de ADN no codificantes; y
- SHARPR-RE , un algoritmo de aprendizaje automático basado en la SHARPRherramienta de laboratorio de Kellis desarrollado para analizar los datos de los ensayos de reportero masivamente en paralelo .
Al basarse en estos enfoques, HiDRA permite a los investigadores crear bibliotecas masivas de ADN regulador y estudiar su influencia sobre la expresión génica en la resolución a nivel de nucleótidos.
Como informaron en Nature Communications , el equipo aplicó HiDRA a una línea de células sanguíneas para probar cerca de siete millones de fragmentos de ADN no codificantes para los que regulan la expresión de genes, identificando finalmente 65,000. Estos segmentos incluidos claramente marcados como potenciadores y promotores, así como segmentos que carecen de tales marcas, sugieren que el genoma puede albergar tipos adicionales de elementos que controlan la expresión que aún no hemos descubierto.
Además, el equipo utilizó HiDRA para examinar cómo las variantes de ADN de riesgo de enfermedad en los elementos reguladores afectan la expresión génica en comparación con las variantes que no aumentan el riesgo, lo que es una gran ayuda para los investigadores que buscan estudiar cómo las pequeñas variaciones de secuencia en promotores y potenciadores pueden afectar los rasgos humanos y la enfermedad. estados
Los hallazgos del equipo sugieren que HiDRA es un método generalizable para diseccionar los matices de la regulación génica y los roles que desempeñan los diversos elementos funcionales en la enfermedad humana.
El apoyo para este estudio provino del Instituto Nacional de Investigación del Genoma Humano, el Instituto Nacional de Ciencias Médicas Generales y otras fuentes.