\ [제 6강]GWAS - 전장 유전체 연관분석 과정(Genome wide association study) 과 SNP
본문 바로가기

2상/Nature

[제 6강]GWAS - 전장 유전체 연관분석 과정(Genome wide association study) 과 SNP

728x90

GWAS는 유전자와 표현형 사이의 연관성을 알기 위한 연구로, Genome wide 유전자 전체(유전체)의 association study 연관 분석 연구이다.

단어 뜻에서 보듯이 인간의 경우 23쌍의 모든 DNA를 분석하는 경우이고, EWAS(exome-wide association study)는 exome (단백질 코딩 가능한 지역-exon의 전체)을 분석하는 경우(intron 제외)이다.
이렇게 유전자 전체를 보게 되면 시간과 비용이 높아지므로, 효율성을 높이기 위해 보고자 하는 지역만 보는 연구도 많이 진행된다.

GWAS를 하기 위해 필요한 유전자 염기서열 (genome sequence)은 1990-2003에 진행 한 '인간 유전체 프로젝트 (Human genome project - HGP)' 연구를 통해 인간유전체 시퀀스의 정보를 제공했다. 이를 기반으로 여러 유전학 연구가 진행되었다.

GWAS 연구는 gene & phenotype (유전자와 표현형) 사이의 연관성을 찾는 연구로 먼저 보고자 하는 phenotype을 정해야 한다.
앞으로 phenotype 표현형을 비만(obese)으로 예를 들어 보겠다.

TMI : (표현형은 심혈관질환, 뇌질환 등의 질병이 아니더라도 알코올 분해능력, 근육 생성능력, 피부 노화 등 질병 외의 특징으로도 연구가 많이 진행됨 - 이를 이용해 DTC : direct to consume로 유전자 검사가 진행됨 - DTC는 추후 다룰 예정)

GWAS를 보기 전 SNP에 대한 개념 정리가 필요하다.
GWAS에서 주로 다루는 유전자로 SNP이 있다.
SNP은 single nucleotide polymorphism으로 1개의 뉴클레오타이드의 변화로 인해 polymorphism (다형성)이 일어나는 것=여러 표현형이 나타나는 것이다.
인간의 경우 30억 base가 있으며 서로 99.9%가 동일하고 0.1%의 차이가 있다. 0.1%의 차이로 다형성이 존재한다. (인종 별 차이가 큼-유럽, 아시아, 아프리카 등)
0.1%의 차이 SNP(유전자)으로 질병(표현형) 연관 유전자를 찾는 것이 GWAS이다.

유전자는 끊임없이 재조합(recombination)이 일어난다. 재조합이 자주 일어나는 지역을 유전자 hotspot이라고 한다. 반대로 거리가 가까워 다음 세대 유전자로 진행 시 재조합이 일어나지 않고 항상 같이 이동하는 지역을 LD(linkase disequilibrium)라고 한다. - 항상 같이 이동하는 유전자 블록이라고 이해하면 쉽다.

GWAS 연구 중 통계의 정확도를 높이기 위해 LD 독립적인 SNP을 사용해야 한다. (같은 LD의 SNP은 제거해야 한다)
만약 같은 LD에서 여러 SNP이 비만에 연관성이 있는 것으로 연구가 진행되면 항상 같이 이동하는 SNP이기 때문에 통계적 오류가 생길 수 있다.  

GWAS는 통계기반 연구로 인구 집단 사이에 비교를 하는 방법으로, 이러한 연구는 sample size (실험자)의 크기가 클수록 통계적 신뢰도가 높다. (샘플 사이즈가 작은 경우, 연구의 신뢰성이 떨어질 수 있다)

GWAS는 질병이 있는 집단 (Case, 이 경우의 경우 비만한 환자), 질병이 없는 집단(Control, 대조군, 정상체중의 집단) 사이의 SNP(LD 독립적인 SNP)의 차이를 비교하여, 비만 연관유전자를 찾는 것, 유전자-형질의 관계를 밝히는 것으로 진행한다.

궁금한 내용이 있으시면 댓글 바랍니다~~ 감사합니다

728x90