뉴스

SNU BIOMEDICAL SCIENCE PROGRAM

[연구동향] MarcoPolo: a method to discover differentially expressed genes in single cell RNA-seq data without depending on prior clustering

2022-06-14l 조회수 742

MarcoPolo: a method to discover differentially expressed genes in single cell RNA-seq data without depending on prior clustering

Nucleic Acids Research, 2022


한범 교수(의과학과)                 정기훈 교수(해부학교실)         이한빈(의대 본과 학부생)


의과대학 한범, 정기훈 교수 연구팀 (제1저자: 이한빈 학부생)은 Single-Cell RNA Sequencing을 통해 질병의 발생과 치료에 중요한 유전자를 발굴하는 AI (인공지능) 알고리즘 “마르코폴로”를 개발해 냈다. 질환의 발병 기전을 연구하고 이를 통해 성공적인 신약 개발을 하려면, 질병의 치료 타겟이 될 수 있는 세포 종류와 “마커 유전자”를 발굴해야 하는데, 최근에는 Single-Cell RNA Sequencing 기술이 개발되어 널리 활용되고 있다. 이와 같은 단일세포 전사체 분석은 세포 하나하나의 유전자 발현량을 개별적으로 측정할 수 있기 때문에, 희귀 세포 등 특정 세포군을 동정해내고, 그 특정 세포 종류에서만 발현되는 핵심 마커 유전자를 발굴 가능케 한다.

하지만 기존 단일세포 전사체 분석에서는 각각의 세포 종류를 클러스터링하며 정의하는 과정에 주관적인 요소가 크게 작용하여, 세포 종류의 정확한 구분에 종종 오류를 범한다는 문제가 있었다. 세포군들을 모호하게 정의하고 분류를 명확하게 하지 못하게 된다면, 실제 생명현상과는 동떨어지는 그릇된 결과 분석을 초래할 수 있는 것이다.

이러한 문제를 해결하기 위하여 서울의대 한범/정기훈 교수 연구팀은, 세포 분류를 선행하지 않고 신약개발 타겟 마커 유전자를 효율적으로 발굴할 수 있는 AI (인공지능) 알고리즘 “마르코폴로”를 개발했다. 이 알고리즘은 단일세포 전사체 데이터를 통합적으로 분석하여 마커 유전자를 찾아내기 때문에, 기존의 선제적 및 인위적 세포 분류를 필요로 하지 않는다.

알고리즘이 어떠한 편견(bias)도 없이 데이터를 전체적으로 조망하며 유전자를 찾아내기 때문에, 신세계 아시아의 새로움을 찾아내고 동방견문록을 편찬하게 된 “마르코 폴로”의 이름이 차용되었다. 이 연구는 Cancer Immunology, Stem Cell 연구 등 주요 의생명 연구분야에서 최근 급부상 중인 Single-Cell RNA Sequencing 분석법 발전의 전기를 마련하여, 다양한 질환의 병인 기전을 밝히고 고부가가치를 창출하는 신약 개발 타겟 선정에 핵심적인 역할을 할 것으로 기대된다.