연구원들은 AI가 설계한 DNA 스위치로 유전자를 켜고 끕니다.
잭슨 연구소(JAX), MIT와 하버드의 브로드 연구소, 예일 대학의 연구원들은 인공지능을 사용하여 다양한 세포 유형에서 유전자 발현을 정확하게 제어할 수 있는 수천 개의 새로운 DNA 스위치를 설계했습니다. 그들의 새로운 접근 방식은 인간의 건강과 의학 연구의 이익을 위해 유전자가 신체에서 언제 어디에서 발현되는지를 전에는 불가능했던 방식으로 제어할 가능성을 열어줍니다.
"이러한 합성적으로 설계된 요소의 특별한 점은 설계된 대상 세포 유형에 대해 놀라운 특이성을 보인다는 것입니다." 잭슨 연구소의 준교수이자 이 연구의 공동 수석 저자인 라이언 튜헤이 박사가 말했습니다. "이것은 신체의 나머지 부분에 영향을 미치지 않고 단 하나의 조직에서 유전자 발현을 높이거나 낮출 수 있는 기회를 제공합니다."
최근 몇 년 동안 유전자 편집 기술과 기타 유전자 치료 접근법은 과학자들에게 살아있는 세포 내부의 유전자를 변경할 수 있는 능력을 제공했습니다. 그러나 전체 유기체가 아닌 선택된 세포 유형이나 조직의 유전자에만 영향을 미치는 것은 어려웠습니다. 이는 부분적으로 유전자의 발현과 억제를 제어하는 cis-regulatory elements(CRE)라고 하는 DNA 스위치를 이해하는 데 대한 지속적인 과제 때문입니다.
10월 23일 Nature 온라인 선행호에 게재된 논문에서 Tewhey와 그의 협력자들은 이전에 본 적이 없는 새로운 합성 CRE를 설계했을 뿐만 아니라, CRE를 사용해 다른 세포 유형의 유전자는 켜지 않은 채 뇌, 간, 혈액 세포의 유전자를 성공적으로 활성화했습니다.
조직 및 시간별 지침
유기체의 모든 세포가 동일한 유전자를 포함하고 있지만, 모든 유전자가 모든 세포에 필요한 것은 아니며, 항상 필요한 것도 아닙니다. CRE는 예를 들어 뇌에 필요한 유전자가 피부 세포에 의해 사용되지 않도록 보장하거나, 초기 발달 중에 필요한 유전자가 성인에서 활성화되지 않도록 보장하는 데 도움이 됩니다. CRE 자체는 유전자의 일부가 아니라 별도의 조절 DNA 서열로, 종종 제어하는 유전자 근처에 위치합니다.
과학자들은 인간 게놈에 수천 개의 서로 다른 CRE가 있으며, 각각 약간씩 다른 역할을 한다는 것을 알고 있습니다. 하지만 JAX의 Tewhey 연구실의 계산 과학자이자 새로운 논문의 공동 1저자인 Rodrigo Castro 박사는 "각 CRE가 무엇을 하는지 제어하는 간단한 규칙이 없기 때문에" CRE의 문법을 파악하기 어려웠다고 설명했습니다. "이로 인해 인체의 특정 세포 유형에만 영향을 미치는 유전자 치료법을 설계하는 능력이 제한됩니다."
"이 프로젝트는 본질적으로 '이러한 규제 요소의 코드를 읽고 쓰는 법을 배울 수 있을까?'라는 질문을 던집니다." 예일 대학 유전학 조교수이자 이 연구의 수석 저자 중 한 명인 스티븐 라일리 박사의 말입니다. "언어 측면에서 생각해 보면, 이러한 요소의 문법과 구문은 잘 이해되지 않습니다. 그래서 우리는 우리 스스로 할 수 있는 것보다 더 복잡한 코드를 학습할 수 있는 머신 러닝 방법을 구축하려고 했습니다."
이 그룹은 딥 러닝이라는 인공지능(AI)의 한 형태를 사용하여 실험실에서 혈액, 간, 뇌의 세 가지 세포에서 CRE 활동을 측정한 인간 게놈의 수십만 개의 DNA 시퀀스를 사용하여 모델을 훈련했습니다. AI 모델을 통해 연구자들은 거의 무한한 조합의 가능한 모든 시퀀스에 대한 활동을 예측할 수 있었습니다. 연구자들은 이러한 예측을 분석하여 DNA에서 새로운 패턴을 발견했고, DNA의 CRE 시퀀스 문법이 얼마나 많은 RNA가 만들어질지에 어떤 영향을 미치는지 알아냈습니다. 이는 유전자가 얼마나 활성화되는지에 대한 대리 지표입니다.
연구의 공동 수석 저자이자 Broad Institute의 핵심 연구소 멤버이자 Harvard의 교수인 Pardis Sabeti, MD, DPhil을 포함한 팀은 CODA(Computational Optimization of DNA Activity)라는 플랫폼을 개발했습니다. 이 플랫폼은 AI 모델을 사용하여 요청된 특성을 가진 수천 개의 완전히 새로운 CRE를 효율적으로 설계했습니다. 예를 들어, 인간 간 세포에서 특정 유전자를 활성화하지만 인간 혈액이나 뇌 세포에서는 동일한 유전자를 활성화하지 않습니다. '습식' 및 '건식' 조사를 반복적으로 조합하여 실험 데이터를 사용하여 먼저 계산 모델을 구축한 다음 검증함으로써 연구자들은 각 CRE의 생물학적 영향을 예측하는 프로그램의 능력을 개선하고 개선했으며 자연에서 전에 본 적이 없는 특정 CRE를 설계할 수 있었습니다.
"자연적 CRE는 풍부하지만 가능한 유전적 요소의 아주 작은 부분을 나타내며 자연 선택에 의해 기능이 제한됩니다." Sabeti 연구실의 박사후 연구원인 연구 공동 1저자 Sager Gosai 박사가 말했습니다. "이러한 AI 도구는 진화적 압력의 범위를 벗어나는 생물 제조 및 치료법과 같은 새로운 응용 분야에 대한 유전자 발현을 정확하게 조정하는 유전자 스위치를 설계하는 데 엄청난 잠재력이 있습니다."
원하는 장기를 선택하세요
Tewhey와 그의 동료들은 새로운 AI 설계 합성 CRE를 세포에 첨가하여 원하는 세포 유형에서 유전자를 얼마나 잘 활성화하는지, 그리고 다른 세포에서 유전자 발현을 얼마나 잘 피하는지 측정하여 테스트했습니다. 그들이 발견한 새로운 CRE는 세포 유형과 관련이 있는 것으로 알려진 자연적으로 발생하는 CRE보다 세포 유형에 더 특이적이었습니다.
"합성 CRE는 의미적으로 자연적 요소와 너무 달라서 그 효과에 대한 예측이 불가능해 보였습니다." 고사이가 말했다. "우리는 처음에 많은 시퀀스가 살아있는 세포 내에서 제대로 작동하지 않을 것으로 예상했습니다."
카스트로는 "CODA가 이런 요소를 디자인하는 데 얼마나 능숙한지 정말 놀랍고 감동적이었습니다."라고 말했습니다.
Tewhey와 그의 협력자들은 합성 CRE가 자연적으로 발생하는 CRE보다 더 나은 성능을 보이는 이유를 연구했고, 세포 특이적 합성 CRE에는 표적 세포 유형의 유전자를 발현시키는 시퀀스와 다른 세포 유형의 유전자를 억제하거나 끄는 시퀀스의 조합이 포함되어 있다는 것을 발견했습니다.
마지막으로, 이 그룹은 여러 합성 CRE 시퀀스를 다니오와 생쥐에서 테스트했고, 좋은 결과를 얻었습니다. 예를 들어, 한 CRE는 발달 중인 다니오 간에서 형광 단백질을 활성화할 수 있었지만, 물고기의 다른 부위에서는 그렇지 않았습니다.
"이 기술은 미리 정의된 기능을 가진 새로운 규제 요소를 작성하는 길을 열어줍니다."라고 Tewhey는 말했습니다. "이러한 도구는 기초 연구에 유용할 뿐만 아니라 치료 목적으로 매우 특정한 세포 유형에서 유전자 발현을 제어하는 데 이러한 요소를 사용할 수 있는 중요한 생물의학적 의미를 가질 수도 있습니다."
출처: https://www.sciencedaily.com/releases/2024/10/241023130924.htm
댓글 없음
아름다운 덧글로 인터넷문화를 선도해 주세요