인공지능이 게놈학 연구를 자동화할 수 있는 방법

캘리포니아 대학교 샌디에이고 의대의 연구자들은 GPT-4와 같은 대규모 언어 모델(LLM)이 유전자의 기능과 상호 작용을 파악하는 기능 유전체학 연구를 자동화하는 데 도움이 될 수 있음을 입증했습니다.

기능 유전체학에서 가장 자주 사용되는 접근 방식인 유전자 세트 풍부화는 실험적으로 식별된 유전자 세트를 기존 유전체학 데이터베이스와 비교하여 기능을 파악하는 것을 목표로 합니다.

그러나 더 흥미롭고 새로운 생물학은 종종 기존 데이터베이스의 범위를 벗어납니다. 인공지능(AI)을 사용하여 유전자 세트를 분석하면 과학자들이 많은 시간을 들여 집중적으로 노동하는 것을 절약할 수 있으며, 과학은 유전자가 어떻게 함께 작용하여 생물학에 영향을 미치는지 이해하는 데 가장 널리 사용되는 방법 중 하나를 자동화하는 데 한 걸음 더 가까워질 수 있습니다.

연구진은 5가지 LLM을 테스트한 결과 GPT-4가 가장 성공적이라는 걸 발견했으며, 흔히 사용되는 유전체학 데이터베이스에서 선별된 유전자 세트의 공통 기능을 식별하는 데 73%의 정확도를 달성했습니다.

무작위 유전자 세트를 분석하라는 요청을 받았을 때 GPT-4는 87%의 경우 이름을 제공하기를 거부했습니다. 이는 GPT-4가 최소한의 환각으로 유전자 세트를 분석할 수 있는 잠재력을 가지고 있음을 보여줍니다.

GPT-4는 또한 명명 과정을 뒷받침하는 자세한 설명을 제공할 수 있었습니다.

LLM이 기능적 유전체학을 자동화하는 잠재력을 충분히 탐구하기 위해서는 추가 연구가 필요하지만, 이 연구는 LLM 개발과 유전체학 및 정밀 의학 분야에 대한 응용에 대한 지속적인 투자가 필요함을 강조합니다.

이를 지원하기 위해 연구자들은 다른 연구자들이 LLM을 기능적 유전체학 워크플로에 통합하는 데 도움이 되는 웹 포털을 만들었습니다.

더 광범위하게 보면, 이번 연구 결과는 AI가 복잡한 정보를 종합하여 훨씬 짧은 시간에 새롭고 검증 가능한 가설을 도출해 과학적 과정에 혁명을 일으킬 수 있는 힘을 가지고 있다는 것을 보여줍니다.

Nature Methods 에 게재된 이 연구는 UC San Diego School of Medicine 및 UC San Diego Jacobs School of Engineering의 교수인 Trey Ideker 박사, Ideker 그룹의 소프트웨어 아키텍트인 Dexter Pratt 박사, Ideker 그룹의 생물의학 박사 후보생인 Clara Hu가 주도했습니다. 이 연구는 부분적으로 National Institutes of Health에서 자금을 지원했습니다.


출처: https://www.sciencedaily.com/releases/2024/12/241202123918.htm

댓글 없음

아름다운 덧글로 인터넷문화를 선도해 주세요