머신러닝을 통해 신약 제조 속도 가속화

연구자들은 자동화된 실험과 AI를 결합하여 화학물질이 서로 어떻게 반응할지 예측하는 플랫폼을 개발했으며, 이를 통해 신약 설계 프로세스를 가속화할 수 있습니다.

분자가 어떻게 반응할지 예측하는 것은 새로운 의약품을 발견하고 제조하는 데 필수적이지만 역사적으로 이는 시행착오 과정이었으며 반응이 실패하는 경우가 많습니다. 분자가 어떻게 반응할지 예측하기 위해 화학자들은 일반적으로 단순화된 모델에서 전자와 원자를 시뮬레이션하는데, 이 프로세스는 계산 비용이 많이 들고 종종 부정확합니다.

이제 캠브리지 대학의 연구자들은 자동화된 실험과 기계 학습을 결합하여 화학 반응성을 이해하고 프로세스 속도를 크게 높이는 유전체학에서 영감을 받은 데이터 기반 접근 방식을 개발했습니다. 그들은 39,000개 이상의 약학적으로 관련된 반응의 데이터 세트에서 검증된 그들의 접근 방식을 화학적 ‘리액톰(reactome)’이라고 불렀습니다.

저널에 보고된 결과 자연화학캠브리지와 화이자 간의 협력 제품입니다.

논문의 제1저자인 케임브리지 캐번디시 연구소의 Emma King-Smith 박사는 “리액톰은 우리가 유기 화학에 대해 생각하는 방식을 바꿀 수 있습니다.”라고 말했습니다. “화학에 대한 더 깊은 이해를 통해 의약품 및 기타 유용한 제품을 훨씬 더 빠르게 만들 수 있습니다. 그러나 더 근본적으로 우리가 얻고자 하는 이해는 분자를 다루는 모든 사람에게 도움이 될 것입니다.”

리액톰 접근 방식은 데이터에서 반응물, 시약, 반응 성능 간의 관련 상관관계를 찾아내고 데이터 자체의 차이를 지적합니다. 데이터는 매우 빠르거나 처리량이 높은 자동화된 실험을 통해 생성됩니다.

King-Smith는 “고처리량 화학은 판도를 바꾸었지만, 우리는 고처리량 실험의 초기 결과에서 관찰할 수 있는 것보다 화학 반응에 대한 더 깊은 이해를 밝힐 수 있는 방법이 있다고 믿었습니다.”라고 말했습니다.

연구를 주도한 Alpha Lee 박사는 “우리의 접근 방식은 반응 구성 요소와 결과 사이의 숨겨진 관계를 밝혀냅니다.”라고 말했습니다. “우리가 모델을 훈련시킨 데이터세트는 방대합니다. 이는 시행착오를 통한 화학적 발견 과정을 빅데이터 시대로 이끄는 데 도움이 될 것입니다.”

에 게재된 관련 논문에서 네이처커뮤니케이션즈팀은 화학자가 분자의 미리 지정된 영역에 정확한 변환을 도입하여 더 빠른 약물 설계를 가능하게 하는 기계 학습 접근 방식을 개발했습니다.

이 접근 방식을 통해 화학자는 복잡한 분자를 처음부터 다시 만들 필요 없이 최종 설계 변경과 같이 복잡한 분자를 조정할 수 있습니다. 실험실에서 분자를 만드는 것은 일반적으로 집을 짓는 것과 같은 다단계 과정입니다. 화학자가 분자의 핵심을 변화시키고자 할 경우 일반적인 방법은 집을 무너뜨리고 처음부터 다시 만드는 것과 같이 분자를 다시 만드는 것입니다. 그러나 핵심 변형은 의약품 설계에 중요합니다.

후기 단계 기능화 반응으로 알려진 일련의 반응은 처음부터 시작할 필요 없이 코어에 화학적 변형을 직접 도입하려고 시도합니다. 그러나 후기 단계의 기능화를 선택적이고 제어하는 ​​것은 어렵습니다. 일반적으로 반응할 수 있는 분자 영역이 많으며 결과를 예측하기가 어렵습니다.

King-Smith는 “후기 단계의 기능화는 예측할 수 없는 결과를 낳을 수 있으며 우리 자신의 전문가 직관을 포함한 현재의 모델링 방법은 완벽하지 않습니다.”라고 말했습니다. “더 예측 가능한 모델을 사용하면 더 나은 검사를 수행할 수 있는 기회를 얻을 수 있습니다.”

연구진은 분자가 반응할 위치와 다양한 반응 조건에 따라 반응 부위가 어떻게 달라지는지 예측하는 기계 학습 모델을 개발했습니다. 이를 통해 화학자는 분자의 핵심을 정밀하게 조정하는 방법을 찾을 수 있습니다.

King-Smith는 “우리는 이러한 복잡한 변환을 예측하기 위해 미세 조정하기 전에 모델의 일반 화학을 효과적으로 가르치는 대규모 분광 데이터에 대해 모델을 사전 훈련했습니다”라고 말했습니다. 이 접근법을 통해 팀은 낮은 데이터의 한계를 극복할 수 있었습니다. 즉, 과학 문헌에 보고된 후기 단계 기능화 반응이 상대적으로 적습니다. 연구팀은 다양한 약물 유사 분자 세트에 대한 모델을 실험적으로 검증했으며 다양한 조건에서 반응성 위치를 정확하게 예측할 수 있었습니다.

이 대표는 “기계학습을 화학에 적용하는 것은 화학 공간의 광대함에 비해 데이터 양이 적다는 문제로 인해 제약을 받는 경우가 많다”고 말했다. “우리가 해결하려는 문제와 유사하지만 동일하지 않은 대규모 데이터 세트에서 학습하는 모델을 설계하는 우리의 접근 방식은 이 근본적인 낮은 데이터 문제를 해결하고 후기 단계 기능화를 넘어서는 발전을 이룰 수 있습니다.”

이 연구는 화이자(Pfizer)와 왕립학회(Royal Society)의 일부 지원을 받았습니다.

출처: https://www.sciencedaily.com/releases/2024/01/240115121204.htm

댓글 없음

아름다운 덧글로 인터넷문화를 선도해 주세요