복잡한 시스템의 인과 관계 밝히기

인과관계의 핵심에 도달하는 것은 우리 주변 세계를 이해하는 데 핵심입니다. 어떤 변수(생물 종, 투표 지역, 회사 주식 또는 지역 기후)가 한 상태에서 다른 상태로 바뀌는 원인은 미래에 그 변수를 어떻게 형성할 수 있는지에 대한 정보를 제공할 수 있습니다.

그러나 효과를 근본 원인까지 추적하는 것은 많은 변수가 수렴하고, 혼동되고, 인과 관계가 모호해질 수 있는 현실 세계 시스템에서는 금방 어려워질 수 있습니다.

이제 MIT 엔지니어 팀은 인과관계를 추구하는 데 있어 어느 정도 명확성을 제공하고자 합니다. 그들은 복잡한 시스템에서 다른 변수에 영향을 미칠 가능성이 있는 변수를 식별하기 위해 광범위한 상황에 적용할 수 있는 방법을 개발했습니다.

알고리즘 형태의 이 방법은 시간이 지남에 따라 수집된 데이터, 예를 들어 해양 환경에서 다양한 종의 개체 수의 변화를 가져옵니다. 이 방법은 이러한 데이터에서 시스템의 모든 변수 간의 상호 작용을 측정하고 한 변수의 변화(예: 시간이 지남에 따라 한 지역의 정어리 수)가 다른 변수의 상태(예: 같은 지역의 멸치 개체 수)를 예측할 수 있는 정도를 추정합니다.

그런 다음 엔지니어는 어떤 종류의 인과 관계가 있을 가능성이 있는 변수를 연결하는 "인과 관계 맵"을 생성합니다. 알고리즘은 두 변수가 시너지 효과가 있는지(즉, 한 변수가 두 번째 변수와 짝을 이루지 않는 한 다른 변수에 영향을 미치는지) 또는 중복되는지(즉, 한 변수의 변화가 다른 변수와 정확히 동일하고 따라서 중복되는 효과를 가질 수 있는지)와 같은 해당 관계의 구체적인 특성을 결정합니다.

새로운 알고리즘은 또한 "인과적 누출"을 추정할 수 있습니다. 즉, 사용 가능한 변수로 설명할 수 없는 시스템 동작의 정도를 추정할 수 있습니다. 여기에는 알려지지 않은 영향이 작용하고 있기 때문에 더 많은 변수를 고려해야 합니다.

"우리 방법의 중요성은 학문 간 다양성에 있습니다." MIT 항공우주학과(AeroAstro) 대학원생인 알바로 마르티네스-산체스가 말했습니다. "생태계 내 종의 진화, 뇌 내 뉴런의 통신, 지역 간 기후 변수의 상호 작용을 더 잘 이해하는 데 적용할 수 있습니다. 몇 가지 예를 들자면요."

엔지니어들은 이 알고리즘을 사용하여 항공기 연료 소비를 줄일 수 있는 항공기 설계의 특징을 식별하는 등 항공우주 분야의 문제를 해결하는 데 도움을 줄 계획입니다.

AeroAstro의 준교수인 Adrián Lozano-Durán은 "모델에 인과관계를 포함시키면 항공기의 설계 변수 간의 관계와 이것이 효율성과 어떤 관련이 있는지 더 잘 이해하는 데 도움이 될 것으로 기대합니다."라고 말했습니다.

해당 엔지니어들은 MIT 박사후 연구원인 곤살로 아란츠와 함께 Nature Communications 에 연구 결과를 발표했습니다.

연결을 보다

최근 몇 년 동안 복잡한 시스템에 대한 데이터를 수집하고 인과 관계를 나타내는 특정 수학적 설명을 기반으로 시스템 변수 간의 인과 관계를 식별하는 여러 가지 계산 방법이 개발되었습니다.

"다른 방법은 인과관계를 결정하기 위해 다른 수학적 정의를 사용합니다." 로자노-듀란은 지적합니다. "모두 괜찮은 것처럼 들리는 많은 가능한 정의가 있지만, 어떤 조건에서는 실패할 수 있습니다."

특히 그는 기존 방법은 특정 유형의 인과관계를 구별하도록 설계되지 않았다고 말합니다. 즉, 그들은 한 변수가 다른 모든 변수와 별개로 다른 변수에 고유한 영향을 미치는 "고유한" 인과관계와 "상승작용적" 또는 "중복적" 연결을 구별하지 않습니다. 상승작용적 인과관계의 예로는 한 변수(예: 약물 A의 작용)가 다른 변수(사람의 혈압)에 영향을 미치지 않는 경우를 들 수 있습니다. 첫 번째 변수가 두 번째 변수(약물 B)와 짝을 이루지 않는 한 말입니다.

중복 인과성의 예로는 한 변인(학생의 공부 습관)이 다른 변인(좋은 성적을 받을 가능성)에 영향을 미치지만, 그 효과가 다른 변인(학생의 수면 시간)과 동일한 영향을 미치는 경우가 있습니다.

"다른 방법들은 인과관계를 측정하기 위해 변수의 강도에 의존합니다." Arranz가 덧붙여 말했습니다. "따라서 강도가 강하지 않지만 중요한 변수 간의 연결을 놓칠 수 있습니다."

메시징 요금

엔지니어들은 새로운 접근 방식에서 정보 이론에서 한 페이지를 가져왔습니다. 정보 이론은 MIT 명예 교수인 클로드 섀넌이 공식화한 이론을 기반으로 네트워크를 통해 메시지가 어떻게 전달되는지에 대한 과학입니다. 팀은 복잡한 변수 시스템을 메시징 네트워크로 평가하는 알고리즘을 개발했습니다.

"우리는 시스템을 네트워크로 취급하고, 변수는 측정 가능한 방식으로 서로에게 정보를 전달합니다." 로자노-듀란이 설명합니다. "한 변수가 다른 변수에 메시지를 보낸다면, 그것은 어떤 영향을 미쳤음을 의미합니다. 정보 전파를 사용하여 인과 관계를 측정한다는 아이디어입니다."

새로운 알고리즘은 다른 방법처럼 한 번에 한 쌍의 변수를 고려하는 것이 아니라 여러 변수를 동시에 평가합니다. 이 알고리즘은 정보를 한 변수의 변화가 다른 변수의 변화도 볼 가능성으로 정의합니다. 이 가능성과 따라서 변수 간에 교환되는 정보는 알고리즘이 시간이 지남에 따라 시스템의 더 많은 데이터를 평가함에 따라 더 강해지거나 약해질 수 있습니다.

결국, 이 방법은 네트워크의 어떤 변수가 강하게 연결되어 있는지 보여주는 인과 관계 맵을 생성합니다. 연구자들은 이러한 연결의 속도와 패턴을 통해 어떤 변수가 고유하거나, 상승적이거나, 중복적인 관계를 가지고 있는지 구별할 수 있습니다. 이와 동일한 접근 방식을 통해 알고리즘은 시스템의 "인과 관계 누출"의 양을 추정할 수도 있습니다. 즉, 시스템의 동작을 사용 가능한 정보에 따라 예측할 수 없는 정도를 의미합니다.

"우리 방법의 일부는 무언가가 누락되었는지 감지합니다." 로자노-듀란이 말했다. "무엇이 누락되었는지는 모르지만, 무슨 일이 일어나고 있는지 설명하기 위해 더 많은 변수를 포함해야 한다는 것은 알고 있습니다."

이 팀은 일반적으로 인과 추론을 테스트하는 데 사용되는 여러 벤치마크 사례에 알고리즘을 적용했습니다. 이러한 사례는 시간 경과에 따른 포식자-먹이 상호작용 관찰에서 다양한 지리적 지역의 기온과 기압 측정, 해양 환경에서 여러 종의 공진화에 이르기까지 다양합니다. 이 알고리즘은 일부 사례만 처리할 수 있는 대부분의 방법과 비교했을 때 모든 사례에서 인과 관계를 성공적으로 식별했습니다.

연구팀이 SURD(Synergistic-Unique-Redundant Decomposition of Causality)라고 명명한 이 방법은 온라인에서 공개되어 다른 사람들이 각자의 시스템에서 테스트할 수 있습니다.

마르티네즈-산체스는 "SURD는 기후 연구, 신경 과학, 경제학, 역학, 사회 과학, 유체 역학을 포함한 여러 과학 및 엔지니어링 분야에서 발전을 촉진할 잠재력을 가지고 있습니다."라고 말했습니다.

이 연구는 부분적으로 국가과학재단의 지원을 받았습니다.


출처: https://www.sciencedaily.com/releases/2024/11/241101123657.htm

댓글 없음

아름다운 덧글로 인터넷문화를 선도해 주세요