AlphaFold2




AlphaFold2는 DeepMind에서 개발한 인공지능(AI) 시스템으로, 단백질의 아미노산 서열로부터 3차원(3D) 구조를 원자 수준의 정확도로 예측할 수 있습니다. 이는 50년 동안 해결되지 않았던 단백질 구조 예측 문제에 대한 획기적인 진전을 가져왔으며, 생물학 및 의학 분야에서 큰 주목을 받고 있습니다.
AlphaFold2는 특히 다중 서열 정렬(MSA)과 딥러닝을 활용하여 단백질의 3D 구조를 예측하는데, 이 과정에서 단백질 간의 진화적 정보를 반영합니다.
AlphaFold2는 2020년 CASP14(단백질 구조 예측 대회)에서 우승하며 그 성능을 입증했으며, 이후 전 세계적으로 2억 개 이상의 단백질 구조를 예측하여 공개했습니다. 이 시스템은 약물 개발, 단백질 설계, 단백질 기능 예측 등 다양한 연구 분야에 응용되고 있으며, 특히 질병 관련 단백질 연구와 진단 도구 개발에 중요한 역할을 하고 있습니다.

AlphaFold2의 모델 구조는 단백질의 3차원 구조를 예측하기 위해 설계된 고도로 복잡한 딥러닝 아키텍처입니다. 이 모델은 크게 세 가지 주요 모듈로 나눌 수 있습니다: 입력 처리 모듈, Evoformer 모듈, 그리고 Structure 모듈입니다. 각 모듈은 단백질 서열로부터 최종 3D 구조를 예측하는 데 중요한 역할을 합니다.
AlphaFold2는 다음과 같은 순서로 작동합니다:
입력 처리 모듈: 입력된 아미노산 서열에서 MSA와 템플릿 정보를 생성.
Evoformer 모듈: MSA와 쌍 표현을 반복적으로 업데이트하면서 단백질 내 잔기 간 상호작용을 반복 업데이.
Structure 모듈: 최종 3D 구조를 예측하고 재활용 과정을 통해 이를 개선.
이러한 과정에서 AlphaFold2는 전통적인 물리 기반 모델과 달리, 딥러닝을 통해 진화적 정보와 공간적 제약을 통합하여 매우 정확한 구조 예측을 수행합니다.
*잔기(Residue): 단백질을 구성하는 아미노산을 의미; 단백질은 아미노산들이 길게 연결된 폴리펩타이드 사슬로 이루어져 있는데, 이때 각각의 아미노산이 단백질 구조 내에서 하나의 단위로 남아 있는 것을 잔기라고 부름
이 단계에서는 단백질의 아미노산 서열이 입력으로 제공됩니다. AlphaFold2는 이 서열을 기반으로 다중 서열 정렬(MSA)과 템플릿 정보를 생성합니다. MSA는 주어진 단백질과 유사한 다른 생물체의 단백질 서열을 정렬하여, 진화적 정보를 통해 구조 예측에 도움을 줍니다. 또한, 기존에 알려진 단백질 구조 데이터를 템플릿으로 사용하여 예측을 보완합니다.
Evoformer는 AlphaFold2의 핵심 모듈로, MSA와 아미노산 간의 상호작용 정보를 학습하고 이를 반복적으로 업데이트합니다. Evoformer는 두 가지 주요 표현을 처리합니다:
MSA representation: 입력으로 주어진 MSA는 여러 생물 종에서 유사한 단백질 서열을 정렬한 정보로, 각 아미노산 서열의 진화적 관계를 나타냄니다. 이 정보는 아미노산 간의 상호작용과 구조적 제약을 추론하는 데 중요한 역할을 합니다.
pair representation: Pair Representation은 단백질 내 각 아미노산 잔기 간의 공간적 관계(거리 및 상호작용)를 나타내는 행렬입니다. 초기에는 주로 단백질 서열로부터 추정된 기본적인 공간적 정보를 포함하고 있습니다.
Evoformer는 Axial Attention이라는 주의(attention) 메커니즘을 사용하여, MSA 내에서 아미노산 서열 간의 상호작용(세로 방향)과 잔기 간 상호작용(가로 방향)을 각각 처리합니다. 이를 통해 단백질 서열 내에서 중요한 정보가 무엇인지를 동적으로 학습하고, 이를 바탕으로 잔기 간의 물리적 관계를 예측할 수 있습니다
이 메커니즘은 특히 비인접한 잔기들 간의 관계를 동적으로 학습하는 데 유리하며, 이를 통해 단백질의 전체적인 접힘(folding) 과정을 예측할 수 있습니다. Evoformer는 48개의 블록으로 구성되어 있으며, 각 블록은 MSA와 쌍 표현을 반복적으로 업데이트하면서 점점 더 정확한 구조를 생성합니다.
Evoformer는 MSA와 Pair Representation 간에 정보를 교환하는 메커니즘도 포함하고 있습니다. 예를 들어, Outer Product Mean Block은 MSA에서 얻은 진화적 정보를 바탕으로 Pair Representation을 업데이트하는 데 사용됩니다. 이는 진화적 관계가 공간적 관계에 어떻게 영향을 미치는지를 반영하여, 두 표현이 서로 ...


