단백질은 사회적 생물이다. 그들은 또한 카멜레온이다. 세포의 요구에 따라, 그들은 구조가 빠르게 변형되고 복잡한 춤에서 다른 생체 분자를 잡는다.
이러한 파트너십은 생물학적 과정의 핵심이다. 일부는 유전자를 켜거나 끈다. 다른 사람들은 노화“좀비”세포를 뇌 네트워크를 재구성함으로써 우리의 인식과 기억을 자기 파괴 또는 팁 탑 모양으로 유지하도록 자극한다.
이러한 연결은 이미 광범위한 치료법에 영감을 주었으며 생체 분자를 모델링하고 설계할 수 있는 AI에 의해 새로운 요법이 가속화될 수 있다. 그러나 이전 AI 도구는 단백질과 상호 작용에만 초점을 맞추고 단백질이 아닌 파트너를 제쳐두고 있다.
이번 주 사이언스 연구에 따르면 AI의 산소 운반체의 중심을 형성하는 철 함유 소분자를 포함하여 단백질을 물리적으로 잡는 다양한 다른 생체 분자를 모델링하는 AI의 능력을 확대했다.
워싱턴 대학교의 데이비드 베이커 박사가 이끄는 새로운 AI는 생체 분자 설계의 범위를 넓힌다. Rosettafold All-Atom이라고 불리는 이 제품은 이전 단백질 전용 시스템을 기반으로 DNA 및 RNA와 같은 수많은 다른 생체 분자를 통합한다. 또한 특정 단백질 기능에 필수적인 소분자 (예: 철)를 추가한다.
AI는 3D 구조에 대한 아이디어 없이 구성 요소의 시퀀스와 구조에서만 배웠지 만 원자 수준에서 복잡한 분자 기계를 매핑 할 수 있다.
이 연구에서, 생성 AI와 짝을 이루면 Rosettafold All-Atom은 심장병 약물에 쉽게 잡은 단백질을 만들었다. 알고리즘은 또한 혈액이 산소를 운반하는 데 도움이 되는 철이 풍부한 분자 인 헴을 조절하는 단백질과 식물의 화학 물질과 신진 대사를 위해 빛을 흡수하는 박테리아의 화학 물질인 빌린(Bilin)을 생성했다.
이 예는 개념의 증거일 뿐이다. 이 팀은 과학자들을 위해 Rosettafold All-Atom을 대중에게 공개하여 단백질 복합체보다 훨씬 더 복잡한 다중 상호 작용 바이오 컴포넌트를 만들 수 있다. 결과적으로 창조물은 새로운 치료법으로 이어질 수 있다.
보도 자료에서“우리의 목표는 보다 정교한 치료법과 다른 유용한 분자를 생성할 수 있는 AI 도구를 구축하는 것이었다.
꿈을 꾼다
2020년 Google Deepmind의 Alphafold와 Baker Lab의 Rosettafold는 반세기 동안 과학자들을 당황하게하고 단백질 연구 시대를 안내한 단백질 구조 예측 문제를 해결했다. 이 알고리즘의 업데이트 된 버전은 과학에 알려진 모든 단백질 구조를 매핑했다.
다음으로, OpenAi의 ChatGpt와 Google의 Gemini의 기술인 생성 AI는 인상적인 활동을 가진 디자이너 단백질의 창의적인 광란을 창조했다. 새로 생성된 일부 단백질은 칼슘 수준을 확인하는 호르몬을 조절했다. 다른 사람들은 전자 회로에서 트랜지스터와 같은 모양을 쉽게 변화시킬 수 있는 인공 효소 나 단백질로 이어졌다.
단백질 구조의 새로운 세계를 환각함으로써 생성 AI는 생물학과 건강을 조절하기 위해 세대의 합성 단백질을 꿈꾸는 잠재력을 가지고 있다.
그러나 문제가 있다. 디자이너 단백질 AI 모델에는 터널 비전이 있다. 단백질에 너무 집중되어 있다.
생명의 분자 성분, 단백질, DNA 및 지방산을 구상할 때 떠오른다. 그러나 세포 내부에서, 이들 구조는 종종 주변 성분과 맞물린 소분자에 의해 함께 유지되어 기능적 바이오 조립을 형성한다.
한 가지 예는 철을 포함하는 고리 같은 분자인 헴이다. 헴은 적혈구에서 헤모글로빈의 기초로, 신체 전체의 산소를 셔틀하고 다양한 화학적 결합을 사용하여 주변 단백질“후크”를 잡는다.
분자 "문자"문자열로 모델링 될 수 있는 단백질 또는 DNA와 달리 소분자 및 이들의 상호 작용은 포착하기 어렵다. 그러나 생물학의 복잡한 분자 기계에 중요하며 기능을 극적으로 바꿀 수 있다.
그렇기 때문에 새로운 연구에서 연구원들은 단백질을 넘어 AI의 범위를 넓히는 것을 목표로 했다.
“우리는 단백질, DNA 및 기타 변형을 포함한 생물학적 분자에 대한 모든 원자에 대한 3D 좌표를 생성할 수 있는 구조 예측 방법을 개발하기 시작했다.
태그 팀
이 팀은 다른 분자를 통합하기 위해 이전 단백질 모델링 AI를 수정하는 것으로 시작했다.
AI는 세 가지 수준에서 작동한다. 첫 번째는 단백질의 1 차원 "문자"시퀀스를 페이지의 단어와 같이 분석한다. 다음으로, 2D 맵은 각 단백질“단어”가 다른 단백질에서 얼마나 멀리 있는지 추적한다. 마지막으로, 3D 좌표 (GPS와 같은 비트)는 단백질의 전체 구조를 보여준다.
그런 다음 업그레이드가 나온다. 소분자 정보를 모델에 통합하기 위해 팀은 원자 부위 및 화학적 연결에 대한 데이터를 처음 두 층에 추가했다.
세 번째로, 그들은 키랄성, 즉 화학 물질의 구조가 왼쪽이거나 오른 손잡이인 경우에 초점을 맞췄다. 우리의 손과 마찬가지로 화학 물질은 또한 생물학적 결과가 크게 다른 거울 구조를 가질 수 있다. 장갑을 끼고 있는 것처럼 화학 물질의 올바른 "손잡이"만 주어진 바이오 조립 "글러브"에 적합 할 수 있다.
그런 다음 Rosettafold All-Atom은 단백질, 소분자 및 이들의 상호 작용을 설명하는 수십만 개의 데이터 포인트를 갖춘 다수의 데이터 세트에서 교육을 받았다. 결국, 그것은 그럴듯한 단백질 어셈블리를 구축하는 데 유용한 소분자의 일반적인 특성을 배웠다. 사전 점검으로서, 팀은 또한 고품질 예측을 식별하기 위해“신뢰도 게이지”를 추가했다.
이전의 단백질 전용 AI 모델과 달리 Rosettafold All-Atom은“전체 생체 분자 시스템을 모델링 할 수 있습니다”라고 팀은 말했다.
일련의 테스트에서, 업그레이드된 모델은 단백질과 비 단백질 분자 사이의 상호 작용을 빠르게 예측함으로써 주어진 단백질 (약물 발견의 주요 성분)에 소분자를 "도크"하는 법을 학습할 때 이전의 방법을 능가했다.
용감한 새로운 세계
소분자를 통합하면 완전히 새로운 수준의 맞춤형 단백질 설계가 열린다.
개념의 증거로서, 팀은 Rosettafold All-Atom을 3개의 다른 소분자를 위해 이전에 단백질 파트너를 개발하고 설계했던 생성 AI 모델과 맞물려 있었다.
첫 번째는 심장 질환을 치료하는 데 사용되지만 부작용을 가질 수 있는 디옥시게닌(Digoxigenin)이었다. 그것을 잡는 단백질은 독성을 줄인다. 분자에 대한 사전 지식이 없더라도, AI는 배양 세포에서 시험 될 때 Digoxigenin 수준을 강화시키는 몇 가지 단백질 결합제를 설계했다.
AI는 또한 적혈구에서 산소 전달에 중요한 소분자인 헴에 결합하는 단백질과 다양한 생물이 빛을 흡수하는 데 도움이 되는 단백질을 설계했다.
이전의 방법과 달리 팀은 AI가 전문 지식없이 소분자를 잡는“새로운 단백질을 쉽게 생성할 수 있다”고 설명했다.
또한 원자 수준에서 단백질과 소분자 사이의 연결 강도에 대해 매우 정확한 예측을 할 수 있어 복잡한 생체 분자 구조의 완전히 새로운 우주를 합리적으로 구축할 수 있다.
베이커는“전례 없는 정밀도로 모든 곳에서 과학자들에게 생체 분자를 생성할 수 있게 함으로써 의학, 재료 과학 및 그 너머의 미래를 형성할 획기적인 발견과 실제 응용 분야의 문을 열고 있다.
이미지 출처: Ian C. Haydon