Projeto de proteína

Da Wikipédia, a enciclopédia livre
Ir para a navegação Saltar para pesquisar

O design de proteínas é o design racional de novas moléculas de proteínas para projetar novas atividades, comportamentos ou propósitos e para avançar na compreensão básica da função das proteínas. [1] As proteínas podem ser projetadas a partir do zero ( design de novo ) ou fazendo variantes calculadas de uma estrutura de proteína conhecida e sua sequência (denominado redesenho de proteínas ). As abordagens de projeto de proteínas racionais fazem previsões de sequências de proteínas que se dobrarão em estruturas específicas. Essas sequências previstas podem então ser validadas experimentalmente por meio de métodos como síntese de peptídeos , mutagênese direcionada ao local ou síntese de genes artificial.

O design racional de proteínas remonta a meados da década de 1970. [2] Recentemente, no entanto, houve numerosos exemplos de projeto racional bem sucedido de peptídeos e proteínas solúveis em água e até mesmo transmembrana, em parte devido a uma melhor compreensão de diferentes fatores que contribuem para a estabilidade da estrutura da proteína e desenvolvimento de melhores métodos computacionais.

Visão geral e histórico [ editar ]

O objetivo no projeto racional de proteínas é prever as sequências de aminoácidos que se dobrarão para uma estrutura proteica específica. Embora o número de sequências de proteínas possíveis seja vasto, crescendo exponencialmente com o tamanho da cadeia de proteínas, apenas um subconjunto delas se dobrará de forma confiável e rápida para um estado nativo . O projeto de proteínas envolve a identificação de novas sequências dentro deste subconjunto. O estado nativo de uma proteína é o mínimo de energia livre conformacional para a cadeia. Assim, o design de proteínas é a busca por sequências que tenham a estrutura escolhida como mínimo de energia livre. Em certo sentido, é o inverso da previsão da estrutura da proteína . No projeto, uma estrutura terciáriaé especificado e uma sequência que se dobrará a ele é identificada. Por isso, também é denominado dobramento inverso . O projeto de proteínas é então um problema de otimização: usando alguns critérios de pontuação, uma sequência otimizada que se dobrará para a estrutura desejada é escolhida.

Quando as primeiras proteínas foram racionalmente projetadas durante as décadas de 1970 e 1980, a sequência para estas foi otimizada manualmente com base em análises de outras proteínas conhecidas, a composição da sequência, cargas de aminoácidos e a geometria da estrutura desejada. [2] As primeiras proteínas projetadas são atribuídas a Bernd Gutte, que projetou uma versão reduzida de um catalisador conhecido, ribonuclease bovina, e estruturas terciárias que consistem em folhas beta e alfa-hélices, incluindo um aglutinante de DDT . Urry e colegas mais tarde projetaram peptídeos fibrosos semelhantes à elastina com base em regras sobre a composição da sequência. Richardson e colaboradores projetaram uma proteína de 79 resíduos sem homologia de sequência com uma proteína conhecida. [2]Na década de 1990, o advento de computadores poderosos, bibliotecas de conformações de aminoácidos e campos de força desenvolvidos principalmente para simulações de dinâmica molecular permitiram o desenvolvimento de ferramentas computacionais de projeto de proteínas baseadas em estrutura. Após o desenvolvimento dessas ferramentas computacionais, grande sucesso foi alcançado nos últimos 30 anos no projeto de proteínas. A primeira proteína projetada com sucesso completamente de novo foi feita por Stephen Mayo e colaboradores em 1997, [3] e, logo depois, em 1999, Peter S. Kim e colaboradores projetaram dímeros, trímeros e tetrâmeros de bobinas enroladas destras não naturais . [4] [5] Em 2003,O laboratório de David Baker projetou uma proteína completa para uma dobra nunca antes vista na natureza. [6] Mais tarde, em 2008, o grupo de Baker projetou enzimas computacionalmente para duas reações diferentes. [7] Em 2010, um dos anticorpos neutralizantes mais poderosos foi isolado do soro do paciente usando uma sonda de proteína projetada computacionalmente. [8] Devido a esses e outros sucessos (por exemplo, veja os exemplos abaixo), o design de proteínas tornou-se uma das ferramentas mais importantes disponíveis para engenharia de proteínas . Há uma grande esperança de que o projeto de novas proteínas, pequenas e grandes, tenha uso em biomedicina e bioengenharia .


Modelos subjacentes de estrutura e função de proteínas [ editar ]

Os programas de design de proteínas usam modelos de computador das forças moleculares que impulsionam as proteínas em ambientes in vivo . Para tornar o problema tratável, essas forças são simplificadas por modelos de design de proteínas. Embora os programas de design de proteínas variem muito, eles precisam abordar quatro questões principais de modelagem: Qual é a estrutura alvo do design, qual flexibilidade é permitida na estrutura alvo, quais sequências são incluídas na busca e qual campo de força será usado para sequências e estruturas de pontuação.

Estrutura de destino [ editar ]

A proteína Top7 foi uma das primeiras proteínas projetadas para uma dobra que nunca havia sido vista antes na natureza [6]

A função da proteína é fortemente dependente da estrutura da proteína, e o design racional da proteína usa essa relação para projetar a função projetando proteínas que têm uma estrutura ou dobra alvo. Assim, por definição, no projeto racional de proteínas, a estrutura alvo ou conjunto de estruturas deve ser conhecido de antemão. Isso contrasta com outras formas de engenharia de proteínas, como a evolução dirigida , onde uma variedade de métodos é usada para encontrar proteínas que atingem uma função específica, e com a previsão da estrutura da proteína, onde a sequência é conhecida, mas a estrutura é desconhecida.

Na maioria das vezes, a estrutura alvo é baseada em uma estrutura conhecida de outra proteína. No entanto, novas dobras não vistas na natureza tornaram-se cada vez mais possíveis. Peter S. Kim e colegas de trabalho projetaram trímeros e tetrâmeros de bobinas não naturais, que não haviam sido vistas antes na natureza. [4] [5] A proteína Top7, desenvolvida no laboratório de David Baker , foi projetada completamente usando algoritmos de design de proteínas, para uma dobra completamente nova. [6] Mais recentemente, Baker e colegas de trabalho desenvolveram uma série de princípios para projetar estruturas de proteínas globulares ideais com base em funis de dobramento de proteínasque faz a ponte entre a previsão da estrutura secundária e as estruturas terciárias. Esses princípios, que se baseiam na previsão da estrutura da proteína e no design da proteína, foram usados ​​para projetar cinco novas topologias de proteínas diferentes. [9]

Espaço de sequência [ editar ]

FSD-1 (mostrado em azul, PDB id: 1FSV) foi o primeiro projeto computacional de novo de uma proteína completa. [3] A dobra alvo foi a do dedo de zinco nos resíduos 33-60 da estrutura da proteína Zif268 (mostrado em vermelho, PDB id: 1ZAA). A sequência projetada tinha muito pouca identidade de sequência com qualquer sequência de proteína conhecida.

No projeto de proteína racional, as proteínas podem ser redesenhadas a partir da sequência e estrutura de uma proteína conhecida, ou completamente do zero no projeto de proteína de novo . No redesenho de proteínas, a maioria dos resíduos na sequência é mantida como seu aminoácido de tipo selvagem, enquanto alguns podem sofrer mutações. No projeto de novo , toda a sequência é projetada de novo, com base em nenhuma sequência anterior.

Tanto os designs de novo quanto os redesenhos de proteínas podem estabelecer regras sobre o espaço de sequência : os aminoácidos específicos que são permitidos em cada posição de resíduo mutável. Por exemplo, a composição da superfície da sonda RSC3 para selecionar anticorpos amplamente neutralizantes de HIV foi restringida com base em dados evolutivos e balanceamento de carga. Muitas das primeiras tentativas de projeto de proteínas foram fortemente baseadas em regras empíricas sobre o espaço de sequência. [2] Além disso, o design de proteínas fibrosas geralmente segue regras estritas sobre o espaço de sequência. As proteínas projetadas à base de colágeno , por exemplo, geralmente são compostas por padrões de repetição Gly-Pro-X. [2]O advento de técnicas computacionais permite projetar proteínas sem intervenção humana na seleção de sequências. [3]

Flexibilidade estrutural [ editar ]

Programas comuns de design de proteínas usam bibliotecas de rotâmeros para simplificar o espaço conformacional das cadeias laterais de proteínas. Esta animação percorre todos os rotâmeros do aminoácido isoleucina com base na Penultimate Rotamer Library. [10]

No projeto de proteínas, a estrutura (ou estruturas) alvo da proteína é conhecida. No entanto, uma abordagem de projeto de proteína racional deve modelar alguma flexibilidade na estrutura alvo para aumentar o número de sequências que podem ser projetadas para essa estrutura e minimizar a chance de uma sequência dobrar para uma estrutura diferente. Por exemplo, em um redesenho de proteína de um pequeno aminoácido (como alanina) no núcleo compactado de uma proteína, muito poucos mutantes seriam previstos por uma abordagem de projeto racional para dobrar à estrutura alvo, se as cadeias laterais circundantes não podem ser reembalados.

Assim, um parâmetro essencial de qualquer processo de projeto é a quantidade de flexibilidade permitida tanto para as cadeias laterais quanto para o backbone. Nos modelos mais simples, a estrutura da proteína é mantida rígida enquanto algumas das cadeias laterais da proteína podem mudar de conformação. No entanto, cadeias laterais podem ter muitos graus de liberdade em seus comprimentos de ligação, ângulos de ligação e ângulos diédricos χ . Para simplificar este espaço, os métodos de design de proteínas usam bibliotecas de rotâmeros que assumem valores ideais para comprimentos de ligação e ângulos de ligação, enquanto restringem ângulos diédricos χ a algumas conformações de baixa energia frequentemente observadas denominadas rotâmeros .

As bibliotecas de rotâmeros são derivadas da análise estatística de muitas estruturas de proteínas. Bibliotecas de rotâmeros independentes de backbone descrevem todos os rotâmeros. [10] Bibliotecas de rotâmeros dependentes da espinha dorsal , em contraste, descrevem os rotâmeros como a probabilidade de eles aparecerem dependendo do arranjo da espinha dorsal da proteína ao redor da cadeia lateral. [11] A maioria dos programas de design de proteínas usa uma conformação (por exemplo, o valor modal para diédricos do rotâmero no espaço) ou vários pontos na região descrita pelo rotâmero; o programa de design de proteína OSPREY, em contraste, modela toda a região contínua. [12]

Embora o design racional de proteínas deva preservar a dobra geral da estrutura de uma proteína, permitir alguma flexibilidade da estrutura pode aumentar significativamente o número de sequências que se dobram para a estrutura, mantendo a dobra geral da proteína. [13] A flexibilidade do backbone é especialmente importante no redesenho de proteínas porque as mutações de sequência geralmente resultam em pequenas alterações na estrutura do backbone. Além disso, a flexibilidade do backbone pode ser essencial para aplicações mais avançadas de design de proteínas, como previsão de ligação e design de enzimas. Alguns modelos de flexibilidade de backbone de design de proteína incluem movimentos de backbone global pequenos e contínuos, amostras discretas de backbone ao redor da dobra alvo, movimentos de backrub e flexibilidade de loop de proteína. [13] [14]

Função de energia [ editar ]

Comparação de várias funções de energia potencial. As energias mais precisas são aquelas que usam cálculos de mecânica quântica, mas são muito lentos para o projeto de proteínas. No outro extremo, as funções heurísticas de energia, são baseadas em termos estatísticos e são muito rápidas. No meio estão as funções de energia da mecânica molecular que são baseadas fisicamente, mas não são tão caras computacionalmente quanto as simulações da mecânica quântica. [15]

As técnicas de projeto de proteínas racionais devem ser capazes de discriminar sequências que serão estáveis ​​sob a dobra alvo daquelas que prefeririam outros estados competitivos de baixa energia. Assim, o design de proteínas requer funções de energia precisas que podem classificar e pontuar sequências de acordo com a forma como elas se dobram à estrutura alvo. Ao mesmo tempo, no entanto, essas funções de energia devem considerar os desafios computacionais por trás do design de proteínas. Um dos requisitos mais desafiadores para um projeto bem-sucedido é uma função de energia que seja precisa e simples para cálculos computacionais.

As funções de energia mais precisas são aquelas baseadas em simulações de mecânica quântica. No entanto, essas simulações são muito lentas e normalmente impraticáveis ​​para o projeto de proteínas. Em vez disso, muitos algoritmos de projeto de proteínas usam funções de energia baseadas em física adaptadas de programas de simulação de mecânica molecular , funções de energia baseadas em conhecimento ou uma mistura híbrida de ambos. A tendência tem sido usar mais funções de energia potencial baseadas na física. [15]

Funções de energia baseadas em física, como AMBER e CHARMM , são tipicamente derivadas de simulações de mecânica quântica e dados experimentais de termodinâmica, cristalografia e espectroscopia. [16] Essas funções de energia normalmente simplificam a função de energia física e as tornam decomponíveis em pares, o que significa que a energia total de uma conformação de proteína pode ser calculada adicionando a energia em pares entre cada par de átomos, o que os torna atraentes para algoritmos de otimização. Funções de energia baseadas em física tipicamente modelam um termo de Lennard-Jones atraente-repulsivo entre átomos e um termo coulombico eletrostático par a par [17] entre átomos não ligados.

As ligações de hidrogênio mediadas pela água desempenham um papel fundamental na ligação proteína-proteína. Uma dessas interações é mostrada entre os resíduos D457, S365 na cadeia pesada do anticorpo VRC01 amplamente neutralizante do HIV (verde) e os resíduos N58 e Y59 na proteína do envelope do HIV GP120 (roxo). [18]

Os potenciais estatísticos, em contraste com os potenciais baseados na física, têm a vantagem de serem rápidos de calcular, de contabilizar implicitamente efeitos complexos e de serem menos sensíveis a pequenas mudanças na estrutura da proteína. [19] Essas funções de energia são baseadas na derivação de valores de energia da frequência de aparecimento em um banco de dados estrutural.

O projeto de proteínas, no entanto, tem requisitos que às vezes podem ser limitados em campos de força da mecânica molecular. Os campos de força da mecânica molecular, que têm sido usados ​​principalmente em simulações de dinâmica molecular, são otimizados para a simulação de sequências únicas, mas o projeto de proteínas busca muitas conformações de muitas sequências. Assim, os campos de força da mecânica molecular devem ser adaptados para o projeto de proteínas. Na prática, as funções de energia de projeto de proteínas geralmente incorporam termos estatísticos e termos baseados em física. Por exemplo, a função de energia de Rosetta, uma das funções de energia mais usadas, incorpora termos de energia baseados em física originados na função de energia CHARMM e termos de energia estatística, como probabilidade de rotâmero e eletrostática baseada em conhecimento. Normalmente, as funções de energia são altamente personalizadas entre laboratórios,[16]

Desafios para funções de energia de projeto eficazes [ editar ]

A água compõe a maioria das moléculas que cercam as proteínas e é o principal condutor da estrutura das proteínas. Assim, modelar a interação entre água e proteína é vital no projeto de proteínas. O número de moléculas de água que interagem com uma proteína em um dado momento é enorme e cada uma possui um grande número de graus de liberdade e parceiros de interação. Em vez disso, os programas de design de proteínas modelam a maioria dessas moléculas de água como um continuum, modelando tanto o efeito hidrofóbico quanto a polarização de solvatação. [16]

Moléculas de água individuais podem às vezes ter um papel estrutural crucial no núcleo das proteínas e nas interações proteína-proteína ou proteína-ligante. Deixar de modelar tais águas pode resultar em previsões erradas da sequência ideal de uma interface proteína-proteína. Como alternativa, moléculas de água podem ser adicionadas aos rotâmeros.

[16]


Como um problema de otimização [ editar ]

Esta animação ilustra a complexidade de uma pesquisa de projeto de proteína, que normalmente compara todas as conformações de rotâmeros de todas as mutações possíveis em todos os resíduos. Neste exemplo, os resíduos Phe36 e His 106 podem sofrer mutação para, respectivamente, os aminoácidos Tyr e Asn. Phe e Tyr têm 4 rotâmeros cada na biblioteca de rotâmeros, enquanto Asn e His têm 7 e 8 rotâmeros, respectivamente, na biblioteca de rotâmeros (da penúltima biblioteca de rotâmeros de Richardson [10] ). A animação percorre todas as (4 + 4) x (7 + 8) = 120 possibilidades. A estrutura mostrada é a da mioglobina, PDB id: 1mbn.

O objetivo do projeto de proteínas é encontrar uma sequência de proteínas que se dobre em uma estrutura alvo. Um algoritmo de projeto de proteína deve, portanto, pesquisar todas as conformações de cada sequência, em relação à dobra alvo, e classificar as sequências de acordo com a conformação de energia mais baixa de cada uma, conforme determinado pela função de energia de projeto da proteína. Assim, uma entrada típica para o algoritmo de projeto de proteína é a dobra alvo, o espaço de sequência, a flexibilidade estrutural e a função de energia, enquanto a saída é uma ou mais sequências que se prevê dobrar de forma estável à estrutura alvo.

O número de sequências de proteínas candidatas, no entanto, cresce exponencialmente com o número de resíduos de proteínas; por exemplo, existem 20.100 sequências de proteínas de comprimento 100. Além disso, mesmo que as conformações da cadeia lateral de aminoácidos sejam limitadas a alguns rotâmeros (veja Flexibilidade estrutural ), isso resulta em um número exponencial de conformações para cada sequência. Assim, em nossa proteína de 100 resíduos, e supondo que cada aminoácido tenha exatamente 10 rotâmeros, um algoritmo de busca que busque este espaço terá que buscar mais de 200 100 conformações de proteínas.

As funções de energia mais comuns podem ser decompostas em termos de pares entre rotâmeros e tipos de aminoácidos, o que torna o problema combinatório, e poderosos algoritmos de otimização podem ser usados ​​para resolvê-lo. Nesses casos, a energia total de cada conformação pertencente a cada sequência pode ser formulada como uma soma de termos individuais e pares entre posições de resíduos. Se um designer está interessado apenas na melhor sequência, o algoritmo de design de proteína requer apenas a conformação de energia mais baixa da sequência de energia mais baixa. Nestes casos, a identidade de aminoácidos de cada rotâmero pode ser ignorada e todos os rotâmeros pertencentes a diferentes aminoácidos podem ser tratados da mesma forma. Seja ri um rotâmero na posição do resíduo i na cadeia proteica, e E (r i ) a energia potencial entre os átomos internos do rotâmero. Seja E ( r i , r j ) a energia potencial entre ri e rotâmero r j na posição do resíduo j . Então, definimos o problema de otimização como um de encontrar a conformação de energia mínima ( E T ):


 

 

 

 

( 1 )

O problema de minimizar ET é um problema NP-difícil . [14] [20] [21] Embora a classe de problemas seja NP-difícil, na prática muitas instâncias de projeto de proteínas podem ser resolvidas exatamente ou otimizadas satisfatoriamente por meio de métodos heurísticos.


Algoritmos [ editar ]

Vários algoritmos foram desenvolvidos especificamente para o problema de projeto de proteínas. Esses algoritmos podem ser divididos em duas grandes classes: algoritmos exatos, como eliminação sem saída , que não possuem garantias de tempo de execução , mas garantem a qualidade da solução; e heurísticaalgoritmos, como Monte Carlo, que são mais rápidos que algoritmos exatos, mas não têm garantias sobre a otimalidade dos resultados. Algoritmos exatos garantem que o processo de otimização produziu o ideal de acordo com o modelo de design da proteína. Assim, se as previsões dos algoritmos exatos falharem quando estes forem validados experimentalmente, então a fonte do erro pode ser atribuída à função de energia, à flexibilidade permitida, ao espaço de sequência ou à estrutura alvo (por exemplo, se não puder ser projetado). [22]

Alguns algoritmos de design de proteínas estão listados abaixo. Embora esses algoritmos abordem apenas a formulação mais básica do problema de design de proteínas, a Equação ( 1), quando a meta de otimização muda porque os designers introduzem melhorias e extensões no modelo de design de proteínas, como melhorias na flexibilidade estrutural permitida (por exemplo, flexibilidade do backbone de proteínas) ou incluindo termos de energia sofisticados, muitas das extensões no design de proteínas que melhoram a modelagem são construídos sobre esses algoritmos. Por exemplo, o Rosetta Design incorpora termos sofisticados de energia e flexibilidade de backbone usando Monte Carlo como algoritmo de otimização subjacente. Os algoritmos da OSPREY baseiam-se no algoritmo de eliminação de becos sem saída e A* para incorporar movimentos contínuos de backbone e side-chain. Assim, esses algoritmos fornecem uma boa perspectiva sobre os diferentes tipos de algoritmos disponíveis para o projeto de proteínas.

Em julho de 2020, cientistas relataram o desenvolvimento de um processo baseado em IA usando bancos de dados de genoma para o design baseado em evolução de novas proteínas. Eles usaram o aprendizado profundo para identificar regras de design. [23] [24]

Com garantias matemáticas [ editar ]

Eliminação sem saída [ editar ]

O algoritmo de eliminação de beco sem saída (DEE) reduz o espaço de busca do problema de forma iterativa, removendo rotâmeros que podem ser comprovados como não fazendo parte da conformação global de energia mais baixa (GMEC). Em cada iteração, o algoritmo de eliminação de beco sem saída compara todos os possíveis pares de rotâmeros em cada posição de resíduo e remove cada rotâmero r' i que pode ser mostrado como sempre de maior energia do que outro rotâmero r i e, portanto, não faz parte do GMEC:

Outras extensões poderosas para o algoritmo de eliminação de beco sem saída incluem o critério de eliminação de pares e o critério de eliminação de beco sem saída generalizado . Este algoritmo também foi estendido para lidar com rotâmeros contínuos com garantias comprovadas.

Embora o algoritmo de eliminação Dead-end seja executado em tempo polinomial em cada iteração, ele não pode garantir a convergência. Se, após um certo número de iterações, o algoritmo de eliminação sem saída não podar mais rotâmeros, então ou os rotâmeros devem ser mesclados ou outro algoritmo de pesquisa deve ser usado para pesquisar o espaço de pesquisa restante. Nesses casos, a eliminação do beco sem saída atua como um algoritmo de pré-filtragem para reduzir o espaço de busca, enquanto outros algoritmos, como A*, Monte Carlo, Programação Linear ou FASTER, são usados ​​para buscar o espaço de busca restante. [14]

Ramificar e ligar [ editar ]

O espaço conformacional do desenho da proteína pode ser representado como uma árvore , onde os resíduos da proteína são ordenados de forma arbitrária e os ramos da árvore em cada um dos rotâmeros em um resíduo. Os algoritmos de ramificação e limite usam essa representação para explorar eficientemente a árvore de conformação: Em cada ramificação , os algoritmos de ramificação e limite limitam o espaço de conformação e exploram apenas as ramificações promissoras. [14] [25] [26]

Um algoritmo de pesquisa popular para design de proteínas é o algoritmo de pesquisa A* . [14] [26] A* calcula uma pontuação de limite inferior em cada caminho de árvore parcial que limita (com garantias) a energia de cada um dos rotâmeros expandidos. Cada conformação parcial é adicionada a uma fila de prioridade e em cada iteração o caminho parcial com o limite inferior mais baixo é retirado da fila e expandido. O algoritmo pára quando uma conformação completa é enumerada e garante que a conformação é a ideal.

A pontuação A* f no desenho da proteína consiste em duas partes, f=g+h . g é a energia exata dos rotâmeros que já foram atribuídos na conformação parcial. h é um limite inferior na energia dos rotâmeros que ainda não foram atribuídos. Cada um é projetado como segue, onde d é o índice do último resíduo atribuído na conformação parcial.

Programação linear inteira [ editar ]

O problema de otimizar E T (Equação ( 1 )) pode ser facilmente formulado como um programa linear inteiro (ILP). [27] Uma das formulações mais poderosas usa variáveis ​​binárias para representar a presença de um rotâmero e arestas na solução final, e restringe a solução a ter exatamente um rotâmero para cada resíduo e uma interação pareada para cada par de resíduos:

rua

Os solucionadores de ILP, como o CPLEX , podem calcular a solução ideal exata para grandes instâncias de problemas de design de proteínas. Esses solucionadores usam um relaxamento de programação linear do problema, onde q i e q ij podem assumir valores contínuos, em combinação com um algoritmo de ramificação e corte para buscar apenas uma pequena porção do espaço de conformação para a solução ótima. Os solucionadores de ILP foram mostrados para resolver muitos casos do problema de posicionamento da cadeia lateral. [27]

Aproximações baseadas em passagem de mensagens para a programação linear dual [ editar ]

Os solucionadores de ILP dependem de algoritmos de programação linear (LP), como o Simplex ou métodos baseados em barreira para realizar o relaxamento de LP em cada ramificação. Esses algoritmos de LP foram desenvolvidos como métodos de otimização de uso geral e não são otimizados para o problema de projeto de proteínas (Equação ( 1 )). Em consequência, o relaxamento LP torna-se o gargalo dos solucionadores de ILP quando o tamanho do problema é grande. [28] Recentemente, várias alternativas baseadas em algoritmos de passagem de mensagens foram projetadas especificamente para a otimização do relaxamento de LP do problema de projeto de proteínas. Esses algoritmos podem aproximar tanto o dual quanto o primal.instâncias da programação inteira, mas para manter garantias de otimalidade, elas são mais úteis quando usadas para aproximar o dual do problema de projeto de proteínas, porque aproximar o dual garante que nenhuma solução seja perdida. Aproximações baseadas em passagem de mensagens incluem o algoritmo de passagem de mensagens de produto máximo com árvore ponderada , [29] [30] e o algoritmo de programação linear de passagem de mensagens . [31]

Algoritmos de otimização sem garantias [ editar ]

Monte Carlo e recozimento simulado [ editar ]

Monte Carlo é um dos algoritmos mais utilizados para o projeto de proteínas. Em sua forma mais simples, um algoritmo de Monte Carlo seleciona um resíduo aleatoriamente, e nesse resíduo um rotâmero escolhido aleatoriamente (de qualquer aminoácido) é avaliado. [21] A nova energia da proteína, E nova , é comparada com a energia velha E velha e o novo rotâmero é aceito com probabilidade de:

onde β é a constante de Boltzmann e a temperatura T pode ser escolhida de tal forma que nas rodadas iniciais ela seja alta e seja lentamente recozida para superar os mínimos locais. [12]

MAIS RÁPIDO [ editar ]

O algoritmo FASTER usa uma combinação de critérios determinísticos e estocásticos para otimizar sequências de aminoácidos. A FASTER primeiro usa o DEE para eliminar rotâmeros que não fazem parte da solução ideal. Em seguida, uma série de etapas iterativas otimizam a atribuição do rotâmero. [32] [33]

Propagação de crenças [ editar ]

Na propagação de crenças para projeto de proteínas, o algoritmo troca mensagens que descrevem a crença que cada resíduo tem sobre a probabilidade de cada rotâmero em resíduos vizinhos. O algoritmo atualiza as mensagens a cada iteração e itera até a convergência ou até um número fixo de iterações. A convergência não é garantida no design de proteínas. A mensagem m i → j (r j que um resíduo i envia para cada rotâmero (r j no resíduo vizinho j é definido como:

Tanto a propagação de crenças de produto máximo quanto de produto de soma foram usadas para otimizar o design de proteínas.

Aplicações e exemplos de proteínas projetadas [ editar ]

Projeto enzimático [ editar ]

O design de novas enzimas é um uso do design de proteínas com grandes aplicações biomédicas e de bioengenharia. Em geral, projetar uma estrutura de proteína pode ser diferente de projetar uma enzima, porque o projeto de enzimas deve considerar muitos estados envolvidos no mecanismo catalítico . No entanto, o design de proteínas é um pré-requisito do design de enzimas de novo porque, no mínimo, o design de catalisadores requer um andaime no qual o mecanismo catalítico possa ser inserido. [34]

Grande progresso no projeto de enzimas de novo , e redesenho, foi feito na primeira década do século 21. Em três estudos principais, David Baker e colaboradores projetaram de novo enzimas para a reação retroaldol , [35] uma reação de eliminação de Kemp, [36] e para a reação de Diels-Alder . [37] Além disso, Stephen Mayo e colaboradores desenvolveram um método iterativo para projetar a enzima conhecida mais eficiente para a reação de eliminação de Kemp. [38] Além disso, no laboratório de Bruce Donald , o design computacional de proteínas foi usado para mudar a especificidade de um dos domínios de proteínas dopéptido não ribossómico sintetase que produz Gramicidina S , a partir do seu substrato natural fenilalanina para outros substratos não cognatos incluindo aminoácidos carregados; as enzimas redesenhadas tinham atividades próximas às do tipo selvagem. [39]

Design para afinidade [ editar ]

As interações proteína-proteína estão envolvidas na maioria dos processos bióticos. Muitas das doenças mais difíceis de tratar, como Alzheimer , muitas formas de câncer (por exemplo, TP53 ) e infecção pelo vírus da imunodeficiência humana ( HIV ) envolvem interações proteína-proteína. Assim, para tratar tais doenças, é desejável projetar proteínas ou terapias semelhantes a proteínas que se liguem a um dos parceiros da interação e, assim, interrompam a interação causadora da doença. Isso requer a concepção de terapias proteicas para afinidade em relação ao seu parceiro.

As interações proteína-proteína podem ser projetadas usando algoritmos de projeto de proteína porque os princípios que governam a estabilidade da proteína também governam a ligação proteína-proteína. O projeto de interação proteína-proteína, no entanto, apresenta desafios que normalmente não estão presentes no projeto de proteínas. Um dos desafios mais importantes é que, em geral, as interfaces entre as proteínas são mais polares do que os núcleos das proteínas, e a ligação envolve uma troca entre a dessolvatação e a formação de ligações de hidrogênio. [40] Para superar esse desafio, Bruce Tidor e colaboradores desenvolveram um método para melhorar a afinidade dos anticorpos concentrando-se nas contribuições eletrostáticas. Eles descobriram que, para os anticorpos projetados no estudo, a redução dos custos de dessolvatação dos resíduos na interface aumentou a afinidade do par de ligação. [40][41] [42]

Previsões de vinculação de pontuação [ editar ]

As funções de energia de projeto de proteína devem ser adaptadas para pontuar as previsões de ligação porque a ligação envolve uma troca entre as conformações de energia mais baixa das proteínas livres ( EP e EL ) e a conformação de energia mais baixa do complexo ligado ( EP PL ):

.

O algoritmo K* aproxima a constante de ligação do algoritmo incluindo a entropia conformacional no cálculo da energia livre. O algoritmo K* considera apenas as conformações de energia mais baixa dos complexos livres e ligados (denotados pelos conjuntos P , L e PL ) para aproximar as funções de partição de cada complexo: [14]

Design para especificidade [ editar ]

O desenho das interações proteína-proteína deve ser altamente específico porque as proteínas podem interagir com um grande número de proteínas; projeto bem sucedido requer ligantes seletivos. Assim, os algoritmos de design de proteínas devem ser capazes de distinguir entre ligação no alvo (ou design positivo ) e ligação fora do alvo (ou design negativo ). [2] [40] Um dos exemplos mais proeminentes de projeto para especificidade é o projeto de peptídeos de ligação bZIP específicos por Amy Keating e colaboradores para 19 das 20 famílias bZIP; 8 desses peptídeos eram específicos para o parceiro pretendido em relação aos peptídeos concorrentes. [40] [43] [44]Além disso, o design positivo e negativo também foi usado por Anderson e colaboradores para prever mutações no sítio ativo de um alvo de droga que conferia resistência a uma nova droga; o desenho positivo foi usado para manter a atividade do tipo selvagem, enquanto o desenho negativo foi usado para interromper a ligação da droga. [45] O redesenho computacional recente por Costas Maranas e colaboradores também foi capaz de mudar experimentalmente a especificidade do cofator da Candida boidinii xilose redutase de NADPH para NADH . [46]

Resurfacing de proteínas [ editar ]

O resurfacing de proteínas consiste em projetar a superfície de uma proteína, preservando intactas as regiões gerais de dobra, núcleo e limite da proteína. O resurfacing de proteínas é especialmente útil para alterar a ligação de uma proteína a outras proteínas. Uma das aplicações mais importantes do resurfacing de proteínas foi o projeto da sonda RSC3 para selecionar anticorpos de HIV amplamente neutralizantes no NIH Vaccine Research Center. Primeiro, os resíduos fora da interface de ligação entre a proteína do envelope gp120 do HIV e o anticorpo b12 anteriormente descoberto foram selecionados para serem projetados. Em seguida, a sequência espaçada foi selecionada com base nas informações evolutivas, solubilidade, similaridade com o tipo selvagem e outras considerações. Em seguida, o software RosettaDesign foi usado para encontrar sequências ótimas no espaço de sequência selecionado.[47]

Design de proteínas globulares [ editar ]

As proteínas globulares são proteínas que contêm um núcleo hidrofóbico e uma superfície hidrofílica. As proteínas globulares geralmente assumem uma estrutura estável, ao contrário das proteínas fibrosas , que possuem múltiplas conformações. A estrutura tridimensional das proteínas globulares é tipicamente mais fácil de determinar através de cristalografia de raios X e ressonância magnética nuclear do que proteínas fibrosas e proteínas de membrana , o que torna as proteínas globulares mais atraentes para o design de proteínas do que os outros tipos de proteínas. Os projetos de proteínas mais bem-sucedidos envolveram proteínas globulares. Ambos RSD-1 e Top7 foram de novodesenhos de proteínas globulares. Mais cinco estruturas de proteínas foram projetadas, sintetizadas e verificadas em 2012 pelo grupo Baker. Essas novas proteínas não têm função biótica, mas as estruturas são destinadas a atuar como blocos de construção que podem ser expandidos para incorporar sítios ativos funcionais. As estruturas foram encontradas computacionalmente usando novas heurísticas baseadas na análise dos laços de conexão entre partes da sequência que especificam estruturas secundárias. [48]

Design de proteínas de membrana [ editar ]

Várias proteínas transmembranares foram projetadas com sucesso, [49] juntamente com muitos outros peptídeos e proteínas associados à membrana. [50] Recentemente, Costas Maranas e seus colegas de trabalho desenvolveram uma ferramenta automatizada [51] para redesenhar o tamanho dos poros da Outer Membrane Porin Type-F (OmpF) de E.coli para qualquer tamanho subnm desejado e os montaram em membranas para realizar separação precisa da escala de angstrom.

Outras aplicações [ editar ]

Um dos usos mais desejáveis ​​para o design de proteínas é para biossensores , proteínas que detectam a presença de compostos específicos. Algumas tentativas no projeto de biossensores incluem sensores para moléculas não naturais, incluindo TNT . [52] Mais recentemente, Kuhlman e colaboradores projetaram um biossensor do PAK1 . [53]

De certa forma, o design de proteínas é um subconjunto do design de baterias .

Veja também [ editar ]

Referências [ editar ]

  1. Korendovych, Ivan (19 de março de 2018). "Design minimalista de catalisadores de peptídeos e proteínas" . Sociedade Americana de Química . Recuperado em 22 de março de 2018 .
  2. ^ a b c d e f Richardson, JS; Richardson, DC (julho de 1989). "O projeto de novo de estruturas de proteínas". Tendências em Ciências Bioquímicas . 14 (7): 304–9. doi : 10.1016/0968-0004(89)90070-4 . PMID 2672455 . 
  3. ^ a b c Dahiyat, BI; Mayo, SL (3 de outubro de 1997). "Design de proteína de novo: seleção de sequência totalmente automatizada". Ciência . 278 (5335): 82–7. CiteSeerX 10.1.1.72.7304 . doi : 10.1126/science.278.5335.82 . PMID 9311930 .  
  4. ^ a b Gordon, DB; Marshall, SA; Mayo, SL (agosto de 1999). "Funções de energia para design de proteínas". Opinião Atual em Biologia Estrutural . 9 (4): 509–13. doi : 10.1016/s0959-440x(99)80072-4 . PMID 10449371 . 
  5. ^ a b Harbury, PB; Plecs, JJ; Tidor, B; Alber, T; Kim, PS (20 de novembro de 1998). "Design de proteína de alta resolução com liberdade de backbone". Ciência . 282 (5393): 1462-7. doi : 10.1126/science.282.5393.1462 . PMID 9822371 . 
  6. ^ a b c Kuhlman, B; Dantas, G; Ireton, GC; Varani, G; Stoddard, BL; Baker, D (21 de novembro de 2003). "Design de uma nova dobra de proteína globular com precisão de nível atômico". Ciência . 302 (5649): 1364-8. Bibcode : 2003Sci...302.1364K . doi : 10.1126/science.1089427 . PMID 14631033 . S2CID 1939390 .  
  7. ^ Sterner, R; Merkl, R; Raushel, FM (maio de 2008). "Projeto computacional de enzimas" . Química e Biologia . 15 (5): 421–3. doi : 10.1016/j.chembiol.2008.04.007 . PMID 18482694 . 
  8. ^ Wu, X; Yang, ZY; Li, Y; Hogerkorp, CM; Chefe, WR; Marinheiro, MS; Zhou, T; Schmidt, SD; Wu, L; Xu, L; Longo, NS; McKee, K; O'Dell, S; Mais alto, MK; Wycuff, DL; Feng, Y; Nason, M; Doria-Rose, N; Connors, M; Kwong, PD; Roederer, M; Wyatt, RT; Nabel, GJ ; Mascola, JR (13 de agosto de 2010). "O design racional do envelope identifica anticorpos monoclonais humanos amplamente neutralizantes para HIV-1" . Ciência . 329 (5993): 856-61. Bibcode : 2010Sci...329..856W . doi : 10.1126/science.1187659 . PMC 2965066 . PMID 20616233 .  
  9. ^ Höcker, B (8 de novembro de 2012). "Biologia Estrutural: Uma caixa de ferramentas para o design de proteínas" . Natureza . 491 (7423): 204-5. Bibcode : 2012Natur.491..204H . doi : 10.1038/491204a . PMID 23135466 . S2CID 4426247 .  
  10. ^ a b c Lovell, SC; Palavra, JM; Richardson, JS; Richardson, DC (15 de agosto de 2000). "A penúltima biblioteca de rotâmeros". Proteínas . 40 (3): 389–408. CiteSeerX 10.1.1.555.4071 . doi : 10.1002/1097-0134(20000815)40:3<389::AID-PROT50>3.0.CO;2-2 . PMID 10861930 .  
  11. ^ Shapovalov, MV; Dunbrack RL, Jr (8 de junho de 2011). "Uma biblioteca de rotâmeros dependente de backbone suavizada para proteínas derivadas de estimativas e regressões de densidade de kernel adaptáveis" . Estrutura . 19 (6): 844–58. doi : 10.1016/j.str.2011.03.019 . PMC 3118414 . PMID 21645855 .  
  12. ^ a b Samish, eu; MacDermaid, CM; Perez-Aguilar, JM; Saven, JG (2011). "Projeto teórico e computacional de proteínas". Revisão Anual de Físico-Química . 62 : 129–49. Bibcode : 2011ARPC...62..129S . doi : 10.1146/annurev-physchem-032210-103509 . PMID 21128762 . 
  13. ^ a b Mandell, DJ; Kortemme, T (agosto de 2009). "Flexibilidade do backbone no design computacional de proteínas" (PDF) . Opinião Atual em Biotecnologia . 20 (4): 420–8. doi : 10.1016/j.copbio.2009.07.006 . PMID 19709874 .  
  14. ^ a b c d e f Donald, Bruce R. (2011). Algoritmos em Biologia Molecular Estrutural . Cambridge, MA: MIT Press.
  15. ^ a b Boas, FE & Harbury, PB (2007). "Funções de energia potenciais para o design de proteínas". Opinião Atual em Biologia Estrutural . 17 (2): 199–204. doi : 10.1016/j.sbi.2007.03.006 . PMID 17387014 . 
  16. ^ a b c d Boas, FE; Harbury, PB (abril de 2007). "Funções de energia potenciais para o design de proteínas". Opinião Atual em Biologia Estrutural . 17 (2): 199–204. doi : 10.1016/j.sbi.2007.03.006 . PMID 17387014 . 
  17. ^ Vizcarra, CL; Mayo, SL (dezembro de 2005). "Eletrostática no projeto de proteína computacional". Opinião Atual em Biologia Química . 9 (6): 622–6. doi : 10.1016/j.cbpa.2005.10.014 . PMID 16257567 . 
  18. ^ Zhou, T; Georgiev, I; Wu, X; Yang, ZY; Dai, K; Finzi, A; Kwon, YD; Scheid, JF; Shi, W; Xu, L; Yang, Y; Zhu, J; Nussenzweig, MC; Sodroski, J; Shapiro, L; Nabel, GJ; Mascola, JR; Kwong, PD (13 de agosto de 2010). "Base estrutural para ampla e potente neutralização do HIV-1 pelo anticorpo VRC01" . Ciência . 329 (5993): 811-7. Bibcode : 2010Sci...329..811Z . doi : 10.1126/science.1192819 . PMC 2981354 . PMID 20616231 .  {{cite journal}}: CS1 maint: vários nomes: lista de autores ( link )
  19. ^ Mendes, J; Guerois, R; Serrano, L (agosto de 2002). "Estimativa de energia no design de proteínas". Opinião Atual em Biologia Estrutural . 12 (4): 441–6. doi : 10.1016/s0959-440x(02)00345-7 . PMID 12163065 . 
  20. ^ Pierce, NA; Winfree, E (outubro de 2002). "O design da proteína é NP-hard" . Engenharia de Proteínas . 15 (10): 779–82. doi : 10,1093/proteína/15,10.779 . PMID 12468711 . 
  21. ^ a b Voigt, CA; Gordon, DB; Mayo, SL (9 de junho de 2000). "Precisão de negociação para velocidade: uma comparação quantitativa de algoritmos de pesquisa no design de sequência de proteínas". Revista de Biologia Molecular . 299 (3): 789-803. CiteSeerX 10.1.1.138.2023 . doi : 10.1006/jmbi.2000.3758 . PMID 10835284 .  
  22. ^ Hong, EJ; Lipow, SM; Tidor, B; Lozano-Pérez, T (setembro de 2009). "Otimização de rotâmeros para design de proteínas por meio de estimativa de MAP e redução do tamanho do problema" . Jornal de Química Computacional . 30 (12): 1923-45. doi : 10.1002/jcc.21188 . PMC 3495010 . PMID 19123203 .  
  23. ^ "Aprendizado de máquina revela receita para a construção de proteínas artificiais" . phys.org . Recuperado em 17 de agosto de 2020 .
  24. ^ Russ, William P.; Figliuzzi, Matteo; Stocker, cristão; Barrat-Charlaix, Pierre; Socolich, Michael; Kast, Pedro; Hilvert, Donald; Monasson, Remi; Cocco, Simona; Weigt, Martin; Ranganathan, Rama (2020). "Um modelo baseado em evolução para a concepção de enzimas corismatemutase". Ciência . 369 (6502): 440–445. Bibcode : 2020Sci...369..440R . doi : 10.1126/science.aba3304 . PMID 32703877 . S2CID 220714458 .  
  25. ^ Gordon, DB; Mayo, SL (15 de setembro de 1999). "Branch-and-terminate: um algoritmo de otimização combinatória para design de proteínas" . Estrutura . 7 (9): 1089-98. doi : 10.1016/s0969-2126(99)80176-2 . PMID 10508778 . 
  26. ^ a b Lixiviação, AR; Lemon, AP (1 de novembro de 1998). "Explorando o espaço conformacional de cadeias laterais de proteínas usando eliminação de beco sem saída e o algoritmo A *". Proteínas . 33 (2): 227–39. CiteSeerX 10.1.1.133.7986 . doi : 10.1002/(sici)1097-0134(19981101)33:2<227::aid-prot7>3.0.co;2-f . PMID 9779790 .  
  27. ^ a b Kingsford, CL; Chazelle, B; Singh, M (1 de abril de 2005). "Resolvendo e analisando problemas de posicionamento de side-chain usando programação linear e inteira" . Bioinformática . 21 (7): 1028–36. doi : 10.1093/bioinformatics/bti144 . PMID 15546935 . 
  28. ^ Yanover, Chen; Talya Meltzer; Yair Weiss (2006). "Relaxamentos de Programação Linear e Propagação de Crenças - Um Estudo Empírico". Journal of Machine Learning Research . 7 : 1887-1907.
  29. ^ Wainwright, Martin J; Tommi S. Jaakkola; Alan S. Willsky (2005). "Estimativa MAP via acordo em árvores: passagem de mensagens e programação linear". Transações IEEE na Teoria da Informação . 51 (11): 3697-3717. CiteSeerX 10.1.1.71.9565 . doi : 10.1109/tit.2005.856938 . S2CID 10007532 .  
  30. Kolmogorov, Vladimir (28 de outubro de 2006). "Transmissão de mensagens com ponderação em árvore convergente para minimização de energia". Transações IEEE em Análise de Padrões e Inteligência de Máquina . 28 (10): 1568-1583. doi : 10.1109/TPAMI.2006.200 . PMID 16986540 . S2CID 8616813 .  
  31. ^ Globerson, Amir; Tommi S. Jaakkola (2007). "Corrigindo max-product: algoritmos de passagem de mensagens convergentes para MAP LP-relaxations". Avanços em Sistemas de Processamento de Informação Neural .
  32. ^ Allen, BD; Mayo, SL (30 de julho de 2006). "Aprimoramentos de desempenho dramáticos para o algoritmo de otimização FASTER". Jornal de Química Computacional . 27 (10): 1071-5. CiteSeerX 10.1.1.425.5418 . doi : 10.1002/jcc.20420 . PMID 16685715 . S2CID 769053 .   
  33. ^ Desmet, J; Spriet, J; Lasters, I (1 de julho de 2002). "Topologia de cadeia lateral rápida e precisa e refinamento de energia (FASTER) como um novo método para otimização da estrutura de proteínas". Proteínas . 48 (1): 31–43. doi : 10.1002/prot.10131 . PMID 12012335 . S2CID 21524437 .  
  34. ^ Baker, D (outubro de 2010). "Um caminho emocionante, mas desafiador à frente para o projeto de enzimas computacionais" . Ciência das Proteínas . 19 (10): 1817-9. doi : 10.1002/pro.481 . PMC 2998717 . PMID 20717908 .  
  35. ^ Jiang, Lin; Althoff, Eric A.; Clemente, Fernando R.; Doyle, Lindsey; Rothlisberger, Daniela; Zanghelini, Alexandre; Gallaher, Jasmine L.; Betker, Jamie L.; Tanaka, Fujie (2008). "De Novo Projeto Computacional de Enzimas Retro-Aldol" . Ciência . 319 (5868): 1387-91. Bibcode : 2008Sci...319.1387J . doi : 10.1126/science.1152692 . PMC 3431203 . PMID 18323453 .  
  36. ^ Röthlisberger, Daniela; Khersonsky, Olga; Wollacott, Andrew M.; Jiang, Lin; Dechancie, Jason; Betker, Jamie; Gallaher, Jasmine L.; Althoff, Eric A.; Zanghelini, Alexandre (2008). "Catalisadores de eliminação Kemp por projeto de enzima computacional" . Natureza . 453 (7192): 190-5. Bibcode : 2008Natur.453..190R . doi : 10.1038/nature06879 . PMID 18354394 . 
  37. ^ Siegel, JB; Zanghelini, A; Lovick, HM; Beijo, G; Lambert, AR; St Clair, JL; Gallaher, JL; Hilvert, D; Gelb, MH; Stoddard, BL; Houk, KN; Miguel, FE; Baker, D (16 de julho de 2010). "Projeto computacional de um catalisador enzimático para uma reação bimolecular estereosseletiva de Diels-Alder" . Ciência . 329 (5989): 309-13. Bibcode : 2010Sci...329..309S . doi : 10.1126/science.1190239 . PMC 3241958 . PMID 20647463 .  {{cite journal}}: CS1 maint: multiple names: authors list (link)
  38. ^ Privett, HK; Beijo, G; Lee, TM; Blomberg, R; Chica, RA; Thomas, L.M; Hilvert, D; Houk, KN; Mayo, SL (6 de março de 2012). "Abordagem iterativa para projeto de enzima computacional" . Anais da Academia Nacional de Ciências dos Estados Unidos da América . 109 (10): 3790-5. Bibcode : 2012PNAS..109.3790P . doi : 10.1073/pnas.1118082108 . PMC 3309769 . PMID 22357762 .  
  39. ^ Chen, CY; Georgiev, I; Anderson, AC; Donald, BR (10 de março de 2009). "Redesenho baseado em estrutura computacional da atividade enzimática" . Anais da Academia Nacional de Ciências dos Estados Unidos da América . 106 (10): 3764-9. Bibcode : 2009PNAS..106.3764C . doi : 10.1073/pnas.0900266106 . PMC 2645347 . PMID 19228942 .  
  40. ^ a b c d Karanicolas, J; Kuhlman, B (agosto de 2009). "Design computacional de afinidade e especificidade em interfaces proteína-proteína" . Opinião Atual em Biologia Estrutural . 19 (4): 458–63. doi : 10.1016/j.sbi.2009.07.005 . PMC 2882636 . PMID 19646858 .  
  41. ^ Shoichet, BK (outubro de 2007). "Nenhum almoço de energia grátis". Biotecnologia da Natureza . 25 (10): 1109-10. doi : 10.1038/nbt1007-1109 . PMID 17921992 . S2CID 5527226 .  
  42. ^ Lippow, SM; Wittrup, KD; Tidor, B (outubro de 2007). "Projeto computacional de melhoria de afinidade de anticorpos além da maturação in vivo" . Biotecnologia da Natureza . 25 (10): 1171-6. doi : 10.1038/nbt1336 . PMC 2803018 . PMID 17891135 .  
  43. ^ Schreiber, G; Keating, AE (fevereiro de 2011). "Especificidade de ligação de proteínas versus promiscuidade" . Opinião Atual em Biologia Estrutural . 21 (1): 50–61. doi : 10.1016/j.sbi.2010.10.002 . PMC 3053118 . PMID 21071205 .  
  44. ^ Grigoryan, G; Reinke, AW; Keating, AE (16 de abril de 2009). "Design de especificidade de interação de proteína fornece peptídeos de ligação bZIP seletivos" . Natureza . 458 (7240): 859-64. Bibcode : 2009Natur.458..859G . doi : 10.1038/nature07885 . PMC 2748673 . PMID 19370028 .  
  45. ^ Frey, KM; Georgiev, I; Donald, BR; Anderson, AC (3 de agosto de 2010). "Prever mutações de resistência usando algoritmos de design de proteínas" . Anais da Academia Nacional de Ciências dos Estados Unidos da América . 107 (31): 13707-12. Bibcode : 2010PNAS..10713707F . doi : 10.1073/pnas.1002162107 . PMC 2922245 . PMID 20643959 .  
  46. ^ Khoury, GA; Fazelinia, H; Chin, JW; Pantazes, RJ; Cirino, PC; Maranas, CD (outubro de 2009). "Projeto computacional de Candida boidinii xilose redutase para especificidade de cofator alterada" . Ciência das Proteínas . 18 (10): 2125-38. doi : 10.1002/pro.227 . PMC 2786976 . PMID 19693930 .  
  47. ^ Burton, Dr.; Weiss, RA (13 de agosto de 2010). "AIDS/HIV. Um impulso para o desenho de vacinas contra o HIV". Ciência . 329 (5993): 770-3. Bibcode : 2010Sci...329..770B . doi : 10.1126/science.1194693 . PMID 20705840 . S2CID 206528638 .  
  48. ^ Jessica Marshall (7 de novembro de 2012). "Proteínas feitas por encomenda" . Notícias da Natureza . Recuperado em 17 de novembro de 2012 .
  49. ^ Proteínas alfa-hairpin transmembrana projetadas no banco de dados OPM
  50. ^ Peptídeos e proteínas associados à membrana projetados no banco de dados OPM
  51. ^ Chowdhury, Ratul; Kumar, Manish; Maranás, Costas D.; Golbeck, John H.; Baker, Carol; Prabhakar, Jeevan; Grisewood, Matthew; Decker, Karl; Shankla, Manish (10 de setembro de 2018). "PoreDesigner para ajustar a seletividade do soluto em um poro de membrana externa robusto e altamente permeável" . Natureza Comunicações . 9 (1): 3661. Bibcode : 2018NatCo...9.3661C . doi : 10.1038/s41467-018-06097-1 . ISSN 2041-1723 . PMC 6131167 . PMID 30202038 .   
  52. ^ Looger, Loren L.; Dwyer, Mary A.; Smith, James J. & Hellinga, Homme W. (2003). "Projeto computacional de proteínas receptoras e sensores com novas funções". Natureza . 423 (6936): 185-190. Bibcode : 2003Natur.423..185L . doi : 10.1038/nature01556 . PMID 12736688 . S2CID 4387641 .  
  53. ^ Jha, RK; Wu, YI; Zawistowski, JS; MacNevin, C; Hahn, KM; Kuhlman, B (21 de outubro de 2011). "Redesign do domínio autoinibitório PAK1 para maior estabilidade e afinidade em aplicações de biossensores" . Revista de Biologia Molecular . 413 (2): 513-22. doi : 10.1016/j.jmb.2011.08.022 . PMC 3202338 . PMID 21888918 .  

Leitura adicional [ editar ]