Proteína

As proteínas (do grego πρωτεϊνη, primeiro) son unhas macromoléculas formadas por α-aminoácidos. Poden estar formadas por unha ou varias cadeas de aminoácidos. As proteínas son moléculas orgánicas esenciais na estrutura e función dos seres vivos (por exemplo, forman parte integral dos tecidos biolóxicos e moitas delas funcionan como encimas). Levan a cabo unha ampla gama de funcións nos organismos, como a catálise metabólica, replicación do ADN, resposta aos estímulos, transporte de moléculas etc. A súa función nutritiva fundamental é plástica, formadora de estruturas orgánicas. Tamén poden servir en determinados casos como fonte de enerxía, pero nunha alimentación equilibrada esta función é asumida polos carbohidratos e os lípidos.

As proteínas son substancias sólidas, incoloras, coloidais, insolubles en solventes orgánicos, unhas con algunha solubilidade en auga, e outras con algunha solubilidade en solucións acuosas diluídas de ácidos, bases ou sales. Quimicamente, son compostos cuaternarios de carbono (C), hidróxeno (H), osíxeno (O) e nitróxeno (N).

Unha cadea longa de aminoácidos denomínase polipéptido. O termo proteína dáse xeralmente cando o polipéptido ou un conxunto de varios ten unha función e conformación determinada. Porén, os termos péptido, polipéptido e proteína úsanse con frecuencia dun modo pouco específico, xa que ás veces non hai un límite claro entre eles. Nas proteínas normalmente hai 20 aminoácidos (ver aminoácido proteinoxénico), pero poden incorporar algúns máis en casos especiais. Os aminoácidos teñen grupos amino e carboxilo por medio dos que se enlazan por enlace peptídico formando a cadea polipeptídica. As proteínas difiren unhas das outras principalmente na súa secuencia de aminoácidos, que está determinada pola secuencia de nucleótidos dos seus xenes, e que xeralmente dá lugar a un pregamento tridimensional específico da proteína, que lle dá unha estrutura necesaria para a súa actividade. Cada posible combinación de tres nucleótidos (tripletes) que se suceden na secuencia dun xene codifica un determinado aminoácido, segundo as correspondencias do código xenético. En xeral, o código xenético só codifica os 20 aminoácidos proteinoxénicos normais, pero en certos organismos dito código pode codificar por un mecanismo especial a selenocisteína e, en certas arqueas a pirrolisina. Despois de rematada a síntese de proteínas ou mesmo durante a mesma, poden modificarse encimaticamente residuos de aminoácidos da proteína por modificación postraducional, o que altera as súas propiedades físicas e químicas, o pregamento, estabilidade, actividade e, finalmente, a función das proteínas. Ás veces as proteínas levan unidos grupos químicos que non son peptídicos, que se denominan grupos prostéticos ou cofactores. Distintas proteínas poden tamén funcionar en conxunto para realizaren unha determinada función, e a miúdo poden estar asociadas formando complexos proteicos estables.

As proteínas poden purificarse a partir doutros compoñentes celulares utilizando varias técnicas como a ultracentrifugación, precipitación, electroforese e cromatografía; a aparición das técnicas de enxeñaría xenética fixo posible aplicar diversos métodos que facilitan a purificación. Entre os métodos que se utilizan comunmente para estudar a estrutura e función das proteínas están a inmunohistoquímica, mutaxénese dirixida, resonancia magnética nuclear e espectrometría de masas.

Myoglobin
Unha representación en 3D da estrutura da mioglobina. Esta proteína foi a primeira cuxa estrutura foi obtida mediante a cristalografía por raios X.

Bioquímica

Artigo principal: Enlace peptídico.
Mesomeric peptide bond
Figura 2: Formas de resonancia do enlace peptídico. A forma neutra e con enlace simple (~60%) está á esquerda, e a forma cargada e con dobre enlace (~40%) está á dereita.
Peptide-Figure-Revised
Estrutura química dunha cadea peptídica.
Ligapep2
Parte dunha cadea proteica mostrando as ligazóns peptídicas.
Ribosome mRNA translation gl
Ribosoma sintetizando unha proteína e usando o ARNm como molde.

O enlace peptídico que enlaza os aminoácidos da proteína establécese entre o grupo amino dun aminoácido e o grupo carboxilo do seguinte aminoácido. Nos extremos os grupos amino e carboxilo quedan libres, polo que se di que a proteína ten un extremo amino terminal ou N-terminal (por onde por convención se considera que empeza a proteína) e un extremo carboxilo terminal ou C-terminal (por onde acaba). O enlace peptídico ten dúas formas de resonancia (o dobre enlace pode estar no C=O ou no C=N), que lle dan certo carácter de dobre enlace e inhiben a rotación arredor do seu eixe, de modo que os carbonos alfa son coplanares. Os outros dous ángulos diedros no enlace peptídico determinan a forma local que adopta o esqueleto da proteína.[1]

Síntese

Biosíntese

Artigos principais: Biosíntese de proteínas e Tradución de proteínas.

As proteínas son compostos orgánicos de estrutura complexa e masa molecular elevada (entre 15.000 e 20.000.000 Da) e son sintetizadas polos organismos vivos nos ribosomas por medio da combinación dun número maior ou menor de moléculas de aminoácidos, que se ligan por enlace peptídico. Son, pois polímeros formados pola unión de aminoácidos, que son os seus monómeros. Poden ter centos de aminoácidos.

A secuencia de aminoácidos da proteína está determinada pola secuencia de nucleótidos do xene que a codifica. O xene do ADN é transcrito a un ARNm, que madura (en eucariotas) e se dirixe aos ribosomas, únese a eles e é traducido. A secuencia de nucleótidos do ARNm, tomados de 3 en 3, formando codóns, é lida no ribosoma segundo as correspondencias do código xenético. Neste código cada codón determina un aminoácido.[2]. Os aminoácidos chegan ao ribosoma traídos por ARNts, que están entrando e saíndo do ribosoma continuamente. Os ARNts teñen unha secuencia anticodón, complementaria dalgún dos codóns. Hai ARNt específicos para cada aminoácido, e uns encimas chamados aminoacil ARNt sintetases, enlazan cada aminoácido co ARNt correcto. No ribosoma os aminoácidos únense por enlace peptídico formando unha cadea de aminoácidos cada vez máis longa, que permanece unida ao último ARNt que entra. O polipéptido en crecemento denomínase a miúdo cadea nacente. As proteínas biosintetízanse sempre empezando no extremo N-terminal e acabando no C-terminal.[2] O ARNm vai expoñendo sucesivamente todos os seus codóns no ribosoma. Cando se chega a unha secuencia de finalización do ARNm, a cadea polipeptídica libérase. A proteína prégase e pode despois sufrir modificacións postraducionais.

A taxa de síntese proteica en procariotas é máis alta que en eucariotas e pode chegar a 20 aminoácidos por segundo.[3] O tamaño dunha proteína sintetizada pode medirse poo número de aminoácidos que contén e pola súa masa molecular total en daltons, Da, (sinónimo de unidade de masa atómica), ou en kDa. Unha proteína de lévedo media ten uns 446 aminoácidos e uns 53 kDa.[4] A proteína máis longa coñecida é a titina, que se encontra no sarcómero muscular, cunha masa de 3.000 kDa e case 27.000 aminoácidos.[5]

Síntese química

No laboratorio poden sintetizarse pequenas proteínas por un conxunto de métodos chamados síntese de péptidos, que dependen de técnicas de síntese orgánica para producir péptidos con alto rendemento.[6] A síntese química permite a introdución de aminoácidos non naturais nas cadeas polipeptídicas, como a unión de sondas flourescentes ás cadeas laterais de aminoácidos.[7] Estes métodos son útiles en bioquímica e bioloxía celular de investigación, aínda que xeralmente non para aplicacións comerciais. A síntese química é ineficiente para producir polipéptidos de máis duns 300 aminoácidos, e as proteínas sintetizadas poden non adoptar doadamente a súa estrutura terciaria nativa. Os métodos en síntese química avanzan dende o extremo C-terminal ao N-terminal, ao revés ca a síntese biolóxica nos ribosomas[8], se son en fase sólida, mais os feitos en disolución avanzan no mesmo sentido que o biolóxico.

Clasificación

Composición:

Canto á estrutura molecular, as proteínas clasifícanse en:

Proteínas fibrosas e globulares

  • Proteínas fibrosas:

Son aquelas que presentan moléculas distendidas e filamentosas, semellantes a longos fíos. coláxeno e fibrina son exemplos de proteínas fibrosas. Son raras.

  • Proteínas globulares:

Presentan as moléculas enroladas como novelos, e son solúbeis na auga formando micelas. A maioría das proteínas presentan estrutura globular, como, por exemplo, os encimas, anticorpos, hemoglobina, proteínas asociadas á clorofila e proteínas estruturais.

Estrutura tridimensional

Artigo principal: Estrutura das proteínas.
ProteinStructures
Estruturas tridimensionais das proteínas
Protein composite
Superficie molecular de varias proteínas a tamaño comparativo. De esquerda a dereita son: inmunoglobulina G (IgG, un anticorpo), hemoglobina, insulina (unha hormona), adenilato quinase (un encima) e glutamina sintetase (un encima).

As proteínas presentan catro niveis de estudo ou de estrutura que dependen da configuración espacial da cadea polipeptídica, do tamaño da cadea, e do tipo de aminoácidos que posúe. As estruturas básicas son:

  • Estrutura primaria:

A estrutura primaria é a secuencia linear de aminoácidos unidos por enlaces peptídicos. Dita estrutura vén predeterminada polo secuencia do ácido nucleico que a codifica.

  • Estrutura secundaria:

Constituída por unha cadea de aminoácidos na que se estabelecen ligazóns por pontes de hidróxeno entre os aminoácidos distantes da cadea. Estas ligazóns confírenlle a forma en hélice alfa, folla pregada beta. Esta estrutura depende, entre outros factores, do medio onde a proteína se prega.

  • Estrutura terciaria:

Resulta do enrolamento da hélice ou da folla pregada, e é mantido por pontes de hidróxeno e disulfuro entre aminoácidos da mesma cadea. Esta estrutura confire a actividade biolóxica ás proteínas. Pode ser globular ou filamentosa.

  • Estrutura cuaternaria:

Resulta da asociación de varias subunidades peptídicas con estrutura terciaria; estas permanecen unidas xeralmente a través de ligazóns covalentes coma pontes disulfuro entre cisteínas.

As proteínas non son moléculas totalmente ríxidas. Ademais de teren os seus niveis estruturais característicos, as proteínas poden cambiar entre varias estruturas relacionadas mentres realizan as súas funcións. No contexto desde rearranxos funcionais, estas estruturas terciarias e cuatrernarias son normalmente denominadas "conformacións", e as transicións entre elas chámanse cambios conformacionais. Tales cambios están a miúdo inducidos pola unión de moléculas substrato ao sitio activo dun encima, ou á rexión física da proteína que participa na catálise química. En proteínas en disolución tamén sofren a variación na estrutura por vibración térmica e a colisión con outras moléculas.[10]

As proteínas poden dividirse informalmente en tres clases principais, que se correlacionan con estruturas terciarias típicas: proteínas globulares, fibrosas e de membrana.[11]

Determinación da estrutura

O descubrimento de cal é a estrutura terciaria dunha proteína ou a cuaternaria dun complexo proteico pode proporcionar importantes indicios sobre como realiza a proteína a súa función. Os métodos experimentais máis comúns para a determinación da estrutura son a cristalografía de raios X e a espectroscopía de resonancia magnética nuclear (NMR), as cales poden fornecer información a resolución atómica. Porén, os experimentos de NMR poden proporcionar información a partir da cal pode estimarse un conxunto de distancias entre pares de átomos, e as posibles conformacións finais dunha proteína determínanse resolvendo a distancia xeométrica problema. A interferometría de polarización dual é un método analítico cuantitativo para medir a conformación da proteína total e os cambios conformacionais debidos a interaccións ou outros estímulos. O dicroísmo circular é outra técnica de laboratorio para determinar a composición en folla beta ou helicoidal interna das proteínas. A microscopia crioelectrónica utilízase para producir información estrutural de baixa resolución sobre complexos proteicos moi grandes, incluídos virus ensamblados;[12] unha variante coñecida como cristalografía electrónica pode tamén producir información de alta resolución nalgúns casos, especialmente para cristais bidimensionais de proteínas de membrana.[13]

As estruturas resoltas almacénanse xeralmente en Protein Data Bank (PDB), unha fonte de acceso libre da que se poden obter datos de miles de proteínas en forma de coordenadas cartesianas para cada átomo da proteína.[14] Coñécense moitas máis secuencias que estruturas de proteínas. Ademais, o conxunto de estruturas xa resoltas é predominantemente o de proteínas que poden ser sometidas facilmente ás condicións requiridas na cristalografía de raios X, que é un dos principais métodos de determinación estrutural. En especial, as proteínas globulares son comparativamente máis doadas de cristalizar en preparacións de cristalografía de raios X. As proteínas de membrana, polo contrario, son difíciles de cristalizar e están subrepresentadas na PDB.[15] As iniciativas baseadas na xenómica estrutural intentaron remediar estas deficiencias resolvendo sistematicamente estruturas representativas dos principais tipos de pregamento. Os métodos de predición de estruturas das proteínas tratan de proporcionar métodos de xerar unha estrutura plausible de proteínas cuxas estruturas non foron aínda determinadas experimentalmente.[16]

Desnaturalización e renaturalización

As proteínas poden desnaturalizar. Isto acontece cando, por acción de substancias químicas ou da calor as proteínas sofren alteración da estrutura terciaria ou a quebra das ligazóns non covalentes da estrutura cuaternaria.

As proteínas perden a súa conformación e, consecuentemente, a súa funcionalidade. A desnaturalización pode ser reversíbel ou irreversíbel.

Dependendo da forma pola cal a proteína foi desnaturalizada, a súa conformación nativa pódese recuperar (renaturalización) retirándose lentamente o axente desnaturalizante, como por exemplo facer unha diálise contra auga para retirar o axente desnaturalizante urea.

Función biolóxica

As proteínas son as principais moléculas da célula, que levan a cabo as instrucións especificadas na información xenética.[4] Coa excepción de certos tipos de ARN, a maioría das demais moléculas biolóxicas son elementos relativamente inertes sobre as cales actúan as proteínas. As proteínas supoñen a metade do peso seco dunha célula de Escherichia coli, mentres que outras macromoléculas como o ADN e ARN supoñen só o 3% e 20%, respectivamente.[17] O conxunto de proteínas expresadas nunha determinada célula ou tipo celular denomínase proteoma.

Igual que outras macromoléculas biolóxicas como os polisacáridos e ácidos nucleicos, as proteínas son partes esenciais do organismo e participan virtualmente en todos os procesos celulares. Moitas proteínas son encimas que catalizan reaccións bioquímicas e son esenciais no metabolismo. As proteínas tamén teñen funcións estruturais e mecánicas, como a actina e miosina do músculo e as proteínas do citoesqueleto, o cal forma un armazón que mantén a forma celular. Outras proteínas son importantes na sinalización celular, respostas inmunes, adhesión celular e o ciclo celular. As proteínas son tamén necesarias nas dietas dos animais, xa que os animais non poden sintetizar todos os aminoácidos que necesitan e deben obter os aminoácidos esenciais da dieta. Por medio do proceso da dixestión, os animais degradan as proteínas a aminoácidos libres que son despois absorbidos no intestino e utilizados no metabolismo.

As proteínas teñen as seguintes funcións:

Estrutural e motil

Son aquelas que participan dos tecidos dándolles rixidez, consistencia e elasticidade. Son proteínas estruturais: coláxeno ( cartilaxes), elastina, fibroína (arañeiras), queratina (cabelo), resilina (moi elástica, nas ás de insectos) e outras.

Algunhas proteínas estruturais interveñen na motilidade celular ou de todo o organismo. Algunhas delas teñen propiedades contráctiles e interveñen nos movementos das células musculares e outras, como é o caso da actinae miosina. Outras proteínas que interveñen na motilidade intracelular son a cinesina e dineína. A proteína tubulina non é contráctil, pero forma os flaxelos e cilios.

Regulatoria

Algunhas hormonas (substancias que exercen algunha función específica sobre algún órgano ou estrutura dun organismo) son de natureza proteica, como por exemplo a insulina, hormona do crecemento ou hormona paratiroide. Outras interveñen na sinalización celular como receptores de moléculas sinalizadoras eucariotas, ou son represores de xenes bacterianos. Moitos receptores teñen un sitio de unión exposto na superficie da célula e un dominio efector dentro da célula, o cal pode ter unha actividade encimática ou poden sufrir un cambio conformacional detectado por outras proteínas do interior da célula.[18]

Defensa

Os anticorpos son proteínas (inmunoglobulinas) que participan na defensa do organismo contra microorganismos e todo tipo de substancias estrañas. A afinidade de unión dun anticorpo pola súa molécula diana é extraordinariamente alta.[19] Tamén teñen unha función defensiva impedindo a perda de sangue nas hemorraxias, como o fibrinóxeno ou a trombina. Outras son tóxicas, como a ricina, que é unha forma de defensa das plantas. No plasma de peixes antárticos hai proteínas anticonxelantes que os defenden da conxelación.

Enerxética (nutrición e reserva)

Obtención de enerxía a partir dos aminoácidos que compoñen as proteínas. Esta é unha función de urxencia en organismos superiores, cando a indispoñibilidade de ácidos graxos ou monosacáridos así o dita. Porén, hai algunhas proteínas que están especializadas na nutrición e reserva enerxética, como a caseína do leite, a ovoalbumina do ovo ou a gliadina das sementes de trigo.

Encimática

Artigo principal: Encima.

Posibilitan as reaccións bioquímicas, permitindo reducir a enerxía libre de Gibbs de activación e acelerando as reaccións. Coñécense máis de 4000 reaccións catalizadas por encimas. Os encimas son xeralmente moi específicos e catalizan só unha ou unhas poucas reaccións químicas. Os encimas levan a cabo a maior parte das reaccións do metabolismo, interveñen na replicación do ADN, reparación do ADN e transcrición xenética. Algúns encimas actúan sobre outras proteínas par engadir ou quitar grupos químicos nun proceso chamado modificación postraducional.[20] O grao de aceleración proporcionado pola catálise encimática é xeralmente enorme, por exemplo, incrementando a velocidade de reacción arredor de 1017 veces con respecto a unha reacción non catalizada no caso da orotato descarboxilase.[21]

As moléculas que se unen e sobre as que actúa o encima denomínanse substratos. O substrato entra nunha rexión do encima denominada centro activo, onde ten lugar a reacción. Aínda que o encima pode estar formado por centos de aminoácidos, só unha pequena fracción dos aminoácidos interaccionan co substrato, e na catálise adoitan estar implicados só tres ou catro aminoácidos.[22]

Transporte

Algunhas proteínas transportan substancias. Por exemplo, os gases respiratorios (osíxeno e dióxido de carbono) son transportados por proteínas como a hemoglobina e hemocianina. A hemoglobina é un exemplo de proteína que se une con alta afinidade a unha pequena molécula ligando cando o ligando está presente en altas concentracións (como ocorre nos pulmóns) e que liberan o ligando cando chegan a tecidos onde hai baixas concentracións deste.[23]

As lipoproteínas transportan lípidos polo sangue. Algunhas proteínas son transportadores de membrana, que levan moléculas dun lado a outro da membrana.

Unión a outras moléculas

Hexokinase ball and stick model, with substrates to scale copy
Modelo do encima hexoquinase. A escala, na esquina superior dereita aparecen dous dos seus substratos, ATP e glicosa.

A principal característica das proteínas que lles permiten realizar o seu diverso conxunto de funcións é a súa capacidade de unirse a outras moléculas de forma específica e firme. A rexión das moléculas proteicas responsable da unión a outras moléculas denomínase sitio de unión e é xeralmente unha depresión na superficie da molécula ou "peto". Esta capacidade de unión está mediada pola súa estrutura terciaria, a cal define o peto do sitio de unión, e polas propiedades químicas das cadeas laterais dos aminoácidos que o rodean. A unión das proteínas a outras moléculas pode ser extraordinariamente forte e específica; por exemplo, a proteína inhibidora da ribonuclease únese á anxioxenina humana cunha constante de disociación subfemtomolar (<10−15 M) pero non se pode unir a ningún dos seus homólogos de anfibios, as onconases (>1 M). Cambios químicos extremadamente pequenos como a adición dun só grupo metilo a unha molécula á que se debe unir a proteína pode ás veces ser suficiente para case eliminar a unión; por exemplo, a aminoacil ARNt sintetase específica do aminoácido valina distingue esta do aminoácido leucina de cadea lateral moi similar.[24]

As proteínas poden unirse a outras proteínas ou a pequenas moléculas substrato. Cando as proteínas se unen especificamente a outras copias da mesma molécula, poden oligomerizarse para formar fibrilas; este proceso ocorre a miúdo en proteínas estruturais que constan de monómeros globulares que se autoensamblan para formar fibras ríxidas. As interaccións proteína-proteína tamén regulan a actividade encimática, o control do progreso do ciclo celular e permiten a ensamblaxe de grandes complexos proteicos que levan a cabo moitas reaccións moi relacionadas cunha función biolóxica común. As proteínas poden tamén unirse ou mesmo integrarse nas membranas cellares. A capacidade de unirse a outras moléculas para inducir cambios conformacionais nas proteínas permite a formación de redes de sinalización celular de enorme complexidade.[25] As interaccións entre proteínas son reversibles, e dependen fortemente da dispoñibilidade de diferentes grupos de proteínas ás que se asocian para formar agregados que son capaces de realizar un determinado conxunto de funcións. O estudo da interacción entre proteínas específicas é fundamental para comprender aspectos importantes das funcións celulares, e finalmente as propiedades que distinguen os distintos tipos celulares.[26][27]

Mouse cholera antibody
Diagrama de fitas dun anticorpo de rato contra o cólera que se une a un antíxeno carbohidrato.

Métodos de estudo

As estruturas e actividades das proteínas foron estudadas in vitro e in vivo. Os estudos in vitro de proteínas purificadas en condicións controladas son útiles para descubrir como unha proteína leva a cabo a súa función: por exemplo, os estudos de cinética encimática exploran os mecanismos químicos da actividade catalítica dun encima e a súa afinidade relativa por varios posibles substratos. Os experimentos in vivo estudan as actividades das proteínas dentro das células ou dentro do organismo no seu conxunto, e poden proporcionar información complementaria sobre o lugar onde actúa a proteína e como se regula.

Purificación de proteínas

Para realizar unha análise in vitro dunha proteína, esta debe ser purificada e separada doutros compoñentes celulares. Este proceso xeralmente empeza coa lise da célula, na cal se destrúe a membrana celular e o contido da célula libérase formando unha solución chamada lisado cru. A mestura resultante pode ser purificada utilizando ultracentrifugación, a cal fracciona os diversos compoñentes celulares en fraccións que conteñen proteínas solubles; lípidos de membrana e proteínas; orgánulos celulares e ácidos nucleicos. A precipitación por un método baseado en utilizar altas concentracións salinas pode concentrar as proteínas do lisado. Despois úsanse varios tipos de cromatografía para illar a proteína ou proteínas que interesan baseándose en propiedades como a masa molecular, carga neta e afinidade de unión.[28] O nivel de purificación pode ser monitorizado usando varios tipos de electroforese en xel se se coñecen a masa molecular da proteína desexada e o seu punto isoeléctrico, ou por espectroscopia se a proteína ten características espectroscópicas distinguibles, ou por ensaios de encimas se a proteína ten unha actividade encimática. Ademais, as proteínas poden ser illadas segundo a súa carga por medio do electroenfoque.[29]

Para as proteínas naturais, pode ser necesario seguir unha serie de pasos de purificación para obter proteínas puras dabondo para as aplicacións de laboratorio. Para simplificar este proceso, a míúdo utilízase a enxeñaría xenética para engadir características químicas á proteína que a fagan máis fácil de purificar sen afectar á súa estrutura ou actividade. Por exemplo, únese unha "etiqueta" consistente nunha secuencia de aminoácidos específica, como unha serie de residuos de histidina (unha "etiqueta His"), que se enlaza a un extremo da proteína. Como resultado, cando o lisado se fai pasar por unha columna de cromatografía que conteña níquel, os residuos de histidina líganse ao níquel e quedan unidos á columna (xunto con toda a proteína) mentres que os compoñentes non etiquetados do lisado escoan sen dificultade. Ideáronse varias etiquetas diferentes para axudar aos investigadores a purificar proteínas específicas a partir de mesturas complexas.[30]

Localización celular

Localisations02eng
Proteínas localizadas en distintos compartimentos celulares e estruturas etiquetadas con proteína fluorescente verde (que aquí se ve branca).

O estudo das proteínas in vivo trata moitas veces de coñecer cal é a localización e lugar de síntese da proteína na célula. Aínda que moitas proteínas intracelulares se sintetizan no citoplasma e as proteínas unidas a membrana ou segregadas polo retículo endoplasmático, moitas veces non están tan claros os detalles de como as proteínas se destinan a orgánulos específicos ou estruturas celulares. Unha técnica útil para estimar a localización celular utiliza a enxeñaría xenética para expresar na célula unha proteína de fusión ou quimera formada pola proteína natural de interese unida a un "reporteiro" como a proteína fluorescente verde (GFP).[31] A localización na célula da proteína fusionada pode ser visualizada de forma clara e eficiente por microscopía,[32] como se ve no exemplo da figura.

Outros métodos para dilucidar a localización celular de proteínas require o uso de marcadores de compartimento coñecidos para rexións como o retículo endoplasmático, o aparato de Golgi, lisosomas ou vacúolos, mitocondria, cloroplastos, membrana plasmática etc. Co uso de versións etiquetadas fluorescentemente destes marcadores ou de anticorpos para marcadores coñecidos, fíxose máis sinxelo identificar a localización dunha proteína de interese. Por exemplo, a inmunofluorescencia indirecta permite a colocalizaciónn fluorescente e a demostración da localización. As tinguiduras fluorescentes utilízanse para etiquetar compartimentos celulares para un propósito similar.[33]

Existen outras posibilidades. Por exemplo, a inmunohistoquímica xeralmente utiliza un anticorpo para unha ou máis proteínas de interese que están conxugadas a encimas producindo sinais luminescentes ou cromoxénicos que poden compararse entre mostras, o que permite a localización da información. Outra técnica aplicable é a cofraccionación en gradientes de sacarosa (ou outro material) utilizando centrifugación isopícnica.[34] Aínda que esta técnica non proba a colocalización dun compartimento de densidade coñecida e a proteína de interese, incrementa a probabilidade, e é máis axeitado para estudos a grande escala.

Finalmente, o método estándar de localización celular é a microscopía inmunoelectrónica. Esta técnica tamén usa un anticorpo para a proteína de interese, xunto coas técnicas de microscopía electrónica clásicas. A mostra prepárase para o exame por microscopía electrónica normal, e despois é tratada cun anticorpo para a proteína de interese que é conxugada a un material extremadamente electrodenso, xeralmente ouro. Isto permite a localización tanto dos detalles estruturais coma da proteína procurada.[35]

Con outra aplicación de enxeñaría xenética chamada mutaxénese dirixida (ou dirixida ao ao sitio), pódese alterar a secuencia da proteína e, por tanto, a súa estrutura, localización celular e susceptibilidade á regulación. Esta técnica mesmo permite a incorporación ás proteínas de aminoácidos, utilizando ARNts modificados,[36] e pode permitir o deseño de novas proteínas con novas propiedades.[37]

Proteómica e bioinformática

Artigos principais: Proteómica e Bioinformática.

O complemento proteico completo presente nun determinado momento nunha célula ou tipo celular denomínase proteoma, e o estudo de conxuntos de datos a grande escala define o campo da proteómica, denominado así por analoxía co campo relacionado da xenómica. Técnicas experimentais fundamentais en proteómica son a electroforese en xel bidimensional,[38] que posibilita a separación dun grande número de proteínas, a espectrometría de masas,[39] que permite unha rápida identificación de alto rendemento de proteínas e a secuenciación de péptidos (xeralmente despois dunha dixestión en xel), as micromatrices de proteínas,[40] coas que se poden detectar os niveis relativos de grande número de proteínas presentes na célula, e sistema de dobre híbrido, que permite s exploración sistemática das interaccións proteína-proteína.[41] O conxunto total de todas estas interaccións bioloxicamente posibles denomínase interactoma.[42] Un intento sistemático de determinar as estruturas de proteínas que inclúa todos os posibles pregamentos coñécese como xenómica estrutural.[43]

Disponse dunha grande cantidade de datos xenómicos e proteómicos de varios organismos, entre eles o do xenoma humano, que facilitan que os investigadores identifiquen eficientemente proteínas homologas mesmo en organismos escasamente relacionados por medio de aliñamento de secuencias. As ferramentas de perfilado de secuencias poden realizar manipulacións máis específicas de secuencia como os mapas de encimas de restrición, análises de marcos abertos de lectura de secuencias de nucleótidos e predición da estrutura secundaria. A partir destes datos poden construírse árbores filoxenéticas e desenvolverse hipóteses sobre a evolución utilizando un software especial como ClustalW en relación cos antepasados dos organismos modernos e os xenes que expresan. O eido da bioinformática trata de ensamblar, anotar e analizar datos proteómicos e xenómicos, aplicando técnicas computacionais a problemas biolóxicos como a procura de xenes e a cladística.

Predición da estrutura e simulación

A predición da estrutura das proteínas é unha área complementaria da xenómica estrutural, que trata de predicir as estruturas proteicas para elaborar modelos axeitados das proteínas cuxas estruturas non foron aínda determinadas experimentalmente.[44] O tipo máis exitoso de predición de estruturas, chamado modelado de homoloxía, baséase na existencia dunha estrutura "patrón" ou "molde" con semellanza de secuencia coa proteína que está a ser modelada; o obxectivo da xenómica estrutural é proporcionar unha representación suficiente das estruturas xa resoltas para modelar a maioría das que quedan.[45] Aínda que elaborar modelos axeitados segue a ser un reto cando só se dispón de estruturas "patrón" pouco relacionadas, suxeriuse que o aliñamento de secuencia é o punto crítico neste proceso, xa que poden producirse modelos bastante axeitados se se coñece un aliñamento de secuencia "perfecto".[46] Moitos métodos de predición de estruturas serviron para informar o campo emerxente da enxeñaría de proteínas, no cal foron xa deseñados os novos pregamentos de proteínas.[47] Un problema computacional máis complexo é a predición de interaccións intermoleculares, como no acoplamento molecular e a predición da interacción proteína–proteína.[48]

O proceso de pregamento de proteínas e a súa unión a outras moléculas poden ser simulados utilizando técnicas como a mecánica molecular, en especial, a dinámica molecular e o método Monte Carlo, que cada vez máis aproveitan a computación distribuída e en paralelo (proxecto Folding@home;[49] modelado molecular en GPU). O pregamento de pequenos dominios proteicos en hélice alfa como as "cabezas" da proteína vilina[50] e a proteína accesoria do VIH[51] simulouse con éxito en silicio (no PC), e os métodos híbridos que combinan a dinámica molecular estándar con cálculos de mecánica cuántica permitiron a exploración dos estados electrónicos das rodopsinas.[52]

Historia

As proteínas foron recoñecidas como unha clase distinta de moléculas biolóxicas no século XVIII por Antoine Fourcroy e outros, pola súa capacidade de coagular ou flocular cando se trataban con calor ou ácidos. Notables exemplos de proteínas recoñecidas naquel momento foron a albumina da clara dos ovos, a albumina sérica do sangue, a fibrina e o glute do trigo.

As proteínas foron descritas por primeira vez polo químico holandés Gerardus Johannes Mulder e nomeadas polo químico sueco Jöns Jacob Berzelius en 1838. Mulder levou a cabo a análise elemental de proteínas comúns e encontrou que case todas as proteínas tiñan a mesma fórmula empírica, C400H620N100O120P1S1.[53] Chegou á errada conclusión de que poderían estar compostas por un só tipo de molécula (moi grande). O termo "proteína" proposto por Berzelius deriva do grego πρωτεῖος (proteios), que significa "primario",[54] "á cabeza", ou "situado diante".[55] Mulder seguiu os seus traballos identificando os produtos da degradación das proteínas como o aminoácido leucina para a cal calculou un peso molecular (case correcto) de 131 Da.[53]

Os primeiros científicos da nutrición como o alemán Carl von Voit crían que as proteínas eran os nutrientes máis importantes para manter a estrutura do corpo, porque críase xeralmente que a "carne fai carne".[56] O papel fundamental das proteínas como encimas nos organismos vivos non foi totalmente apreciado ata 1926, cando James Batcheller Sumner mostrou que o encima urease era, de feito, unha proteína.[57]

A dificultade que ten purificar proteínas en grandes cantidades fixo que fose moi difícil o seu estudo polos primeiros bioquímicos. Por iso, os primeiros estudos centráronse en proteínas que podían ser purificadas en grandes cantidades, como as do sangue, clara de ovo, varias toxinas e encimas dixestivos ou metabólicos obtidos en matadeiros. Na década de 1950, a compañía Armour Hot Dog Co. purificou 1 kg de ribonuclease A pancreática bovina pura e púxoa a disposición dos científicos gratuitamente, o que contribuíu a que a ribonuclease A se convertese nun dos obxectivos principais dos estudos bioquímicos nos anos seguintes.[53]

KendrewMyoglobin
John Kendrew preparando un modelo da mioglobina.

Linus Pauling prediciu con éxito a estrutura secundaria dunha proteína regular baseándose na formación de enlaces de hidróxeno, unha idea que fora adiantada en 1933 por William Astbury.[58] Os traballos posteriores de Walter Kauzmann sobre a desnaturalización,[59][60] baseados en parte en estudos previos de Kaj Linderstrøm-Lang,[61] contribuíron ao coñecemento do pregamento das proteínas e das estruturas mediadas por interaccións hidrofóbicas.

A primeira proteína que foi secuenciada foi a insulina, por Frederick Sanger, en 1949. Sanger determinou correctamente a secuencia de aminoácidos da insulina, demostrando así concluíntemente que as proteínas consisten en polímeros liñais de aminoácidos en vez de cadeas ramificadas, coloides, ou ciclois.[62] Este descubrimento valeulle o premio Nobel en 1958.

As primeiras estruturas proteicas resoltas foron as da hemoglobina e mioglobina, por Max Perutz e Sir John Cowdery Kendrew, respectivamente, en 1958.[63][64] A primeira estrutura proteica resolta con resolución atómica por análise de difracción de raios X fíxose na década de 1960 (Perutz e Kendrew compartiron o premio Nobel de Química de 1962 por estes descubrimentos) e posteriormente por espectroscopía de resonancia magnética nuclear de proteínas (NMR) na década de 1980. En 2009,o Protein Data Bank contiña unhas 55.000 estruturas de proteínas con resolución atómica.[65] Recentemente, a microscopía crioelectrónica de grandes ensamblaxes macromoleculares[66] e a predición da estrutura de proteínas computacional de dominios de pequenas proteínas[67] son dous métodos con resolución atómica.

Notas

  1. Murray et al., p. 31.
  2. 2,0 2,1 van Holde and Mathews, pp. 1002–42.
  3. Dobson CM (2000). "The nature and significance of protein folding". En Pain RH (ed.). Mechanisms of Protein Folding. Oxford, Oxfordshire: Oxford University Press. pp. 1–28. ISBN 0-19-963789-X.
  4. 4,0 4,1 Lodish H, Berk A, Matsudaira P, Kaiser CA, Krieger M, Scott MP, Zipurksy SL, Darnell J (2004). Molecular Cell Biology (5th ed.). New York, New York: WH Freeman and Company.
  5. Fulton A, Isaacs W (1991). "Titin, a huge, elastic sarcomeric protein with a probable role in morphogenesis". BioEssays 13 (4): 157–61. PMID 1859393. doi:10.1002/bies.950130403.
  6. Bruckdorfer T, Marder O, Albericio F (2004). "From production of peptides in milligram amounts for research to multi-tons quantities for drugs of the future". Current Pharmaceutical Biotechnology 5 (1): 29–43. PMID 14965208. doi:10.2174/1389201043489620.
  7. Schwarzer D, Cole P (2005). "Protein semisynthesis and expressed protein ligation: chasing a protein's tail". Current Opinions in Chemical Biology 9 (6): 561–69. PMID 16226484. doi:10.1016/j.cbpa.2005.09.018.
  8. Kent SB (2009). "Total chemical synthesis of proteins". Chemical Society Reviews 38 (2): 338–51. PMID 19169452. doi:10.1039/b700141j.
  9. En España, na literatura en castelán, adoita utilizarse o termo holoproteína para denominar as proteínas simples. Pero, ao contrario, na literatura inglesa holoprotein significa heteroproteína (de modo análogo ao termo holoencima), e este significado está moi estendido polo mundo. Neste artigo evitouse usar o termo holoproteína debido á súa ambigüidade.
  10. van Holde and Mathews, pp. 368–75.
  11. van Holde and Mathews, pp. 165–85.
  12. Branden and Tooze, pp. 340–41.
  13. Gonen T, Cheng Y, Sliz P, Hiroaki Y, Fujiyoshi Y, Harrison SC, Walz T (2005). "Lipid-protein interactions in double-layered two-dimensional AQP0 crystals". Nature 438 (7068): 633–38. Bibcode:2005Natur.438..633G. PMC 1350984. PMID 16319884. doi:10.1038/nature04321.
  14. Standley DM, Kinjo AR, Kinoshita K, Nakamura H (2008). "Protein structure databases with new web services for structural biology and biomedical research". Briefings in Bioinformatics 9 (4): 276–85. PMID 18430752. doi:10.1093/bib/bbn015.
  15. Walian P, Cross TA, Jap BK (2004). "Structural genomics of membrane proteins". Genome Biology 5 (4): 215. PMC 395774. PMID 15059248. doi:10.1186/gb-2004-5-4-215.
  16. Sleator RD. (2012). "Prediction of protein functions". Methods in Molecular Biology 815: 15–24. doi:10.1007/978-1-61779-424-7_2.
  17. Voet D, Voet JG. (2004). Biochemistry Vol 1 3rd ed. Wiley: Hoboken, NJ.
  18. Branden and Tooze, pp. 251–81.
  19. van Holde and Mathews, pp. 247–50.
  20. Bairoch A (2000). "The ENZYME database in 2000". Nucleic Acids Research 28 (1): 304–305. PMC 102465. PMID 10592255. doi:10.1093/nar/28.1.304.
  21. Radzicka A, Wolfenden R (1995). "A proficient enzyme". Science 267 (5194): 90–93. Bibcode:1995Sci...267...90R. PMID 7809611. doi:10.1126/science.7809611.
  22. EBI External Services (2010-01-20). "The Catalytic Site Atlas at The European Bioinformatics Institute". Ebi.ac.uk. Consultado o 2011-01-16.
  23. van Holde and Mathews, pp. 220–29.
  24. Sankaranarayanan R, Moras D (2001). "The fidelity of the translation of the genetic code". Acta Biochimica Polonica 48 (2): 323–35. PMID 11732604.
  25. van Holde and Mathews, pp. 830–49.
  26. Copland JA, Sheffield-Moore M, Koldzic-Zivanovic N, Gentry S, Lamprou G, Tzortzatou-Stathopoulou F, Zoumpourlis V, Urban RJ, Vlahopoulos SA (2009). "Sex steroid receptors in skeletal differentiation and epithelial neoplasia: is tissue-specific intervention possible?". BioEssays: news and reviews in molecular, cellular and developmental biology 31 (6): 629–41. PMID 19382224. doi:10.1002/bies.200800138.
  27. Samarin S, Nusrat A (2009). "Regulation of epithelial apical junctional complex by Rho family GTPases". Frontiers in bioscience: a journal and virtual library 14 (14): 1129–42. PMID 19273120. doi:10.2741/3298.
  28. Murray et al., pp. 21–24.
  29. Hey J, Posch A, Cohen A, Liu N, Harbers A (2008). "Fractionation of complex protein mixtures by liquid-phase isoelectric focusing". Methods in Molecular Biology. Methods in Molecular Biology™ 424: 225–39. ISBN 978-1-58829-722-8. PMID 18369866. doi:10.1007/978-1-60327-064-9_19.
  30. Terpe K (2003). "Overview of tag protein fusions: from molecular and biochemical fundamentals to commercial systems". Applied Microbiology and Biotechnology 60 (5): 523–33. PMID 12536251. doi:10.1007/s00253-002-1158-6.
  31. Stepanenko OV, Verkhusha VV, Kuznetsova IM, Uversky VN, Turoverov KK (2008). "Fluorescent proteins as biomarkers and biosensors: throwing color lights on molecular and cellular processes". Current Protein & Peptide Science 9 (4): 338–69. PMC 2904242. PMID 18691124. doi:10.2174/138920308785132668.
  32. Yuste R (2005). "Fluorescence microscopy today". Nature Methods 2 (12): 902–904. PMID 16299474. doi:10.1038/nmeth1205-902.
  33. Margolin W (2000). "Green fluorescent protein as a reporter for macromolecular localization in bacterial cells". Methods (San Diego, Calif.) 20 (1): 62–72. PMID 10610805. doi:10.1006/meth.1999.0906.
  34. Walker JH, Wilson K (2000). Principles and Techniques of Practical Biochemistry. Cambridge, UK: Cambridge University Press. pp. 287–89. ISBN 0-521-65873-X.
  35. Mayhew TM, Lucocq JM (2008). "Developments in cell biology for quantitative immunoelectron microscopy based on thin sections: a review". Histochemistry and Cell Biology 130 (2): 299–313. PMC 2491712. PMID 18553098. doi:10.1007/s00418-008-0451-6.
  36. Hohsaka T, Sisido M (2002). "Incorporation of non-natural amino acids into proteins". Current Opinion in Chemical Biology 6 (6): 809–15. PMID 12470735. doi:10.1016/S1367-5931(02)00376-9.
  37. Cedrone F, Ménez A, Quéméneur E (2000). "Tailoring new enzyme functions by rational redesign". Current Opinion in Structural Biology 10 (4): 405–10. PMID 10981626. doi:10.1016/S0959-440X(00)00106-8.
  38. Görg A, Weiss W, Dunn MJ (2004). "Current two-dimensional electrophoresis technology for proteomics". Proteomics 4 (12): 3665–85. PMID 15543535. doi:10.1002/pmic.200401031.
  39. Conrotto P, Souchelnytskyi S (2008). "Proteomic approaches in biological and medical sciences: principles and applications". Experimental Oncology 30 (3): 171–80. PMID 18806738.
  40. Joos T, Bachmann J (2009). "Protein microarrays: potentials and limitations". Frontiers in Bioscience 14 (14): 4376–85. PMID 19273356. doi:10.2741/3534.
  41. Koegl M, Uetz P (2007). "Improving yeast two-hybrid screening systems". Briefings in Functional Genomics & Proteomics 6 (4): 302–12. PMID 18218650. doi:10.1093/bfgp/elm035. Arquivado dende o orixinal o 15 de abril de 2013. Consultado o 27 de maio de 2013.
  42. Plewczyński D, Ginalski K (2009). "The interactome: predicting the protein–protein interactions in cells". Cellular & Molecular Biology Letters 14 (1): 1–22. PMID 18839074. doi:10.2478/s11658-008-0024-7.
  43. Zhang C, Kim SH (2003). "Overview of structural genomics: from structure to function". Current Opinion in Chemical Biology 7 (1): 28–32. PMID 12547423. doi:10.1016/S1367-5931(02)00015-7.
  44. Zhang Y (2008). "Progress and challenges in protein structure prediction". Current Opinions in Structural Biology 18 (3): 342–48. PMC 2680823. PMID 18436442. doi:10.1016/j.sbi.2008.02.004.
  45. Xiang Z (2006). "Advances in homology protein structure modeling". Current Protein and Peptide Science 7 (3): 217–27. PMC 1839925. PMID 16787261. doi:10.2174/138920306777452312.
  46. Zhang Y, Skolnick J (2005). "The protein structure prediction problem could be solved using the current PDB library". Proceedings of the National Academy of Sciences U.S.A. 102 (4): 1029–34. Bibcode:2005PNAS..102.1029Z. PMC 545829. PMID 15653774. doi:10.1073/pnas.0407152101.
  47. Kuhlman B, Dantas G, Ireton GC, Varani G, Stoddard BL, Baker D (2003). "Design of a novel globular protein fold with atomic-level accuracy". Science 302 (5649): 1364–68. Bibcode:2003Sci...302.1364K. PMID 14631033. doi:10.1126/science.1089427.
  48. Ritchie DW (2008). "Recent progress and future directions in protein–protein docking". Current Protein and Peptide Science 9 (1): 1–15. PMID 18336319. doi:10.2174/138920308783565741.
  49. Scheraga HA, Khalili M, Liwo A (2007). "Protein-folding dynamics: overview of molecular simulation techniques". Annual Review of Physical Chemistry 58: 57–83. Bibcode:2007ARPC...58...57S. PMID 17034338. doi:10.1146/annurev.physchem.58.032806.104614.
  50. Zagrovic B, Snow CD, Shirts MR, Pande VS (2002). "Simulation of folding of a small alpha-helical protein in atomistic detail using worldwide-distributed computing". Journal of Molecular Biology 323 (5): 927–37. PMID 12417204. doi:10.1016/S0022-2836(02)00997-X.
  51. Herges T, Wenzel W (2005). "In silico folding of a three helix protein and characterization of its free-energy landscape in an all-atom force field". Physical Review Letters 94 (1): 018101. Bibcode:2005PhRvL..94a8101H. PMID 15698135. doi:10.1103/PhysRevLett.94.018101.
  52. Hoffmann M, Wanko M, Strodel P, König PH, Frauenheim T, Schulten K, Thiel W, Tajkhorshid E, Elstner M (2006). "Color tuning in rhodopsins: the mechanism for the spectral shift between bacteriorhodopsin and sensory rhodopsin II". Journal of the American Chemical Society 128 (33): 10808–18. PMID 16910676. doi:10.1021/ja062082i.
  53. 53,0 53,1 53,2 Perrett D (2007). "From 'protein' to the beginnings of clinical proteomics". Proteomics – Clinical Applications 1 (8): 720–38. PMID 21136729. doi:10.1002/prca.200700525.
  54. New Oxford Dictionary of English
  55. Reynolds JA, Tanford C (2003). Nature's Robots: A History of Proteins (Oxford Paperbacks). New York, New York: Oxford University Press. p. 15. ISBN 0-19-860694-X.
  56. Bischoff TLW, Voit, C (1860). Die Gesetze der Ernaehrung des Pflanzenfressers durch neue Untersuchungen festgestellt (en German). Leipzig, Heidelberg.
  57. Sumner JB (1926). "The isolation and crystallization of the enzyme urease. Preliminary paper" (PDF). Journal of Biological Chemistry 69 (2): 435–41.
  58. Pauling L, Corey RB, Branson HR (1951). "The structure of proteins: two hydrogen-bonded helical configurations of the polypeptide chain" (PDF). Proceedings of the National Academy of Sciences U.S.A. 37 (5): 235–40. Bibcode:1951PNAS...37..235P. PMC 1063348. PMID 14834145. doi:10.1073/pnas.37.5.235.
  59. Kauzmann W (1956). "Structural factors in protein denaturation". Journal of Cellular Physiology. Supplement 47 (Suppl 1): 113–31. PMID 13332017. doi:10.1002/jcp.1030470410.
  60. Kauzmann W (1959). "Some factors in the interpretation of protein denaturation". Advances in Protein Chemistry. Advances in Protein Chemistry 14: 1–63. ISBN 978-0-12-034214-3. PMID 14404936. doi:10.1016/S0065-3233(08)60608-7.
  61. Kalman SM, Linderstrom-Lang K, Ottesen M, Richards FM (1955). "Degradation of ribonuclease by subtilisin". Biochimica et Biophysica Acta 16 (2): 297–99. PMID 14363272. doi:10.1016/0006-3002(55)90224-9.
  62. Sanger F (1949). "The terminal peptides of insulin". Biochemical Journal 45 (5): 563–74. PMC 1275055. PMID 15396627.
  63. Muirhead H, Perutz M (1963). "Structure of hemoglobin. A three-dimensional fourier synthesis of reduced human hemoglobin at 5.5 Å resolution". Nature 199 (4894): 633–38. Bibcode:1963Natur.199..633M. PMID 14074546. doi:10.1038/199633a0.
  64. Kendrew J, Bodo G, Dintzis H, Parrish R, Wyckoff H, Phillips D (1958). "A three-dimensional model of the myoglobin molecule obtained by X-ray analysis". Nature 181 (4610): 662–66. Bibcode:1958Natur.181..662K. PMID 13517261. doi:10.1038/181662a0.
  65. "RCSB Protein Data Bank". Arquivado dende o orixinal o 27 de decembro de 2012. Consultado o 2009-04-14.
  66. Zhou ZH (2008). "Towards atomic resolution structural determination by single-particle cryo-electron microscopy". Current Opinion in Structural Biology 18 (2): 218–28. PMC 2714865. PMID 18403197. doi:10.1016/j.sbi.2008.03.004.
  67. Keskin O, Tuncbag N, Gursoy A (2008). "Characterization and prediction of protein interfaces to infer protein-protein interaction networks". Current Pharmaceutical Biotechnology 9 (2): 67–76. PMID 18393863. doi:10.2174/138920108783955191.
ARN mensaxeiro

O ARN mensaxeiro ou ARNm (mRNA en inglés) é unha molécula de ARN que codifica a información sobre a secuencia de aminoácidos dunha proteína necesaria para a síntese da mesma nos ribosomas. O ARNm transcríbese dun molde de ADN (un xene), e leva información codificada ao lugar de síntese das proteínas, o ribosoma. Alí, o ácido nucleico tradúcese orixinando un polímero de aminoácidos, é dicir, un polipéptido ou unha proteína. Tanto no ARNm coma no ADN a información xenética está codificada na secuencia de nucleótidos, os cales se dispoñen en codóns que constan de tres bases. Cada codón codifica un determinado aminoácido, agás os codóns de parada ou stop, que indican a finalización da síntese proteica. Este proceso require o concurso doutros dous tipos de ARN: ARN transferente (ARNt), que media no recoñecemento do codón e trae ao ribosoma o correspondente aminoácido, e o ARN ribosómico (ARNr), que é o principal compoñente do ribosoma.

Adenosín monofosfato cíclico

O adenosín monofosfato cíclico, AMP cíclico ou AMPc (cAMP en inglés) é un nucleótido que funciona como segundo mensaxeiro en varios procesos biolóxicos. É un derivado do ATP, xa que se orixina a partir deste por acción do encima adenilato ciclase. No AMPc o seu fosfato non establece só un enlace fosfodiéster co OH en posición 5' da ribosa, senón tamén outro co OH en posición 3', creando un ciclo na molécula entre o fosfato e a ribosa, polo que o AMPc tamén se chama adenosín monofosfato-3',5' cíclico.

C-terminal

O extremo C-terminal (tamén chamado carboxilo terminal, carboxi-terminal, extremo COOH ou COOH-terminal) dunha proteína ou polipéptido é a rexión final da cadea de aminoácidos que remata nun grupo carboxilo (-COOH). O outro extremo da cadea remata nun grupo amino e denomínase N-terminal. A convención para a escritura de péptidos é situar o extremo C-terminal á dereita e escribir a secuencia comezando polo extremo N-terminal; por tanto, considérase que a proteína acaba no C-terminal.

Cofactor

Un cofactor é xeralmente definido como un composto non proteico de baixo peso molecular que se une a unha proteína (xeralmente encimática) e requírese para a actividade biolóxica da proteína. Os cofactores considéranse moléculas distintas do substrato, que "axudan" na catálise encimática. Para unha discusión sobre a definición do termo véxase o segundo capítulo.

Os cofactores poden clasificarse segundo a súa natureza química en orgánicos e inorgánicos.

Os inorgánicos son:ións metálicos , como os ións ferro, cobre, magnesio, manganeso, cinc, cobalto, molibdeno, selenio, etc.

grupos ferrosulfurados .Os orgánicos son os coencimas, que poden ser:vitamínicos (vitaminas ou que conteñen na súa estrutura vitaminas), como: vitamina C , biotina , coencima A , NAD+ e NADP+ , FAD, FMN , pirofosfato de tiamina etc.

non vitamínicos, como: ATP , S-adenosilmetionina , coencima B , coencima Q , glutatión , hemo etc.Tamén se poden clasificar segundo a forza con que se unan á proteína en: grupos prostéticos, unidos de forma forte e permanente, e coencimas, unidos máis feblemente. Pero é importante salientar que non hai unha clara división entre unión "feble" e "forte" do cofactor co encima. De feito, moitos, como o NAD+ poden estar fortemente unidos nuns encimas e feblemente noutros.. Os cofactores fortemente unidos rexenéranse, en xeral, durante o mesmo ciclo de reacción, mentres que os que están feblemente unidos rexenéranse nunha reacción posterior catalizada por un encima diferente. Neste último caso, o cofactor podería tamén ser considerado un substrato ou cosubstrato.

Cando un encima require un cofactor, a parte proteica do encima (inactiva) chámase apoencima. O apoencima xunto co cofactor forma o holoencima, que é o encima completo activo.

Holoencima = Apoencima (proteína) + Cofactor (non proteico)Algúns encimas ou complexos encimáticos requiren máis dun cofactor. Por exemplo, o complexo multiencimático piruvato deshidroxenase require cinco cofactores inorgánicos e un ión metálico, que son: o pirofosfato de tiamina (TPP) unido feblemente, a lipoamida unida covalentemente, e o flavín adenín dinucleótido (FAD) unido covalentemente, e os cosubstratos nicotín adenín dinucleótido (NAD+) e coencima A (CoA), e un ión metálico (Mg2+).

Moitos cofactores orgánicos son vitaminas ou derivados delas. Moitos conteñen o nucleótido AMP como parte da súa estrutura, o que pode indicar unha orixe evolutiva común como parte de ribozimas nun primitivo "mundo de ARN", tal como propoñen algunhas teorías sobre a orixe da vida. Suxeriuse que a parte formada polo AMP funcionaría como unha especie de "asa" coa que o encima "agarraría" ao coencima para movelo entre diferentes centros catalíticos.

Dominio proteico

Un dominio proteico é unha parte conservada dunha determinada secuencia e estrutura de proteína que pode evolucionar, funcionar e existir independentemente do resto da cadea proteica. Cada dominio forma unha estrutura tridimensional compacta e a miúdo pode ser estable e estar pregado independentemente. Moitas proteínas constan de varios dominios estruturais. Un dominio pode aparecer en moitas proteínas diferentes. A evolución molecular utiliza os dominios como bloques de construción de proteínas e estes poden ser recombinados en diferentes arranxos para crear proteínas con diferentes funcións. Os dominios varían en lonxitude desde os que teñen uns 25 aminoácidos ata os de 500 aminoácidos. Os dominios máis curtos, como os dedos de cinc, están estabilizados por metais iónicos ou pontes disulfuro. Con frecuencia, os dominio forman unidades funcionais, como os dominios que se unen ao calcio chamados man EF da calmodulina. Como son estables independentemente, os dominios poden ser "intercambiados" por medio de técnicas de enxeñaría xenética entre dúas proteínas para construír así unha proteína quimérica.

Expresión xénica

A expresión xénica é o proceso por medio do cal a información dun xene se utiliza para sintetizar un produto xénico funcional. Estes produtos son moitas veces proteínas, pero tamén existen xenes que non codifican proteínas, como os xenes dos ARN ribosómicos, ARN transferentes ou ARN nucleares pequenos, nos que o produto sintetizado é un ARN funcional. O proceso de expresión xénica utilízano todas as formas de vida coñecidas: eucariotas (tanto os unicelulares coma os pluricelulares), procariotas (bacterias e arqueas), para xerar as macromoléculas necesarias para a vida.

Poden modularse varias fases do proceso da expresión xénica, como a transcrición, o splicing de ARN, a tradución, e a modificación postraducional dunha proteína. A regulación da expresión xénica dálle á célula o control sobre a súa estrutura e funcións, e é a base para a diferenciación celular, morfoxénese e a versatilidade e adaptabilidade dun organismo. A regulación xénica pode tamén servir como substrato para o cambio evolutivo, xa que o control do momento, localización, e cantidade de expresión dun xene pode ter un profundo efecto nas funcións (accións) do xene na célula ou nun organismo pluricelular.

En xenética, a expresión xénica é o nivel máis fundamental no que o xenotipo orixina o fenotipo. O código xenético do ADN é "interpretado" por medio da expresión xénica, e as propiedades da expresión dan lugar ao fenotipo do organismo. Os fenotipos a miúdo exprésanse pola síntese de proteínas que controlan a forma do organismo, ou que actúan como encimas que catalizan vías metabólicas específicas características de cada organismo.

Glicoproteína

Unha glicoproteína, tamén denominada glicoproteido (e que non debe ser confundida cos peptidoglicanos) é unha molécula composta por unha proteína unida a un ou varios hidratos de carbono, simples ou compostos. Ten entre outras funcións o recoñecemento celular cando están presentes na superficie das membranas plasmáticas, así como as hormonas e os anticorpos.

Atópase no tecido conxuntivo e no cartilaxinoso, o humor vítreo, os mucoides, as mucinas e as diversas secrecións.Tamén son partícipes das reaccións anafilácticas debido a que actúan como antíxenos.

As glicoproteínas son as proteínas que conteñen as cadeas de oligosacáridos covalentes atadas ás súas cadeas laterais do polipéptido. O carbohidrato átase á proteína nunha modificación do cotranslacional ou do postraslacional. Este proceso coñécese como glicosilación. As glicoproteínas son normalmente as proteínas integrais importantes da membrana, onde desempeñan un papel nas interaccións célula-célula.

Interaccións proteína-proteína

As interaccións proteína-proteína (IPPs) son os contactos físicos intencionados establecidos entre dúas ou máis proteínas como resultado de eventos bioquímicos ou forzas electrostáticas.

As proteínas son macromoléculas vitais a nivel sistémico e celular, pero raramente actúan soas. As proteínas interaccionan con outras moléculas e unhas con outras. Nunha célula moitos procesos moleculares esenciais lévanse a cabo por complexos moleculares formados por un grande número de compoñentes proteicos organizados segundo as súas interaccións. Estas interaccións están na base de todo o sistema interactómico de todas as células vivas e, as interaccións proteína-proteína incorrectas ou anormais son a base de moitas enfermidades, como a síndrome de Creutzfeld-Jacob, enfermidade de Alzheimer, e cancro.

As IPPs estúdanse desde diferentes perspectivas: bioquímica, qúímica cuántica, dinámica molecular, transdución de sinais, entre outras. Toda esta información permitiu a elaboración de grandes redes de interaccións de proteínas, similares ás redes metabólicas ou xenéticas, que melloraron o coñecemento actual sobre fervenzas bioquímicas e patoxénese de enfermidades, e descubriron novas posibles dianas terapéuticas.

Isoforma

En bioloxía molecular denomínase isoforma ou isoforma proteica ás distintas formas dunha mesma proteína, que difiren na secuencia de aminoácidos pero presentan grande homoloxía, e que se orixinan das seguintes maneiras:

A partir de dous xenes distintos pero moi relacionados, orixinados por duplicación, que diverxiron algo. Os xenes teñen que estar moi relacionados, xa que o concepto de "mesma proteína" non ten senso para parálogos que diverxiron moito e que se orixinaron a partir dun só xene ancestral que se duplicou hai moitos millóns de anos e despois diverxiu moito en secuencia, estrutura e funcionalidade.

A partir do mesmo xene por splicing alternativo. A distinta maduración do ARNm durante o splicing dá lugar a proteínas procedentes do mesmo xene que difiren nalgunhas seccións, que faltan nalgunha das isoformas, porque se eliminaron os exóns correspondentes a esas seccións durante a maduración do ARNm.

A partir do mesmo xene polo uso de distintos promotores durante a transcrición, que fan que se orixinen ARNm nos que non se transcribiron certos exóns. Como os promotores son específicos de tecido, en distintos tecidos vanse expresar distintas isoformas desas proteínas. Neste caso, a diferenza do splicing alternativo no que a diferenza se produce despois da transcrición, aquí prodúcese durante a transcrición.

O termo tense usado tamén para referirse aos alelos dun mesmo xene e SNPs, pero actualmente o termo non se adoita a aplicar a alelos, senón a parálogos e proteínas resultantes de splicing alternativo.Outro xeito de orixinárense distintas formas dunha mesma proteína é por edición do ARN ou por sufrir modificacións postraducionais diferentes.

Un exemplo de proteína con isoformas é a actina G, a cal, malia a súa natureza moi conservada, ten varias isoformas, que nos mamíferos son polo menos seis.

A existencia de isoformas podería explicar o pequeno número de xenes codificantes de proteínas atopados no xenoma humano comparado coa diversidade atopada no proteoma, xa que as isoformas codificadas por un mesmo xene incrementarían esa diversidade. As isoformas a nivel do ADN poden estudarse pola técnica do ADNc, entre outras. Porén, para a grande maioría dos transcritos formados por splicing alternativo así atopados, non hai evidencias da súa posterior tradución, pregamento e estabilidade ou función ao nivel de proteína, e en moitos casos poden ser simplemente "ruído transcricional" ou eros de splicing.

Ligando

Este artigo trata sobre os ligandos en bioquímica. Para os ligandos en coordinación de metais en química inorgánica ver ligando (química inorgánica).

Non confundir con ligante (aglomerante ou aglutinante)

En bioquímica e farmacoloxía, un ligando (do latín ligare, 'unir') é unha substancia, que forma un complexo cunha biomolécula (proteína ou ácido nucleico) para realizar unha función biolóxica, como a estabilización estrutural, catálise, modulación dunha actividade encimática ou transmisión dun sinal. Na unión proteína-ligando, o ligando é unha molécula que desencadea un sinal ao unirse a un sitio de unión na proteína diana. Entre os ligandos están entre outros os substratos, inhibidores encimáticos, activadores, hormonas e neurotransmisores. Nos estudos de unión ADN-ligando, o ligando pode ser unha pequena molécula, ión, ou proteína que se une á dobre hélice do ADN.

A unión do ligando ten lugar por forzas intermoleculares, como enlaces iónicos, enlaces de hidróxeno e forzas de van der Waals. A unión ou "atraque" co receptor (a asociación entre ambos) é xeralmente reversible, polo que despois se produce a disociación. É raro nos sistemas biolóxicos que se una por medio dun enlace covalente irreversible. A diferenza do significado que ten ligando en metalorgánica e química inorgánica, en bioquímica é irrelevante que o ligando se una a un sitio metálico, pero si ocorre nalgúns casos, como na hemoglobina.

Os ligandos poden unirse entre outros a encimas, receptores de membrana ou intracelulares, canais iónicos, proteínas de transporte ou almacenamento, proteínas reguladoras, ou anticorpos.

A unión do ligando a un receptor (proteína receptora) altera a súa forma tridimensional (conformación). O estado conformacional dunha proteína receptora determina o seu estado funcional. A tendencia ou forza de unión co seu receptor denomínase afinidade. A afinidade de unión está determinada non só polas interaccións directas, senón tamén polos efectos do disolvente, que pode chegar a ter un efecto indirecto dominante na formación de enlaces non covalentes na solución.Os radioligandos son compostos etiquetados con radioisótopos, que se utilizan in vivo como trazadores nos estudos con tomografía de emisión de positróns (PET) e para estudos de unión de ligandos in vitro.

Martin Chalfie

Martin Chalfie, nado o 15 de xaneiro de 1947 en Chicago, Illinois (USA), é un científico estadounidense galardoado, xunto co estadounidense Roger Y. Tsien e o xaponés Osamu Shimomura, co Premio Nobel de Química do ano 2008 polo descubrimento e desenvolvemento da proteína fluorescente verde (GFP).

Modificación postraducional

As modificacións postraducionais (MPT) son as modificacións químicas que sofren as proteínas despois da súa tradución nos ribosomas. É un dos pasos finais na síntese de proteínas e, por tanto, da expresión xénica, para moitas proteínas. Moitas proteínas non poderían exercer as súas funcións se non sofren estes cambios.

Unha proteína ou cadea polipeptídica é unha cadea de aminoácidos. Durante a síntese de proteínas, poden incorporarse á proteína en formación 20 aminoácidos diferentes. Despois da tradución, a modificación postraducional dun aminoácido amplía as posibles funcións da proteína ao unirlle outro grupo químico funcional (como acetato, fosfato, varios lípidos e carbohidratos), ou cambiar a natureza química do aminoácido (por exemplo, citrulinación), ou provocando cambios estruturais (por exemplo, formación de pontes disulfuro).

Ademais, os encimas poden eliminar aminoácidos do extremo N-terminal da proteína, ou cortar a cadea peptídica polo medio. Por exemplo, a hormona peptídica insulina sofre dous cortes antes de que se formen as pontes disulfuro, e elimínase un propéptido da parte media da cadea; a proteína resultante consta de dúas cadeas polipeptídicas conectadas por pontes disulfuro. Tamén, a maioría dos polipéptidos nacentes empezan co aminoácido metionina porque o codón de inicio do ARNm codifica ese aminoácido, pero este aminoácido xeralmente é separado da proteína durante as modificacións postraducionais.

Outras modificacións, como a fosforilación, son parte habitual dos mecanismos para controlar o estado de funcionamento da proteína, por exemplo activando ou inactivando un encima.

A modificación postraducional das proteínas é detectada por espectrometría de masas ou pola técnica do Eastern blotting.

N-terminal

O extremo N-terminal (tamén chamado amino terminal ou NH2-terminal) é o extremo dunha proteína ou cadea polipeptídica que leva un grupo amino libre, por onde se considera que empeza a proteína. O outro extremo leva un grupo carboxilo e denomínase extremo C-terminal. Por convención as secuencias de aminoácidos dos péptidos escríbense empezando polo extremo N-terminal, que se coloca á esquerda. Cando se produce a tradución de proteínas nos ribosomas a partir do ARNm, esta empeza a traducirse polo extremo N-terminal.

Osamu Shimomura

Osamu Shimomura (下村 脩, Shimomura Osamu), nado en Fukuchiyama (prefectura de Quioto) o 27 de agosto de 1928, é un químico orgánico e biólogo mariño xaponés galardoado co Premio Nobel de Química do ano 2008 polo descubrimento e desenvolvemento da proteína fluorescente verde (GFP), xunto aos estadounidenses Martin Chalfie e Roger Y. Tsien.

Péptido

Os péptidos son un tipo de moléculas formadas pola unión de varios aminoácidos mediante ligazóns peptídicas.

Os péptidos, do mesmo xeito que as proteínas, están presentes na natureza e son responsables dun gran número de funcións, moitas das cales aínda non se coñecen.

A unión dun baixo número de aminoácidos dá lugar a un péptido. Unha clasificación tradicional das cadeas peptídicas polo seu tamaño é a seguinte:

Oligopéptido: menos de 10 aminoácidos. Poden ser dipéptidos, tripéptidos, tetrapéptidos... segundo teñan dous, tres, catro... aminoácidos, respectivamente.

Polipéptido: máis de 10 aminoácidos.

Proteína: máis de 100 aminoácidos. As proteínas cunha soa cadea polipeptídica denomínanse proteínas monoméricas, mentres que as compostas de máis dunha cadea polipeptídica coñécense como proteínas multiméricas.Os péptidos diferéncianse das proteínas en que son máis pequenos (teñen menos de dez mil ou doce mil daltons) e en que as proteínas poden estar formadas pola unión de varios polipéptidos e ás veces grupos prostéticos. Porén, a distinción entre polipéptidos e proteínas é un tanto arbitraria e variable na literatura científica, xa que algúns autores poñen outros límites no número de aminoácidos (menos de 100), e non é definitivo tampouco o criterio estrutural. Non está claro o límite entre os polipéptidos grandes e as proteínas pequenas. Algúns autores usan os termos cadea polipeptídica e mesmo "polipéptido" co significado de cadea simple de aminoácidos independentemente do seu tamaño. Un exemplo de polipéptido é a insulina, composta de 55 aminoácidos e coñecida como unha hormona de acordo á función que ten no organismo dos seres humanos. Entre os péptidos pequenos son exemplos o tripéptido glutatión e a hormona oxitocina, de nove aminoácidos.

Tradución (proteínas)

En bioloxía a tradución é a síntese de proteínas nos ribosomas a partir da información contida nun ARNm, o cal é unha copia realizada por transcrición dun xene do ADN. Por tanto, a tradución é o segundo proceso da expresión xénica despois da transcrición.

A tradución só se pode producir nos ribosomas do citoplasma da célula, que están formados por dúas subunidades, que rodean o ARNm que se vai traducir. Na tradución, o ARN mensaxeiro descodifícase para producir un polipéptido específico de acordo coas correspondencias do código xenético, que asocian cada codón (triplete de nucleótidos) do ARNm cun determinado aminoácido. Deste modo tradúcese a "linguaxe" de nucleótidos do ARN á "linguaxe" de aminoácidos das proteínas. A tradución comeza no codón de inicio AUG e acaba nun codón de parada (UGA, UAA, UAG). No proceso da tradución distinguimos catro fases: activación, iniciación, elongación e terminación.A enerxía requirida para traducir proteínas é considerable. Para unha proteína que conteña n aminoácidos, o número de enlaces fosfato de alta enerxía necesarios para traducila é 4n-1.

Transdución de sinais

Non confundir coa transdución xenética bacteriana.

En bioloxía, a transdución de sinais ten lugar nas células cando unha molécula de sinalización extracelular activa un receptor da superficie celular, o cal á súa vez altera algunhas moléculas intracelulares orixinando unha resposta. Este proceso comprende dúas fases:

Unha molécula sinalizadora activa unha proteína receptora específica na membrana celular.

Un segundo mensaxeiro transmite os sinais dentro da célula, causando unha resposta fisiolóxica.En cada un destes pasos, o sinal pode ser amplificado. Así, unha molécula sinalizadora pode causar moitas respostas.

Xene

Un xene é a unidade básica de herdanza dos seres vivos. Dende o punto de vista molecular, un xene é unha secuencia lineal de nucleótidos na molécula de ADN (ou ARN no caso dalgúns virus), que contén a información necesaria para a síntese dunha macromolécula con función celular específica. Por exemplo: Proteínas, ARNm, ARN ribosómico, ARN de transferencia e ARN pequenos. Esta función pode estar vinculada ó desenvolvemento ou funcionamento dunha función fisiolóxica normal. O xene é considerado como a unidade de almacenamento de información e unidade de herdanza ó transmitir esa información á descendencia. Os xenes dispóñense, pois, ao longo de cada un dos cromosomas. Cada xene ocupa no cromosoma unha posición determinada chamada locus. O conxunto de cromosomas dunha especie denomínase xenoma.

Algunhas enfermidades como a anemia drepanocítica (ou anemia falciforme) poden ser ocasionadas por un cambio nun só xene (un dos 30.000 'xenes que constitúen o plano para todo o corpo humano).

Os organismos diploides (entre eles, case todos os animais e plantas) dispón de dous xogos de cromosomas homólogos, cada un deles proveniente dun dos pais. Cada par de cromosomas ten, pois, un par de copias de cada xene, unha procedente da nai e outra do pai.

Os xenes poden aparecer en versións diferentes, con variacións pequenas na súa secuencia, denominadas alelos. Os alelos poden ser dominantes ou recesivos. Cando unha soa copia do alelo fai que se manifeste o trazo fenotípico, o alelo é dominante. Cando son precisas dúas copias do alelo (unha en cada cromosoma do par), o alelo é recesivo.

Outras linguas

This page is based on a Wikipedia article written by authors (here).
Text is available under the CC BY-SA 3.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.