User:Filipa Ribeiro C. Lucas/Notebook/Filipa Lucas/2010/03/02

Exercício

Lembre-se que qualquer representações tem subjacente um conjunto de convenções. 1.	Que moléculas se podem representar desta forma e que convenções estarão implícitas nos diferentes casos? 2.	Supondo que se trata de DNA, indique uma forma de apresentação alternativa que represente melhor a sua estrutura real. 3.	Poderá esta sequência conter um gene? Justifique a sua resposta. 4.	Indique o resultado da transcrição desta sequência. 5.	É possível prever que proteína se encontra codificada numa sequência nucleotídica? Como? 6.	A sequência apresentada codifica alguma proteína? Consulte aqui o código genético 7.	Que diferenças encontra se em vez de aplicar o código genético standard aplicar a variante bacteriana? 8.	Como poderia saber de que organismo provém esta sequência?

1)	As moléculas que se podem representar dessa forma, fazem parte do grupo dos ácidos nucleicos, que constituí uma das unidades estruturais fundamentais de todas as formas de vida. Os ácidos nucleicos resultam da repetição de unidades mais simples denominadas nucleótidos. Neste exemplo o que é visivel são as bases nitrogenadas dos nucleótidos: purinas (T e C) e pirimidinas (A e G) . Como esta sequência não têm a base uracilo excluí-se à partida a representação de uma molécula de RNA. Além disso, a representação parece corresponder a uma molécula de massa elevada e a quantidade total de purinas deve equivaler à de pirimidinas, ou seja, A+G=C+T. Por isso, a representação corresponderá a uma das cadeias antiparalelas do DNA. Porém, outra hipótese será a seguinte: dado o facto de a molécula representar tripletos de nucleótidos e ,em que cada tripleto tem uma correspondência em AA, através do código genético. Este tipo de representação está no formato do GenBank que por convenção representa sequências mRNA usando o alfabeto DNA, i.é, o uracilo (U) é substituído pela timina (T).

2)	5’ terminal do esqueleto fosfato-desoxiribose                                                      3’ terminal

TTGACACTA……………………………………………………………………………………….GAAGCCTGG

Ligadas por pontes de Hidrogénio

AACTGTGAT……………………………………………………………………………………….CTTCGGACC 3’ terminal                              5’ terminal

3)	O DNA transporta a informação genética codificada que é necessária para a formação de um novo organismo. O gene é uma unidade hereditária que consiste numa sequência particular de bases no DNA e que especifica a produção de uma certa proteína (e por isso, o segmento de DNA deverá ser bem maior do que o mínimo necessário para os aa que fazem parte duma proteína). Por isso, dada a existência de intrões (regiões não codificantes), esta defenição pode ser difícil de aplicar e alem disso, há que considerar as regiões promotoras do genes como parte integrante do mesmo: às quais a RNA polimerase se liga, e que se localiza 25 nucleótidos acima do sítio onde a transcrição se inicia. (Em bactérias,temos a Pribnow Box (trecho de Pribnow), constituída por uma seqüência TATAAT e está situada a -10 e a região -35, que tem uma seqüência TTGACA. O primeiro nucletideo a ser transcrito é geralmente uma purina.) Assim, para saber se a sequência contêm um gene, teria que ter uma sequência que indicasse o inicio do gene (TATA box), isto é uma sequência de TATA repetidos, para além de um codão iniciador da tradução. Esses codões: TTG, CTG ou ATG, para o código standard (normalmente é o ATG). Efectivamente encontramos dois desses codões iniciadores na sequência. Além disso a transcrição do gene é finalizada por um dos três codões stop: TAA, TAG e TGA Não sabemos se é um gene.

O promotor de uma célula eucariótica típica tem uma TATA box e precedido por uma CCAAT box e uma box rica em GC. Os três codões stop do mRNA terminam o processo de tradução do polipéptido

4)	3’ terminal AACUGAU …………………………………………………… GUUCGGACC 5’ terminal

5)	Sim. Os codões são compostos por três nucleotidos. Esta informação encontra-se no DNA, de onde é transcrita para o RNA mensageiro. O DNA e o mRNA possuem somente quatro bases diferentes, enquanto que as proteínas contêm 20 diferentes aminoácidos. Dessa maneira, o código é lido em grupos de três bases, sendo três o número mínimo necessário para a codificação de 20 aminoácidos. A mensagem é lida a partir de um ponto inicial fixo sinalizado por codão de iniciação: AUG e termina quando é encontrado um codão de finalização : UAG, UAA, UGA. A sequência de trios determina a sequência dos aminoácidos de uma proteína. Os aminoácidos, no entanto, não são capazes de reconhecer por si sós um dado trio do mRNA; para que isso aconteça, cada aminoácido precisa ligar-se a uma molécula adaptadora denominada RNA de transferência (tRNA). Cada molécula de tRNA possui um sítio de ligação do aminoácido e um outro local para o reconhecimento dos trios do mRNA. Este último sítio é denominado de anti-codão e consiste em três nucleotídeos que podem estabelecer um pareamento de bases com o codão complementar do mRNA e posteriormente a sequencia de mRNA é traduzida numa proteína.

Porém, embora esta sequência possa ser traduzida numa proteína é necessário ter em conta o facto de esta ser bastante extensa e ser constituída por vários codões de finalização e dada a sua potencialidade para codificar um polipéptido, estas ideias conduzem à hipótese de um quadro aberto de leitura, pois: nos organismos eucariotas a maioria das cadeias polipéptidicas não são perfeitamente colineares à sequencia de bases de DNA que as codifica, por ser interrompida por trenchos que não codificam aa.

6) 5'3' Frame 1 L T L P R C T I F T R V A N F C R K V L S R E E S E A E Q A V A R P Q V T V I P R E Q H A I S R K D I S E N A L K V Met Y R L N K A G Y E A W

5'3' Frame 2 Stop H Y R G V L F L P E S L I F A A R C Stop A A R K A R L N R Q S P V H R Stop R Stop S R V S S Met L F P A K I S V K Met P Stop R Stop C T G S I K R D T K P

5'3' Frame 3 D T T E V Y Y F Y P S R Stop F L P Q G A K P R G K R G Stop T G S R P S T G D G D P A Stop A A C Y F P Q R Y Q Stop K C P E G N V Q A Q Stop S G I R S L

3'5' Frame 1 P G F V S R F I E P V H Y L Q G I F T D I F A G N S Met L L T R D H R H L W T G D C L F S L A F L A A Stop H L A A K I S D S G K N S T P R Stop C Q

3'5' Frame 2 Q A S Y P A L L S L Y I T F R A F S L I S L R E I A C C S R G I T V T C G R A T A C S A S L S S R L S T L R Q K L A T R V K I V H L G S V

3'5' Frame 3 R L R I P L Y Stop A C T L P S G H F H Stop Y L C G K Stop H A A H A G S P S P V D G R L P V Q P R F P R G L A P C G K N Stop R L G Stop K Stop Y T S V V S

Por conseguinte, a frame 1 5-3 e frame 2 3-5 poderão codificar uma protéina, dada a não representação dos codões de iniciação e finalização. 7) Codigo standard: o codao de iniciação é o AUG e nas bactérias: GUG e UUG (e por isso desde que se preserve os dois últimos núcleótidos, quaquer tripleto que termine em UG é considerado codão de iniciação).

8)	Através do NCBI (centro nacional para a biotecnologia de informação): com o uso de ferramentas computacionais, coloca ao dispor diversas bases de dados biológicos, como é o caso do Blast que permite alinhar sequencias biologicas.