Código FASTA

 

 

Una secuencia en formato FASTA inicia con una sola línea conteniendo la información de la secuencia y a continuación de esta línea sigue la secuencia, sea esta de aminoácidos o nucleótidos.

La línea informativa inicia con el símbolo > como se muestra a continuación y se recomienda que las líneas no excedan los 80 caracteres de longitud.

Para una proteína:

 

>ubiquitina

MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQL

EDGRTLSDYNIQKESTLHLVLRLRGG

 

Para una cadena de ADN:

>gi|2230874|emb|X99726.1|HSNDUFV31 H.sapiens NDUFV3 gene, exon 1
GAAGCTGCTGTGGCCCTGCTTGGTGCGCCCGCTGTCACCGCCATGGCTGCCCCGTGTTTGCTGAGGAAAG
GACGAGCCGGGGCGCTGAAGGTAAAGGAGGAGCCAGCTGGGCTGGGTGCG

 

Sí la secuencia es de nucleótidos el formato permite los siguientes símbolos:

Símbolo
Significado
A
Adenina
C
Citosina
G
Guanina
T
Timina
U
Uracilo
R
Purina
Y
Pirimidina
K
G o T
N
A, C, G o T
-
Hueco

Sí la secuencia es de aminoácidos el formato permite los siguientes símbolos:

Símbolo
Significado
Símbolo
Significado
A
Alanina
P
Prolina
B
Asparagina
Q
Glutamina
C
Cisteina
R
Arginina
D
Ácido Aspártico
S
Serina
E
Ácido Glutámico
T
Treonina
F
Fenilalanina
U
Selenocysteina
G
Glicina
V
Valina
H
Histidina
W
Triptófano
I
Isoleucina
Y
Tirosina
K
Lisina
Z
Ácido Glutámico
L
Leucina
M
Metionina
N
Asparagina
*
Fin de la traducción
-
gap de longitud indeterminada

 

 

[Home][Propuesta][Contenidos][Tutoriales][Base de datos][Links][Contáctame]

Copyright(c) 2004