FASTA Format Beskrivelse

FASTA Format Beskrivelse


En FASTA-format filen inneholder en eller flere sekvenser av nukleotider i DNA. Den FASTA format stammer med FASTA programvarepakke for DNA-sekvensering, selv om det har blitt en standard format for representasjon av DNA-sekvenser i bioinformatikk. FASTA er et enkelt format som gjør sekvensene enkle å analysere ved hjelp av skriptspråk som Perl og Python.

Oversikt

Grunnlaget for en fil er en linje som starter med ">" karakter, og etterfulgt av tekst identifisere opprinnelsen av sekvensen. Overskriften er vanligvis færre enn 80 tegn. Linjen følger denne topplinja inneholder en rekke tegn som representerer nukleotider i DNA eller aminosyreresiduer i et peptid sekvens.

Tillatt DNA tegn

Bare meningsfylte tegn er tillatt som en del av en FASTA sekvens. Sekvenser kan bestå av A, C, T, G eller U, svarende til nukleotidene adenosin, cytosin, tymidin, guanin eller uracil respektivt. Imidlertid kan den nøyaktige identiteten til nukleotid ikke alltid være til stede fra sekvensering. FASTA inneholder også koder som representerer de mulige nukleotider når usikkerheten er til stede. Koden N brukes når ingen bestemmelse kan gjøres og X når nukleotidet er maskert av andre molekyler. Den "-" code brukes til å representere en åpning av ubestemt lengde.

Tillatt Peptide tegn

En alfanumerisk kode kan også brukes for å representere de 24 aminosyrene som er tilstede i en peptidsekvens. Dersom et peptid som ikke kan bestemmes, er koden X som brukes, i likhet med en DNA-sekvens. En "*" benyttes for å angi den terminale eller translasjons-stopp-sekvensen til et peptid. Et "-" er også brukt for å representere et hull i sekvenseringsdata for peptider.

Annen informasjon

NCBI setter en standard sekvens ID, eller SEQ ID, for bruk i fasta header linjer, men det er ingen definitiv standard for inkludering i FASTA overskriftslinjen. En FASTA fil som inneholder flere sekvenser som er kjent som en multi FASTA fil. FASTA filer kan ha filtypen ".fasta", ".fna", ".ffn", ".faa", ".frn" eller ".fas."