Fraksjonen av manglende Alignments

Fraksjonen av manglende Alignments


Fraksjonen av manglende linjer er en parameter som kan bli satt ved sammenligning av strenger av data til hverandre med justerings programvare. Denne parameteren definerer graden av tillatt feil i korrelasjonsprosessen. Det tillater ulike datasett som skal sammenlignes eller matchet selv om data prøvene er ufullstendig, fragmentert eller antas å ha noen områder av ikke-korrelasjon. Dette konseptet er grunnleggende for sekvenssammenstilling algoritmer som brukes i felt som genetikk, lingvistikk og økonomi.

Sekvense Analyse Bakgrunn

Helt siden forskere begynte sekvense genetisk materiale, har de vært samler en raskt voksende bibliotek av DNA-kart i levende organismer. På grunn av kompleksiteten av disse kartlagte sekvenser, som kan omfatte flere tusen gener, vi vanligvis må beregningsalgoritmer for å analysere dem. Feltet av bioinformatikk steg ut av dette kravet, utvikle algoritmer og beregnings teknologi for å utføre høy-belastning dataanalyse for biologisk forskning. Et område av førsteklasses interesse i bioinformatikk er sekvenssammenstilling, eller teknikken med å sammenligne genetiske prøver til hverandre eller til en fullstendig indeks genom.

Sequence Alignment Betraktninger

Sekvenssammenstilling kan benyttes for å samsvare med genetisk materiale, som i DNA-testing for kriminelle undersøkelse, for å sammenligne prøvene med hverandre for å bestemme en grad av forholdet, som etablere foreldre identitet eller en mer generell evolusjonære forbindelse, eller for mange lignende anvendelser i biologisk forskning som analyserer sammenhengen mellom genetiske prøver. Når samkjøre prøver, men forstår vi at dataene vil sannsynligvis ikke matche perfekt. Hvis vi prøver å forsøke å bevise identiteten til gjerningsmannen for en forbrytelse, for eksempel kan den genetiske prøve tatt fra scenen være ufullstendig eller gappy. Hvis vi prøver å etablere en grad av forholdet mellom prøver, som i tilfelle av opphavsundersøking eller evolusjonær forskning, vil det være forventet områder av mismatch siden personer hvert bærer unik genetisk koding.

Manglende Alignments

Disse antas hull eller uoverensstemmelser er "mangler justeringer": Områdene i forhold genetiske data som ikke samsvarer med hverandre. I analysen, må disse mangler justeringer gjøres rede for i en viss grad, og det er "fraksjon av manglende linjer": forholdet mellom enestående data for å sammenligne data i prøven korrelasjon. Avhengig av programmet, kan denne fraksjonen være større eller mindre. For eksempel, i evolusjonær forskning, forskerne er opptatt med bredere likheter mellom prøver eller visse områder av sammenheng i stedet for en tett kamp. Slik at i disse tilfeller er den fraksjonen vil være større. I DNA-testing for etterforskning, kan brøkdel være mindre for mer definitive matching. Computational teknologi som brukes for sekvenssammenstilling, som Burrows-Wheeler Aligner, lar dermed brukerne bestemme graden av tillatt feil for deres spesielle justerings applikasjoner. Fraksjonen av manglende linjer parameter tilpasser den ønskede grad av presisjon av prosessen.

Ikke-Genetics Applications

Sekvenssammenstilling som begrep har funnet bruker utenom genetisk forskning. Algoritmer og teknologi opprinnelig utviklet for biologisk analyse kan også bidra til å identifisere relaterte mønstre i områder som sammenlignende lingvistikk og markedsføring. Som med sine applikasjoner i genetikk, brøkdel av manglende justeringer tilpasser presisjonen av korrelasjon mellom mønsterprøver i disse feltene.