Nøgleforskellen mellem lighed og identitet i sekvensjustering er, at lighed er ligheden (ligheden) mellem to sekvenser i sammenligning, mens identitet er antallet af tegn, der matcher nøjagtigt mellem to forskellige sekvenser.
Bioinformatik er et tværfagligt videnskabsområde, der hovedsageligt involverer molekylærbiologi og genetik, datalogi, matematik og statistik. Sekvensjustering er et hovedbegreb inden for bioinformatik. Det er den procedure, hvor sekvenserne af DNA, RNA eller protein er arrangeret for at identificere regioner med lighed, der er en konsekvens af funktionelt, strukturelt eller evolutionært forhold mellem sekvenserne. I slutningen af justeringen vil de blive præsenteret som rækker i en matrix. For at justere de identiske tegn i successive farver, er der indsatte mellemrum mellem resterne.
Hvad er lighed?
Lighed i sekvensjustering er ligheden mellem to sekvenser, når de sammenlignes. Dette faktum afhænger af sekvensernes identitet. Lighed viser i hvilken udstrækning resterne er på linje. Derfor indeholder lignende sekvenser lignende egenskaber. I bioinformatik er lighed et værktøj til at vurdere ligheden mellem to proteiner.
Figur 01: Similarity in Sequence Alignment
Der er to hovedtrin til sekvensjusteringsprocessen. Det indledende trin er parvis alignment, som hjælper med at finde den optimale alignment mellem to sekvenser (inklusive huller) ved hjælp af algoritmer som BLAST, FastA og LALIGN. Matchningsalgoritmen finder det mindste antal redigeringsoperationer; in-dels og substitutioner for at tilpasse en sekvens til den anden sekvens. Efter parvis justering er det nødvendigt at opnå to kvantitative parametre fra hver parvis sammenligning. De er identitet og lighed.
Hvad er identitet?
Identitet i sekvensjustering er antallet af tegn, der matcher nøjagtigt mellem to forskellige sekvenser. Derfor tæller huller ikke med ved vurdering af identitet. Målingen anses for at være relation til den kortere sekvens blandt de to sekvenser. Det antyder væsentligt, at det har den effekt, hvor sekvensidentiteten ikke er transitiv. Hvis X=Y og Y=Z, så er X ikke nødvendigvis lig med Z. Dette udledes i form af identitetsafstandsmålet.
Figur 02: Identitet i sekvensjustering
For eksempel har X en sekvens af AAGGCTT, Y har en sekvens af AAGGC, og Z har en sekvens af AAGGCAT. Identiteten mellem X og Y er 100 % {5 identiske nukleotider/min[længde(X), længde(Y)]}. Identiteten mellem Y og Z er også 100 %. Men identiteten mellem X og Z er kun 85 % {(6 identiske nukleotider / 7)}.
Hvad er lighederne mellem lighed og identitet i sekvensjustering?
- Både lighed og identitet er to udtryk, vi bruger i sekvensjustering.
- De henviser også til ligheden mellem de to sekvenser.
- Desuden udtrykker vi dem som en procentværdi.
Hvad er forskellen mellem lighed og identitet i sekvensjustering?
Lighed i justering fortæller ligheden mellem to sekvenser, når de sammenlignes, mens identitet i sekvensjustering fortæller mængden af tegn, der matcher nøjagtigt mellem to forskellige sekvenser. Derfor er dette den vigtigste forskel mellem lighed og identitet i sekvensjustering.
Summary – Similarity vs Identity in Sequence Alignment
Sekvensjustering hjælper med at identificere regioner med lighed i DNA, RNA eller protein som følge af funktionelt, strukturelt eller evolutionært forhold mellem sekvenserne. Derfor er lighed og identitet to nøglebegreber i forbindelse med sekvensjustering. Den vigtigste forskel mellem disse to udtryk er, at lighed er ligheden mellem to sekvenser i sammenligning, mens identitet er antallet af tegn, der matcher nøjagtigt mellem to forskellige sekvenser. Dette er således opsummeringen af forskellen mellem lighed og identitet i sekvensjustering.