Process av genförutsägelse och räkning

Process av Gene Prediction och Counting!

Annonation är en process som identifierar gener, deras reglerande sekvenser och möjliga funktioner. Annonation anger de icke-proteinkodande generna, kodande gener för r-RNA, t-RNA och nukleära RNA, mobila genetiska element och repetitiva sekvensfamiljer närvarande i genom.

Uppgift om annoncering startar först efter att genomsekvensen har erhållits. Genförutsägning är ett viktigt problem för beräkningsbiologi och det finns olika logaritmer som kan användas för genprediktion genom att använda identifierade gener som en träningsdatasats.

Att räkna av gener blir svårt med tanke på att man känner till generens existens i ett genom. Närvaro av överlappande gener och skarvarvarianter gör uppgiften svårare. Det blir svårt att förutse vilka delar av DNA som ska betraktas som samma eller många olika gener.

Fig.6.70. En SNP-karta

Många gener i eukaryoter har ett mönster av exoner (kodande regioner) följt av introner (icke kodande regioner). På grund av dessa gener är inte organiserade som kontinuerliga ORF (öppna läsramar). En ORF har en serie kodoner som anger en aminosyrasekvens.

Andra gener i eukaryoter är vanligtvis i stor utsträckning och har därmed större chanser att lokalisera falska gener. Men nya tekniker för ORF-skanningsprogram för eukaryota gener gör skanning effektivare. Nu kan vi räkna generna av en organism (med några experimentella fel).

Det sägs att cirka 99, 8% av 3, 2 miljarder baspar mellan två människor är desamma och endast 0, 2% olika. För varje 500 nukleotider skiljer sig endast en nukleotid mellan två individer. Det betyder variation på några ställen i DNA-sekvensen kan leda till svår sjukdom och olika karaktärer hos människor.

Genomlikhet, SNP och jämförande genomik:

Som redan sagt att 99, 8% av varje humant genom är liknande alla andra humana genom och 0, 2% olika. Det innebär att två individer skiljer sig endast i 6 miljoner platser av 3, 2 miljarder platser.

Om dessa platser har liten effekt kommer två människor att vara identiska. Människor är mer än 98% liknande chimpanser. Således skiljer skillnaden på få platser i DNA att göra individet unikt. För varje 500-1000 nukleotider skiljer sig en nukleotid mellan två individer.

Viktiga variationer i enskilda genom är enkla nukleotidpolymorfier eller SNP, vilka har observerats i både kodande och icke kodande regioner av genom. SNPs är i grunden förändring i enstaka bas, dvs A, C, G eller T som leder till DNA-variationer som leder till att olika bokstäver finns vid sådana positioner. Typ av nukleotid eller bas närvarande vid en given plats på en kromosom kan variera med olika människor.

Det sägs att - 90% av sekvensvariationen hos människor beror på närvaro av SNP. Således tillhandahåller SNP: er en molekylär markör som är närvarande i hög densitet.

I DNA-fingerutskrift i särskilt icke-kodande delar av genom utnyttjas sådana genetiska variationer bland olika människor.

Sådana genetiska variationer är också ansvariga för svårighetsgrad av sjukdom och respons från kroppen till behandling. En enda basskillnad i Apo E-gen leder till Alzheimers sjukdom och en deletion inom CCRS (kemokinreceptorgen) är ansvarig för HW och AIDS-resistens.

SNPs används för att kartlägga gener som är involverade i mänskliga sjukdomar. Genom att använda SNP som markörer kan varje gen i humant genom kartläggas. SNPs är antingen placerade inom genen eller kan visa snäva kopplingar.

Sekvensdata lagras i databaser och analyseras för att känna till SNP: erna. DNA-chips och mikroarrays har utvecklats för identifiering av SNP. Läkare genom att använda DNA-prover av patienter kan identifiera mönstret av SNP genotypprofil. Således kan de berätta för patienternas svar på en specifik typ av medicin.

Den gren av medicin som studerar effekten av genetisk variation på sjukdomsmottagande och medicinreaktion kallas farmakogenomik.

Eftersom få SNPs skiljer sig i frekvens hos olika populationer kan SNP-analys användas för studier av populationsgenetik.

Det är intressant att notera att genomerna av mus och man mycket liknar varandra (cirka 97, 5%). Chimpans och humant genom skiljer sig endast i förhållandet 1 - 3%. Så det kan slutsatsen att det beror på delning av gemensam förfader för 100 miljoner år sedan och inte mycket förändring av genom har skett.

Från dessa små genetiska skillnader uppstår den mänskliga variationen som skillnader i ögonsyn, hårfärg, fotstorlek etc. Några av SNP: erna är kopplade till specifika humana populationer och ger information om mänskliga migreringar som ägde rum för flera år sedan och om mer avlägset evolutionärt förflutet .