Genomics: strukturella och funktionella studier av genomforskning

Genomics: Structural and Functional Studies of Genomics!

Termen genom infördes av H. Winkler (1920) för att beteckna den kompletta uppsättningen kromosomala och extra kromosomala gener närvarande i en organism, innefattande ett virus.

Termen genomics coined av TH Roderick (1987) betyder mappning och sekvensering för att analysera strukturen och organisationen av genomerna. Men för närvarande genomik innefattar sekvensering av genomer, bestämning av den fullständiga uppsättningen proteiner som kodas av en organism, och genernas funktion och metaboliska vägar i en organism.

Studien av genomik är indelad i följande två domäner:

1. Strukturell genomik behandlar bestämningen av den fullständiga sekvensen av genomerna eller den fullständiga uppsättningen proteiner som produceras av en organism. De olika stegen som berörs är: (i) konstruktion av genetiska och fysiska kartor med hög upplösning, (ii) sekvensering av genomet, och (iii) bestämning av den fullständiga uppsättningen proteiner i en organism. Det innefattar också bestämning av de tredimensionella strukturerna hos de berörda proteinerna.

2. Funktionell genomik studerar genernas funktion och metaboliska vägar, dvs genuttrycksmönstren i organismer.

Sekvensering av genomer:

Sekvensering av genomer är en mycket sofistikerad och tekniskt krävande process. Vid en gång kan ett fragment på 500-600 bp sekvenseras. Däremot är genomerna extremt stora, t ex 4, 2 x 10 6 för E. coli och 3, 2 x 10 9 bp för människor. Därför måste sekvensen av genoxen erhållas i ett extremt stort antal små bitar, dessa bitar monteras sedan i en sekvens för genomet.

De bitar som används för sekvensering alstras genom att bryta genomiskt DNA i fragment på slumpmässiga punkter. Som ett resultat måste fragmentets placering i genomet bestämmas experimentellt. Alla fragment som erhållits från genomiskt DNA från en organism klonas i en lämplig vektor, vilket alstrar ett genomiskt bibliotek av organismen. De två metoderna för sekvensering av genomer är: (a) klon-för-klonsekvensering och (b) skottpistol-sekvensering.

(a) Clon-by-klonsekvensering:

I denna metod är fragmenten först inriktade i kontigrar som också kallas som riktad sekvensering av BAC-contiggar. En contig består av en serie kloner som innehåller överlappande bitar av DNA som omvandlar en specifik region av en kromosom eller till och med hela kromosomen. De är vanligtvis konstruerade med hjälp av BAC (bakteriell artificiell kromosom) och kosmidkloner.

Det allmänna tillvägagångssättet vid skapandet av contigs är att identifiera klonerna som har intilliggande DNA-segment från kromosomen, t ex kromosomvandring, kromosomhoppning etc. Således måste medlemmarna av en contig innehålla samma överlappande region för att tillåta exakt bestämning av deras plats i kontingenten Det ultimata målet med fysiska kartläggningsförfaranden är att erhålla en komplett contig för varje kromosom av genomet.

De klonade DNA-fragmenten av en contig kan korreleras med platser längs en kromosom erhållen från bindning eller cytogenetisk kartläggning. Detta kan uppnås genom att identifiera medlemmar av contig som innehåller insatser som har sådana gener som redan har kartlagts genom koppling eller cytologiska metoder. Detta skulle möjliggöra inriktning av de andra medlemmarna av konturen längs kromosomen. Alternativt kan RFLP (restriktionsfragmentlängdspolymorfism) och andra DNA-markörer användas för att korrelera positionerna i en kopplingskarta med medlemmarna i en contig.

(b) Shot-Gun Sequencing:

I detta tillvägagångssätt sekvenseras slumpmässigt utvalda kloner tills alla kloner i det genomiska biblioteket analyseras. Assembler-mjukvaran organiserar nukleotidsekvensinformationen så erhållen i en genomsekvens. Denna strategi fungerar mycket bra med prokaryota genomer som har lite repetitivt DNA. Men eukaryota genomer har många upprepade sekvenser som skapar förvirring i ordningen av sekvensen. Dessa problem löses genom att använda enorma databehandlingskrav, specialiserad programvara och undvika sådana regioner som är rika på repetitivt DNA (t.ex. centromeriska och telomeriska regioner).

Genom Sequence Compilation:

Genomsekvenseringsprojekt krävde utvecklingen av högeffektiva teknologier som genererar data med en mycket snabb takt. Detta krävde användningen av datorer för att hantera denna översvämning av information och har fött en ny disciplin kallad bioinformatik. Bioinformatik behandlar lagring, analys, tolkning och utnyttjande av informationen om biologiska system (aktiviteter som sammanställning av genometsekvenser, identifiering av gener, tilldelning av funktioner till identifierade gener, förberedelse av databaser, etc.).

För att säkerställa att nukleotidsekvensen för ett genom är fullständigt och felfri sekvenseras genomet mer än en gång. När genen av en organism är sekvenserad, sammanställd och korrekturläsad (korrigering av fel) börjar nästa etik genom att säga, annotering.

Genförutsägelse och räkning:

Efter att en genomsekvens har erhållits och kontrollerats för noggrannhet, är nästa uppgift att hitta alla gener som kodar proteiner. Detta är det första steget i annoteringen. Anmärkning är en process som identifierar gener, deras reglerande sekvenser och deras funktion (er). Det identifierar även icke-proteinkodande gener inklusive de som kodar för r-RNA, t-RNA och små kärn-RNA. Dessutom identifieras och karaktäriseras mobila genetiska element och repetitiva sekvensfamiljer.

Att lokalisera proteinkodande gener genomförs genom att inspektera sekvensen med hjälp av en datorsoftware eller genom ögat. Proteinkodande gener identifieras genom öppna läsramar (ORF). En ORF har en serie en kodon som specificerar en aminosyrasekvens, den börjar med ett initieringskodon (vanligtvis ATG) och slutar med ett termineringskodon (TAA) TAG eller TGA). ORFs identifieras vanligtvis av en dator och är en effektiv metod för bakteriegener.

Gener i eukaryota genomer (inklusive det mänskliga genomet) har flera funktioner som gör direktsökning mindre användbar. För det första har de flesta eukaryota gener ett mönster av exoner (kodande regioner) alternerade med introner (icke kodande regioner). Som ett resultat är dessa gener inte organiserade som kontinuerliga ORF. För det andra är gener i människor och andra eukaryoter ofta ofta åtskilda, vilket ökar chanserna att hitta falska gener. Men nyare versioner av ORF-skanningsprogram för eukaryota genom gör skanning effektivare.

Efter en genomisk sekvens analyseras och gener förutses, analyseras varje gen en för sig för identifiering av den kodade genproduktens funktion och klassificeras i funktionella grupper. Denna analys innefattar flera program. Till exempel kan man söka databaser som Gene Bank, för att hitta liknande gener isolerade från andra organismer. De förutsagda ORF: erna kan jämföras med de från kända, väl karakteriserade bakteriegener. Slutligen kan man leta efter sådana nukleotidsekvenser för funktionsmotiv som kodar för proteindomäner som är involverade i specifika funktioner.

Sålunda är genomalysens mål att bestämma alla genens funktioner och förstå hur dessa gener interagerar med organismens utveckling och funktion.

Funktionell genomik:

Det kan definieras som bestämning av funktionen av alla genprodukter kodade av genomet av en organism. Den innehåller följande parametrar: (1) när och var specifika gener uttrycks (expressionsprofilering), (ii) funktionerna hos specifika gener genom att selektivt mutera de önskade generna, och (iii) de interaktioner som äger rum mellan proteiner och mellan protein och andra molekyler. Funktionell genomik försöker undersöka alla gener som finns närvarande i genomet på en gång. Därför möjliggör de tekniker som används i funktionell genomik analys av hög genomströmning som möjliggör en mycket snabb dataackumulering.

(i) Expressionsprofilering:

Bestämning av celltyperna / vävnaderna i vilka en gen uttrycks liksom när genen uttrycks kallas expressionsprofilering. Syftet med funktionell genomik är att studera expressionsmönstret av alla gener som finns närvarande i genomet samtidigt; Detta kallas globalt uttrycksprofilering. Detta kan göras antingen på RNA-nivå eller på proteinnivå. På RNA-nivån kan man antingen använda direktsekvensprovtagning eller DNA-arrays.

På proteinnivån kan man använda antingen tvådimensionell elektrofores följt av masspektrometri eller proteinarrayer. Global expression profiling ger insikter i komplexa biologiska fenomen, inklusive differentiering, respons på stress, sjukdomsutbrott etc. Det ger också en ny väg att definiera cellulära fenotyper.

(ii) Genfunktionsbestämning:

En viktig aspekt av funktionell genomik är att bestämma funktionen av specifika gener / anonyma sekvenser. Ett effektivt sätt är att uppnå detta är att klona genen, mutera den in vitro och återinföra den muterade genen i värdorganismen och analysera dess effekt. Genomet under mutantbibliotek har utvecklats i flera modellorganismer som bakterier, jäst, växter och däggdjur. Detta kallas ibland som mutations genomik. Ett sådant bibliotek kan genereras på ett av följande tre sätt:

(a) Systematisk mutation av varje enskild gen en i tid som kommer att generera en bank med specifika mutantstammar.

(b) I slumpmässigt tillvägagångssätt, genereras muterade oskiljaktigt individuella mutationer karakteriseras och katalogiseras därefter.

c) I denna metod används en grupp tekniker för att förhindra uttryck av specifika / grupper av gener.

(iii) Proteininteraktioner:

Gene-funktionen speglar beteendet hos proteiner som kodas av dem. Detta beteende kan ses som en serie interaktioner mellan olika proteiner och mellan proteiner och andra molekyler. Proteininteraktioner studeras med användning av hög genomströmningsteknik. Ett antal biblioteksbaserade proteininteraktionsmappningsmetoder tillåter att hundratals eller tusentals proteiner screenas i taget. Dessa interaktioner kan analyseras in vitro eller in vivo. Proteininteraktionsdata från olika källor assimileras i databaser.