Cistanche Deserticola -lihaisen varren RNA-Seq-pohjainen de Novo -transkriptomien kokoonpano ja geenien löytäminen -Ⅱ
Jul 24, 2024
Kaikkien ilmaistujen transkriptien toiminnallinen luokitus geeniontologiaan ja KEGG-tietokantoihin
Gene Ontology (GO) -merkintä saatiin UniProt-merkintä- ja identiteettiassosiaatiotiedostosta. Yhteensä 20 907 transkriptiota, jotka edustavat 32,69 % kaikista ilmennetyistä sekvensseistä, osoitettiin 1 745 toiminnalliseen termiin. Kaikista toiminnallisista GO-termeistä suurimman osan (1 116, 63,95 %) muodostivat tehtävät biologiseen prosessiin, jota seurasivat solukomponentti (329, 18,85 %) ja molekyylifunktio (300, 17,20 %). Ilmoitettujen transkriptien osoitetut toiminnot kattoivat laajan valikoiman GO-luokkia, ja 10 suosituinta GO-termiä, joissa on eniten huomautuksia sisältävä transkriptio, on lueteltu taulukossa 3. Tarjoamme kaikki ilmaistut transkriptit jakaantuman kolmeen geeniontologialuokkaan (molekyylifunktio, solukomponentti ja biologinen prosessi) lisätiedostossa (S3 Dataset). Sitoutumistoimintoihin ja transferaasiaktiivisuuteen liittyvät GO-termit edustettiin pääasiassa molekyylifunktiokategoriassa. Mitä tulee sitoutumistoimintoihin, kationien sitoutuminen (4 394 transkriptia) edusti runsainta, jota seurasi nukleotidi/nukleosidisitoutuminen (keskimäärin 3 404 transkriptia) ja proteiinisitoutuminen (2 422 transkriptia). Transferaasiaktiivisuusryhmässä eniten on niitä, joilla on siirtäviä fosforia sisältäviä ryhmiä (2 256 transkriptiota, 65,77 %). Solukomponenttikategoriassa transkriptit sijaitsivat enemmän solun sisällä (keskimäärin 10 581 transkriptia), kun taas biologisten prosessien luokassa transkriptit osallistuivat enemmän biopolymeerin aineenvaihduntaprosessiin (keskimäärin 6 683 transkriptia), jota seurasi soluprosessin säätely (4 841 transkriptiota). ), geeniekspressiota (4 678 transkriptia) ja kuljetusta (3 512 transkriptia).

LUONNOLLINEN CISTANCHE TUBULOSA ALZHEIMERIN TAUDIN ESTÄMISEEN PHGS75% ECH 30% ACT 12%
Ligniinin ja PhG:n biosynteesiin osallistuvien geenien louhimiseksi KEGG-tietokannasta etsittiin 21 358 ei-redundanttia potentiaalista proteiinisekvenssiä 13 kasviorganismin geenisekvenssejä vastaan ja ne kohdistettiin 275 KEGG-reitille, joissa oli vähintään 5 osumaa. Taulukossa 4 on lueteltu 10 parasta reittiä, joilla on useimmat kohdistetut sekvenssit. Useimmat reitit osallistuivat primaarisiin aineenvaihduntaprosesseihin, kuten aminohappo- tai proteiiniaineenvaihduntaan (ko01230, ko04141 ja ko04120), hiilihydraattiaineenvaihduntaan (ko01200 ja ko00500) ja nukleotidi- tai proteiiniaineenvaihduntaan. nukleosidimetabolia (ko03018, ko00230 ja ko00240). Lisäksi on olemassa 27 sekundaarista aineenvaihduntaan liittyvää reittiä (kuva 2), kuten terpenoidirungon biosynteesi, fenyylipropanoidien biosynteesi, karotenoidibiosynteesi, isokinoliinialkaloidibiosynteesi ja tropaani-, piperidiini- ja pyridiinialkaloidibiosynteesi. Nämä tulokset antavat lisäosoituksen siitä, että aktiiviset aineenvaihduntaprosessit olivat käynnissäC. deserticolavarren kudos. Kaikki KEGG-reitteihin liittyvät ekspressoidut transkriptit lueteltiin lisätiedostossa (S4 Dataset). Vaikka C. deserticolan ja muiden kasvien, kuten riisin (S5 Dataset) välillä on joitain merkittävästi muuttuneita reittejä, päätavoitteemme tässä tutkimuksessa on paljastaa C. deserticolan varren koko transkriptioprofiili ja kuvata siihen liittyvät PhG:iden biosynteesin reitit. joista voi olla hyötyä viljelyn ohjaamisessa.

Ehdokasgeenit, jotka koodaavat entsyymejä, jotka osallistuvat ligniinin biosynteesiin
Ligniini on kasvikunnan toiseksi runsain luonnollinen maanpäällinen polymeeri, joka muodostaa jopa kolmanneksen kasvien soluseinien materiaalista. Tärkeänä soluseinien komponenttina ligniinit auttavat veden kuljetuksessa, tarjoavat mekaanista tukea ja rakenteellista eheyttä sekä suojaavat taudinaiheuttajia ja kasvinsyöjiä vastaan. Nämä ligniinin roolit ovat erittäin arvokkaita tukemaan C. deserticolan maanalaista erektiokasvua autiomaassa. Tässä tutkimuksessa esitimme täydellisen kuvan ligniinin biosynteesireiteistä C. deserticolassa (kuva 3), jossa ligniinimonomeerit biosyntetisoidaan fenyylialaniinista useiden entsymaattisten reaktioiden kautta, mukaan lukien hydroksylaatio, metylaatio, pelkistys ja oksidatiivinen polymerointiprosessi. Ligniinin biosynteesiin liittyviä entsyymejä havaittiin kolmelle pääosin syntetisoidulle verisuonikudoksessa olevalle muodolle (p-hydroksyylifenyyli (H), guajasyyli (G) ja syringyyli (S) ligniini) ja 5-hydroksyyliguajasyyliligniini, joka vain tunnistettiin COMT (kofeiinihappo 3-O-metyylitransferaasi, EC 2.1.1.68) puutteellisissa (kuten knock-down) kasveissa.

Fenyylialaniiniammoniumlyaasi (PAL, EC 4.3.1.24) on ensimmäinen avainentsyymi ligniinin biosynteesireitissä (kuva 3), joka muuttaa fenyylialaniinin kanelihapoksi ei-hapettavalla deaminaatiolla. Yhteensä 6 297 PAL-lukemaa sekvensoitiin ja 7 PAL-transkriptia koottiin C. deserticolaan (taulukko 5). Sekvenssien samankaltaisuuksien vertailulla havaitsimme, että niistä neljällä (comp28550_c1_seq1/2/3/5) oli yli 95 % samankaltaisuus C. deserticolan (gi|) tunnetun mRNA-sekvenssin kanssa. 289595227|gb|ADD12041.1|), kun taas comp3}c1_seq4 ja comp25940_c0_seq1 olivat 77 % yhtäläisyyksiä ja 82 %. ORF-ennuste paljasti, että viidellä transkriptilla oli potentiaalia koodaavia proteiineja ja niissä oli aromaattinen aminohappolyaasidomeeni (PF00221.14). Niistä vain comp1}c1_seq4-transkripti pystyi koodaamaan täydellisen 718 aminohappotähteen proteiinisekvenssin. On raportoitu, että pieni monigeeniperhe koodaa PAL:ta useimmissa kasvilajeissa, kuten 4 Arabidopsis thalianassa, 5 Populus trichocarpassa, 3 Scutellaria baicalensisissä ja 7 Cucumis sativusissa jne. Fylogeneettinen analyysimme viittasi siihen, että niitä oli 4 PAL:ta koodaavat geenit C.


deserticola ja annoimme niille nimet CdPAL1, CdPAL2, CdPAL3 ja CdPAL4, vastaavasti (S2 kuva). 4-kumaraatti-CoA-ligaasi (4CL, EC 6.2.1.12) ja trans-sinnamaatti-4-mono-oksigenaasi (CYP73A, EC 1.14.13.11) ovat kaksi entsyymiä, jotka vastaavat kanelihapon muuttamisesta dikumaroli-CoA:ksi kahdessa käänteismuodossa. tilauksia. Ne ovat myös rungoissa, ja niiden ilmentymisen FPKM-arvot ovat 39,57 ja 51,93, vastaavasti.

Neljä ligniinityyppiä biosyntetisoitiin eri reiteillä, joita kontrolloi kolme avainentsyymiä, cinnamoyyli-CoA-reduktaasi (CCR, EC 1.2.1.44), shikimaatti-o-hydroksisinnamoyylitransferaasi (HCT, EC 2.3.1.133) ja ferulaatti{{1 {56}}}}hydroksylaasi (F5H, EC 1,14.-.-). CCR raportoitiin ligniinireitin [50, 51] kontrollipisteeksi, joka katalysoi X-CoA:n (X mukaan lukien dikumaroli, kofeoyyli, feruloyyli, 5-hydroksyyliferuloyyli ja sinapoyyli) Y-aldehydiksi (Y mukaan lukien p -puuma, kofeoyyli, koniferyyli, 5-hydroksyylikoniferyyli ja snap), kun taas HCT katalysoi p-kumaroyyli-CoA p-kumaroyylishikimiinihapoksi/p-kumaroyylikiniinihapoksi. Nämä kaksi entsyymiä, aivan kuten kytkin, säätelivät P-hydroksyylifenyyliligniinien tai kolmen muun ligniinityypin biosynteesiä. F5H oli toinen haarakytkin, joka sääteli syringyyliligniiniä ja 5-hydroksyyliguajasyyliligniiniä. Muita tärkeitä entsyymejä, mukaan lukien kofeiinihappo-3-O-metyylitransferaasi (COMT, EC 2.1.1.68), kofeoyyli-CoA O-metyylitransferaasi (CCoAOMT, EC 2.1.1.104) ja cinnamyylialkoholidehydrogenaasi (CAD, EC 1.1.1.1.1. ) havaittiin myös ilmaistuna. Yksityiskohtaiset ilmentymistiedot on lueteltu taulukossa 6. Nämä tässä tutkimuksessa tunnistetut entsyymigeenit tarjoavat arvokkaan resurssin tämän tärkeän lääkekasvin toiminnallisiin genomitutkimuksiin. 10 geeniä, jotka liittyvät taulukossa 6 olevaan ligniinien biosynteesireittiin, valittiin RT-qPCR-todennukseen RNAseq-tulostemme vahvistamiseksi (kuva 4), ja niiden korkeat korrelaatiot (Pearson-korrelaatiokerroin: 0,90343) osoittivat transkriptioanalyysimme korkean tarkkuuden ja toistettavuuden. S1 Dataset luettelee tässä analyysissä käytetyt alukesekvenssit.

LUONNOLLINEN CISTANCHE TUBULOSA SEKSUAALISTEN TOIMINTOJEN PARANTAMISEEN PHGS75% ECH 30% ACT 12%
Ehdokasgeenit, jotka koodaavat entsyymejä, jotka osallistuvat PhG:iden biosynteesiin
Fenyylietanoidiglykosidien (PhG:t) tiedetään olevan C. deserticolan pääasiallisia aktiivisia ainesosia, joilla on seksuaalista tehokkuutta parantavia, vapaita radikaaleja poistavia ja ikääntymistä estäviä vaikutuksia. PhG:iden kolme kemiallista komponenttia ovat orgaaninen happo, sakkaridi ja fenyylietanoli-aglykoni (kuva 3). Orgaaniset hapot, mukaan lukien kofeiinihappo, ferulihappo ja kumaalihappo, ovat fenyylipropanoidin biosynteesireitin tuotteita. Sakkaridin komponentit mukaan lukien glukoosi ja ramnoosi ovat hiilihydraattiaineenvaihduntareittien tuotteita, kuten tärkkelys- ja sakkaroosiaineenvaihduntaa, aminosokeri- ja nukleotidisokeriaineenvaihduntaa, fruktoosi- ja mannoosiaineenvaihduntaa jne. Fenyylietanoliosan biosynteesireitti ei kuitenkaan ole vielä selvillä. Tässä ehdotimme kahta mahdollista fenyylietanolin biosynteesireittiä sekvenssitietojemme perusteella. Yksi on raportoitu kofeiinihappo- tai ferulihapporeitti, joka tunnetaan myös kanelihapporeittinä, joka on samanlainen kuin ligniinin biosynteesin runkoreitti. Toinen perustuu fenyylialaniinin aineenvaihduntareittiin (kuva 3), jossa fenyylialaniini fenyylietanoliksi saavutettiin tunnetulla "Enrlich-reitillä", joka löydettiin ensimmäisen kerran hiivasta sata vuotta sitten ja validoitiin petunian kukissa, tomaateissa ja ruusuissa. C. deserticolan varressa havaittiin neljä entsyymigeeniä, jotka koodaavat aspartaatti/tyrosiiniaminotransferaasia, histidiinifosfaattiaminotransferaasia ja primääristä amiinioksidaasia, jotka vastaavat fenyylialaniinin muuntamisesta fenyylietanoliksi. Fenyylietanolin tuote voidaan edelleen hapettaa mono-oksygenaasin vaikutuksesta tai metyloida metyylitransferaasin vaikutuksesta johdannaisiksi (fenyylietanoli-aglykoni), jotka osallistuvat PhG-biosynteesiin. Yhteenvetona ehdotettiin kahta oletettua fenyylietanoli-aglykonin biosynteesireittiäC. deserticolamutta vaatii vielä lisää opiskelua.
Keskustelut
Kasvien genomiikka on viime vuosina kehittynyt nopeasti seuraavan sukupolven sekvensointiteknologian avulla, kun taas vähän tutkimuksia on keskittynyt aavikon lääkekasvien genomiikkaan. On kiireellisesti tarpeen suorittaa genomi- tai transkriptiotutkimusta ymmärtääkseen sen sopeutumista kuivuuteen ja suolapitoisuuteen ja tärkeimpien bioaktiivisten komponenttien biosynteesireittiä. Joidenkin lääkekasvien de novo -transkriptilöytö,


kuten Panax ginseng, Ginkgo biloba ja Glycyrrhiza uralensis on ensin hyödynnetty käyttämällä Roche 454 -alustaa sen pitkän lukupituuden vuoksi. Tehokkaan kokoamiskyvyn lyhyillä lukemilla, erityisesti edullisilla parillisen pään lukemilla, ansiosta Illumina-pohjaista transkriptiosekvenssiä ja kokoonpanoa on käytetty laajasti myös malli- ja ei-malliorganismeissa. Tässä tutkimuksessa loimme noin 8 G 101 emäsparin parillisen pään lukuja ja tuotimme pidempiä unigeenisekvenssejä, joiden keskipituus oli 725 bp. Laajamittainen kantakohtaiset transkriptiotiedot voisivat tarjota hyödyllistä vertailutietoa ja niitä voidaan käyttää C. deserticolan bioaktiivisten komponenttien sekundaarisen metabolian louhimiseen. 81,62 % kaikista raakalukemista läpäisi tiukat laatusuodattimet (mukaan lukien sovittimen trimmaus ja heikkolaatuisten lukujen hylkääminen) ennen kokoonpanoa, mikä viittaa sekvensointitietojemme korkeaan laatuun, ja 82,08 % korkealaatuisista lukemista oli hyödyllisiä kokoonpanossa. Muut lukemat, joita ei voitu käyttää kokoonpanoon, voivat johtua sekvensointivirheistä, kokoonpanoparametreista ym. Nämä käyttämättömät korkealaatuiset lukemat auttoivat parantamaan de novo -kokoonpanoa yhdessä pidempien lukujen kanssa toisesta alustasta (kuten Roche 454) tulevaisuudessa.

LUONNOLLINEN CISTANCHE TUBULOSA SEKSUAALISTEN TOIMINTOJEN PARANTAMISEEN PHGS75% ECH 30% ACT 12%
Suuri määrä koottuja transkriptejä (30 098) osoitti suuria sekvenssien samankaltaisuuksia julkisissa tietokannoissa olevien tunnettujen geenien kanssa, mikä viittaa siihen, että Illumina-pohjaiset paripäiset tietomme kattoivat huomattavan osan C. deserticolan transkripteistä. Transkriptit, joissa ei ole BLAST-osumia, voivat johtua transloimattomista 3'- tai 5'-alueista, ei-koodaavasta RNA:sta tai C. deserticolan uusista geenisekvensseistä. Ilmennetyt transkriptit merkittiin useisiin GO-kategorioihin ja KEGG-reitteihin (taulukot 3 ja 4), joissa monet transkriptit määritettiin toissijaisiin aineenvaihduntaan liittyviin reitteihin. Kuten tiedämme, fenyylipropanoidi voi toimia indusoituvana antimikrobisena yhdisteenä, joka on erittäin hyödyllinen maanalaiselle elämäntyylille [1], ja se voi toimia myös signaalimolekyylinä kasvien ja mikrobien vuorovaikutuksessa sen lääketieteellisen hyödyn lisäksi [68, 69]. Terpenoidia käytetään bioaktiivisten komponenttien (kuten 6- deoksikatalpolin) biosynteesiin [70]. Löysimme, että geenit, jotka osallistuivat fenyylipropanoidin ja terpenoidin rungon biosynteesireittiin, olivat erittäin runsaasti C. deserticolassa. Vielä tärkeämpää on, että hyvin edustettuina olevien ligniinin biosynteesin reittien löytäminen (kuva 3) osoitti ligniinin aktiivisen metabolisen prosessin C. deserticolan varressa. Kaikki tunnetut ligniinin biosynteesiin osallistuvat entsyymigeenit (kuva 3) havaittiin ekspressoituneena, ja neljällä avainentsyymillä, mukaan lukien PAL, CCR, HCT ja F5H, oli pienempi ilmentymisen runsaus (FPKM 26,47, 3,89, 3,4 ja 3,83, vastaavasti) verrattuna muut entsyymigeenit (taulukko 6). Se, voisiko näiden kolmen geenin ilmentymismuutos vaikuttaa ligniinin tuotantoon C. deserticolassa, on lisätutkimuksen arvoinen. PAL on avainentsyymi ligniinin biosynteesissä ja osallistuu myös fenyylipropanoidin, resveratrolin, flavonoidin ja kumariinin biosynteesiin [71–74]. Havaitsimme neljä erillistä PAL-geeniä C. deserticolan genomista (S2 kuva), joka oli sama kuin pieni monigeeniperhe [39, 43, 45–49] koodaaman PAL:n kanssa ja osoitimme lisäksi, että sillä voi olla tärkeä rooli metabolisessa hiilivirrassa. .
PhG on C. deserticolan pääasiallinen aktiivinen ainesosa. Fenyylietanolin biosynteesiin osallistuvat geenit ovat tärkeitä C. deserticolan laadulle. Päätimme kaksi erilaista fenyylietanolin ja 17 entsyymigeenin biosynteesireittiä, jotka osallistuvat PhG-biosynteesiin C. deserticolan varressa. Mahdolliset kahvin jälkeiset/ferulihappoprosessit (kuva 3) pääteltiin myös ensimmäistä kertaa perustuen välituotteiden ja vastaavien entsyymien katalyyttisten ominaisuuksien rakennekaavaan, jossa kahvi/ferulihappo hapettaisiin ensin fenyylipyruvaattijohdannaiseksi; sitten dekarboksylaasit menettivät karboksyyliryhmän; lopuksi aldehydiryhmä muutettiin takaisin alkoholiryhmäksi dehydrogenaasin vaikutuksesta. Tämä on ensimmäinen Illumina-paripään sekvensointiteknologian sovellus C. deserticolan koko transkription tutkimiseen ja RNA-seq-lukemien kokoamiseen ilman referenssigenomia. Tämä tutkimus tarjoaa hyödyllisiä resursseja ja geenisekvenssejä C. deserticolan toiminnalliseen genomiikan ja proteomiikan tutkimukseen tulevaisuudessa.
Johtopäätökset
Tässä tutkimuksessa profiloimme C. deserticolan varren transkription korkean suorituskyvyn sekvensointitietojen perusteella, tunnistimme geenit, jotka osallistuvat ligniinin biosynteesireitteihin, ja päätimme myös ensimmäistä kertaa PhG:iden mahdollisen biosynteesireitin, mikä varmasti nopeuttaa ymmärtämistä. epäselvistä fysiologisista prosesseista ja suuresta lääketieteellisestä arvosta molekyylitasolla. Tähän mennessä tämä on ensimmäinen yritys koota de novo koko C. deserticolan varren transkriptio ja havaita lääkekomponenttien biosynteesipolku Illumina-pohjaisten sekvensointitietosarjojen avulla. Tutkimuksemme voi edistää luonnonlääkkeiden kehittämistä ja lääketieteellisten ominaisuuksien lajikkeiden valintaa.

LUONNOLLINEN CISTANCHE TUBULOSA SEKSUAALISTEN TOIMINTOJEN PARANTAMISEEN PHGS75% ECH 30% ACT 12%







