304 స్టెయిన్‌లెస్ స్టీల్ వెల్డెడ్ కాయిల్డ్ ట్యూబ్ / ట్యూబింగ్ జెమికల్ జోంపోనెంట్, బయోసింథటిక్ పొటెన్షియల్ ఆఫ్ ది గ్లోబల్ మెరైన్ మైక్రోబయోమ్

Nature.comని సందర్శించినందుకు ధన్యవాదాలు.మీరు పరిమిత CSS మద్దతుతో బ్రౌజర్ సంస్కరణను ఉపయోగిస్తున్నారు.ఉత్తమ అనుభవం కోసం, మీరు నవీకరించబడిన బ్రౌజర్‌ను ఉపయోగించాల్సిందిగా మేము సిఫార్సు చేస్తున్నాము (లేదా Internet Explorerలో అనుకూలత మోడ్‌ని నిలిపివేయండి).అదనంగా, కొనసాగుతున్న మద్దతును నిర్ధారించడానికి, మేము స్టైల్స్ మరియు జావాస్క్రిప్ట్ లేకుండా సైట్‌ని చూపుతాము.
స్లైడర్‌లు ఒక్కో స్లయిడ్‌కు మూడు కథనాలను చూపుతున్నాయి.స్లయిడ్‌ల ద్వారా తరలించడానికి వెనుక మరియు తదుపరి బటన్‌లను ఉపయోగించండి లేదా ప్రతి స్లయిడ్ ద్వారా తరలించడానికి చివర ఉన్న స్లయిడ్ కంట్రోలర్ బటన్‌లను ఉపయోగించండి.

వివరణాత్మక ఉత్పత్తి వివరణ

304 స్టెయిన్లెస్ స్టీల్ వెల్డెడ్ కాయిల్డ్ ట్యూబ్ / ట్యూబింగ్
1. స్పెసిఫికేషన్: స్టెయిన్‌లెస్ స్టీల్ కాయిల్ ట్యూబ్ / ట్యూబింగ్
2. రకం: వెల్డింగ్ లేదా అతుకులు
3. ప్రమాణం: ASTM A269, ASTM A249
4. స్టెయిన్‌లెస్ స్టీల్ కాయిల్ ట్యూబ్ OD: 6mm నుండి 25.4MM
5. పొడవు: 600-3500MM లేదా కస్టమర్ యొక్క అవసరం ప్రకారం.
6. గోడ మందం: 0.2mm నుండి 2.0mm.

7. సహనం: OD: +/-0.01mm;మందం: +/-0.01%.

8. కాయిల్ లోపలి రంధ్రం పరిమాణం: 500MM-1500MM (కస్టమర్ అవసరాలకు అనుగుణంగా సర్దుబాటు చేయవచ్చు)

9. కాయిల్ ఎత్తు: 200MM-400MM (కస్టమర్ అవసరాలకు అనుగుణంగా సర్దుబాటు చేయవచ్చు)

10. ఉపరితలం: బ్రైట్ లేదా ఎనియల్డ్
11. మెటీరియల్: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, మిశ్రమం 625, 825, 2205, 2507, మొదలైనవి.
12. ప్యాకింగ్: చెక్క కేస్, చెక్క ప్యాలెట్, చెక్క షాఫ్ట్ లేదా కస్టమర్ యొక్క అవసరానికి అనుగుణంగా నేసిన సంచులు
13. పరీక్ష : రసాయన భాగం, దిగుబడి బలం, తన్యత బలం, కాఠిన్యం కొలత
14. హామీ: మూడవ పక్షం (ఉదాహరణకు :SGS TV ) తనిఖీ, మొదలైనవి.
15. అప్లికేషన్: డెకరేషన్, ఫర్నీచర్, ఆయిల్ ట్రాన్స్‌పోర్టేషన్, హీట్ ఎక్స్ఛేంజర్, రైలింగ్ మేకింగ్, పేపర్ మేకింగ్, ఆటోమొబైల్, ఫుడ్ ప్రాసెసింగ్, మెడికల్ మొదలైనవి.

స్టెయిన్‌లెస్ స్టీల్ కోసం అన్ని రసాయన కూర్పు మరియు భౌతిక లక్షణాలు క్రింది విధంగా ఉన్నాయి:

మెటీరియల్ ASTM A269 కెమికల్ కంపోజిషన్ % గరిష్టం
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 డి 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

మెటీరియల్ వేడి చికిత్స ఉష్ణోగ్రత F (C) కనిష్ట. కాఠిన్యం
బ్రినెల్ రాక్వెల్
TP304 పరిష్కారం 1900 (1040) 192HBW/200HV 90HRB
TP304L పరిష్కారం 1900 (1040) 192HBW/200HV 90HRB
TP316 పరిష్కారం 1900(1040) 192HBW/200HV 90HRB
TP316L పరిష్కారం 1900(1040) 192HBW/200HV 90HRB
TP321 పరిష్కారం 1900(1040) ఎఫ్ 192HBW/200HV 90HRB
TP347 పరిష్కారం 1900(1040) 192HBW/200HV 90HRB

 

OD, అంగుళం OD టాలరెన్స్ అంగుళం(మిమీ) WT టాలరెన్స్ % పొడవు సహనం అంగుళం(మిమీ)
+ -
≤ 1/2 ± 0.005 (0.13) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~1 1 / 2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

సహజ సూక్ష్మజీవుల సంఘాలు ఫైలోజెనెటిక్‌గా మరియు జీవక్రియపరంగా విభిన్నంగా ఉంటాయి.జీవుల యొక్క అవగాహన లేని సమూహాలతో పాటు, ఈ వైవిధ్యం పర్యావరణపరంగా మరియు జీవసాంకేతికంగా ముఖ్యమైన ఎంజైమ్‌లు మరియు జీవరసాయన సమ్మేళనాలు2,3 యొక్క ఆవిష్కరణకు గొప్ప సామర్థ్యాన్ని కలిగి ఉంది.అయినప్పటికీ, అటువంటి సమ్మేళనాలను సంశ్లేషణ చేసే జన్యు మార్గాలను గుర్తించడానికి మరియు వాటి సంబంధిత హోస్ట్‌లకు వాటిని బంధించడానికి ఈ వైవిధ్యాన్ని అధ్యయనం చేయడం ఒక సవాలుగా మిగిలిపోయింది.ప్రపంచ స్థాయిలో మొత్తం జీనోమ్ రిజల్యూషన్ డేటా యొక్క విశ్లేషణలో పరిమితుల కారణంగా బహిరంగ సముద్రంలో సూక్ష్మజీవుల యొక్క బయోసింథటిక్ సంభావ్యత ఎక్కువగా తెలియదు.ఇక్కడ, 10,000 కంటే ఎక్కువ సముద్రపు నీటి నమూనాల నుండి కొత్తగా పునర్నిర్మించిన 25,000 కంటే ఎక్కువ డ్రాఫ్ట్ జన్యువులతో కల్చర్డ్ కణాలు మరియు ఒకే కణాల నుండి సుమారు 10,000 సూక్ష్మజీవుల జన్యువులను ఏకీకృతం చేయడం ద్వారా సముద్రంలో బయోసింథటిక్ జన్యు సమూహాల యొక్క వైవిధ్యం మరియు వైవిధ్యాన్ని మేము అన్వేషిస్తాము.ఈ ప్రయత్నాలు దాదాపు 40,000 పుటేటివ్ ఎక్కువగా కొత్త బయోసింథటిక్ జన్యు సమూహాలను గుర్తించాయి, వీటిలో కొన్ని గతంలో అనుమానించని ఫైలోజెనెటిక్ సమూహాలలో కనుగొనబడ్డాయి.ఈ జనాభాలో, మేము బయోసింథటిక్ జన్యు సమూహాలలో (“కాండిడాటస్ యూడోర్మైక్రోబియాసి”) సమృద్ధిగా ఉన్న వంశాన్ని గుర్తించాము, అది సాగు చేయని బ్యాక్టీరియా ఫైలమ్‌కు చెందినది మరియు ఈ వాతావరణంలో కొన్ని బయోసింథటిక్‌గా విభిన్నమైన సూక్ష్మజీవులను చేర్చింది.వీటిలో, మేము ఫాస్ఫేటేస్-పెప్టైడ్ మరియు పైటోనామైడ్ మార్గాలను వర్గీకరించాము, అసాధారణ బయోయాక్టివ్ సమ్మేళనం నిర్మాణం మరియు ఎంజైమాలజీ యొక్క ఉదాహరణలను వరుసగా గుర్తించాము.ముగింపులో, ఈ అధ్యయనం మైక్రోబయోమ్-ఆధారిత వ్యూహాలు సరిగా అర్థం చేసుకోని మైక్రోబయోటా మరియు వాతావరణంలో గతంలో వివరించని ఎంజైమ్‌లు మరియు సహజ ఆహారాల అన్వేషణను ఎలా ప్రారంభించగలదో చూపిస్తుంది.
సూక్ష్మజీవులు గ్లోబల్ బయోజెకెమికల్ సైకిల్స్‌ను నడుపుతాయి, ఆహార చక్రాలను నిర్వహిస్తాయి మరియు మొక్కలు మరియు జంతువులను ఆరోగ్యంగా ఉంచుతాయి5.వారి అపారమైన ఫైలోజెనెటిక్, జీవక్రియ మరియు క్రియాత్మక వైవిధ్యం సహజ ఉత్పత్తులతో సహా కొత్త టాక్సా1, ఎంజైమ్‌లు మరియు బయోకెమికల్ సమ్మేళనాల ఆవిష్కరణకు గొప్ప సామర్థ్యాన్ని సూచిస్తుంది.పర్యావరణ కమ్యూనిటీలలో, ఈ అణువులు కమ్యూనికేషన్ నుండి పోటీ 2, 7 వరకు వివిధ రకాల శారీరక మరియు పర్యావరణ విధులతో సూక్ష్మజీవులను అందిస్తాయి.వాటి అసలైన విధులకు అదనంగా, ఈ సహజ ఉత్పత్తులు మరియు వాటి జన్యుపరంగా కోడెడ్ ఉత్పత్తి మార్గాలు బయోటెక్నాలజికల్ మరియు థెరప్యూటిక్ అప్లికేషన్‌లకు ఉదాహరణలను అందిస్తాయి2,3.కల్చర్డ్ సూక్ష్మజీవుల అధ్యయనం ద్వారా అటువంటి మార్గాలు మరియు కనెక్షన్ల గుర్తింపు చాలా సులభతరం చేయబడింది.అయినప్పటికీ, సహజ పర్యావరణాల వర్గీకరణ అధ్యయనాలు సూక్ష్మజీవులలో ఎక్కువ భాగం సాగు చేయబడలేదని తేలింది.ఈ సాంస్కృతిక పక్షపాతం అనేక సూక్ష్మజీవులచే ఎన్కోడ్ చేయబడిన క్రియాత్మక వైవిధ్యాన్ని ఉపయోగించుకునే మన సామర్థ్యాన్ని పరిమితం చేస్తుంది4,9.
ఈ పరిమితులను అధిగమించడానికి, గత దశాబ్దంలో సాంకేతిక పురోగతులు పరిశోధకులను నేరుగా (అంటే, పూర్వ సంస్కృతి లేకుండా) మొత్తం సంఘాల (మెటాజెనోమిక్స్) లేదా ఒకే కణాల నుండి సూక్ష్మజీవుల DNA శకలాలను క్రమం చేయడానికి అనుమతించాయి.ఈ శకలాలను పెద్ద జన్యు శకలాలుగా సమీకరించడం మరియు బహుళ మెటాజెనోమిక్‌గా అసెంబుల్డ్ జీనోమ్‌లు (MAGలు) లేదా సింగిల్ యాంప్లిఫైడ్ జీనోమ్‌లను (SAGలు) పునర్నిర్మించగల సామర్థ్యం వరుసగా, మైక్రోబయోమ్ (అంటే, మైక్రోబియల్ కమ్యూనిటీలు మరియు మైక్రోబయోమ్) యొక్క టాక్సోసెంట్రిక్ అధ్యయనాలకు ఒక ముఖ్యమైన అవకాశాన్ని తెరుస్తుంది.కొత్త బాటలు వేస్తాయి.ఇచ్చిన వాతావరణంలో స్వంత జన్యు పదార్ధం) 10,11,12.నిజమే, ఇటీవలి అధ్యయనాలు భూమిపై సూక్ష్మజీవుల వైవిధ్యం యొక్క ఫైలోజెనెటిక్ ప్రాతినిధ్యాన్ని బాగా విస్తరించాయి మరియు గతంలో కల్చర్డ్ మైక్రోఆర్గానిజం రిఫరెన్స్ జీనోమ్ సీక్వెన్సెస్ (REFs) ద్వారా కవర్ చేయబడని వ్యక్తిగత సూక్ష్మజీవుల సంఘాలలో చాలా క్రియాత్మక వైవిధ్యాన్ని వెల్లడించాయి.హోస్ట్ జీనోమ్ (అనగా, జీనోమ్ రిజల్యూషన్) సందర్భంలో కనుగొనబడని ఫంక్షనల్ వైవిధ్యాన్ని ఉంచే సామర్థ్యం కొత్త సహజ ఉత్పత్తులను బహుశా ఎన్‌కోడ్ చేసే ఇంకా నిర్దేశించని సూక్ష్మజీవుల పంక్తులను అంచనా వేయడానికి లేదా అటువంటి సమ్మేళనాలను వాటి అసలు నిర్మాతకు తిరిగి గుర్తించడానికి కీలకం.ఉదాహరణకు, మిళిత మెటాజెనోమిక్ మరియు సింగిల్-సెల్ జెనోమిక్ అనాలిసిస్ విధానం కాండిడాటస్ ఎంటోథియోనెల్లా, మెటబాలిక్ రిచ్ స్పాంజ్-అనుబంధ బాక్టీరియా యొక్క సమూహాన్ని వివిధ రకాల డ్రగ్ పొటెన్షియల్‌ల నిర్మాతలుగా గుర్తించడానికి దారితీసింది.ఏదేమైనా, విభిన్న సూక్ష్మజీవుల సంఘాల జన్యుపరమైన అన్వేషణలో ఇటీవలి ప్రయత్నాలు ఉన్నప్పటికీ, భూమి యొక్క అతిపెద్ద సముద్ర పర్యావరణ వ్యవస్థల కోసం గ్లోబల్ మెటాజెనోమిక్ డేటాలో మూడింట రెండు వంతుల కంటే ఎక్కువ 16,20 ఇప్పటికీ లేదు.అందువల్ల, సాధారణంగా, సముద్ర సూక్ష్మజీవి యొక్క బయోసింథటిక్ సంభావ్యత మరియు నవల ఎంజైమాటిక్ మరియు సహజ ఉత్పత్తుల రిపోజిటరీగా దాని సంభావ్యత ఎక్కువగా అర్థం చేసుకోబడలేదు.
ప్రపంచ స్థాయిలో మెరైన్ మైక్రోబయోమ్‌ల బయోసింథటిక్ సంభావ్యతను అన్వేషించడానికి, ఫైలోజెనెటిక్స్ మరియు జన్యు పనితీరు యొక్క విస్తృతమైన డేటాబేస్‌ను రూపొందించడానికి మేము మొదట సంస్కృతి-ఆధారిత మరియు సంస్కృతియేతర పద్ధతులను ఉపయోగించి పొందిన సముద్ర సూక్ష్మజీవుల జన్యువులను పూల్ చేసాము.ఈ డేటాబేస్ యొక్క పరిశీలనలో అనేక రకాల బయోసింథటిక్ జన్యు సమూహాలు (BGCలు) వెల్లడయ్యాయి, వీటిలో చాలా వరకు ఇంకా నిర్దేశించబడని జన్యు క్లస్టర్ (GCF) కుటుంబాలకు చెందినవి.అదనంగా, మేము ఇప్పటి వరకు బహిరంగ సముద్రంలో BGCల యొక్క అత్యధిక వైవిధ్యాన్ని ప్రదర్శించే తెలియని బ్యాక్టీరియా కుటుంబాన్ని గుర్తించాము.ప్రస్తుతం తెలిసిన మార్గాల నుండి వాటి జన్యుపరమైన వ్యత్యాసాల ఆధారంగా ప్రయోగాత్మక ధృవీకరణ కోసం మేము రెండు రైబోసోమల్ సంశ్లేషణ మరియు పోస్ట్-ట్రాన్స్‌లేషనల్లీ మోడిఫైడ్ పెప్టైడ్ (RiPP) మార్గాలను ఎంచుకున్నాము.ఈ మార్గాల యొక్క ఫంక్షనల్ క్యారెక్టరైజేషన్ ఎంజైమాలజీ యొక్క ఊహించని ఉదాహరణలను అలాగే ప్రోటీజ్ ఇన్హిబిటరీ యాక్టివిటీతో నిర్మాణపరంగా అసాధారణమైన సమ్మేళనాలను వెల్లడించింది.
మొదట, మేము జన్యు విశ్లేషణ కోసం గ్లోబల్ డేటా రిసోర్స్‌ను రూపొందించాలని లక్ష్యంగా పెట్టుకున్నాము, దాని బ్యాక్టీరియా మరియు ఆర్కియల్ భాగాలపై దృష్టి పెట్టాము.ఈ క్రమంలో, మేము ప్రపంచవ్యాప్తంగా పంపిణీ చేయబడిన 215 నమూనా సైట్‌లు (అక్షాంశ పరిధి = 141.6°) మరియు అనేక లోతైన పొరలు (1 నుండి 5600 మీటర్ల లోతు వరకు, పెలాజిక్, మెసోపెలాజిక్ మరియు అగాధ జోన్‌లను కవర్ చేయడం) నుండి మెటాజెనోమిక్ డేటా మరియు 1038 సముద్రపు నీటి నమూనాలను పూల్ చేసాము.నేపథ్యం21,22,23 (Fig. 1a, పొడిగించిన డేటా, Fig. 1a మరియు అనుబంధ పట్టిక 1).విస్తృత భౌగోళిక కవరేజీని అందించడంతో పాటు, ఈ ఎంపిక చేసిన ఫిల్టర్ చేయబడిన నమూనాలు వైరస్-రిచ్ (<0.2 µm), ప్రొకార్యోటిక్-రిచ్ (0.2–3 µm), పార్టికల్-రిచ్ (0.8 µm) సహా సముద్ర సూక్ష్మజీవి యొక్క వివిధ భాగాలను పోల్చడానికి మాకు అనుమతినిచ్చాయి. )–20 µm) మరియు వైరస్-క్షీణించిన (>0.2 µm) కాలనీలు.
a, ప్రపంచవ్యాప్తంగా పంపిణీ చేయబడిన 215 స్థానాల నుండి (62°S నుండి 79°N మరియు 179°W నుండి 179°E వరకు) సేకరించబడిన సముద్ర సూక్ష్మజీవుల సంఘాల మొత్తం 1038 పబ్లిక్‌గా అందుబాటులో ఉన్న జన్యువులు (మెటాజెనోమిక్స్).మ్యాప్ టైల్స్ © Esri.మూలాధారాలు: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, నేషనల్ జియోగ్రాఫిక్, DeLorme, NAVTEQ మరియు Esri.b, ఈ మెటాజినోమ్‌లు MAGలను (పద్ధతులు మరియు అదనపు సమాచారం) పునర్నిర్మించడానికి ఉపయోగించబడ్డాయి, ఇవి డేటాసెట్‌లలో (రంగులో గుర్తించబడినవి) పరిమాణం మరియు నాణ్యతలో (పద్ధతులు) విభిన్నంగా ఉంటాయి.పునర్నిర్మించబడిన MAGలు హ్యాండ్‌క్రాఫ్ట్ చేసిన MAG26, SAG27 మరియు REFతో సహా పబ్లిక్‌గా అందుబాటులో ఉండే (బాహ్య) జన్యువులతో అనుబంధించబడ్డాయి.27 OMDని కంపైల్ చేయండి.c, SAG (GORG) 20 లేదా MAG (GEM) 16 ఆధారంగా మాత్రమే మునుపటి నివేదికలతో పోలిస్తే, OMD సముద్ర సూక్ష్మజీవుల సంఘాల (మెటాజెనోమిక్ రీడ్ మ్యాపింగ్ రేట్; పద్ధతి) యొక్క జన్యు లక్షణాన్ని రెండు నుండి మూడు రెట్లు లోతులో మరింత స్థిరమైన ప్రాతినిధ్యంతో మెరుగుపరుస్తుంది మరియు అక్షాంశం..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD గ్రూపింగ్ జాతుల సమూహాల స్థాయి (95% సగటు న్యూక్లియోటైడ్ గుర్తింపు) మొత్తంగా గుర్తిస్తుంది సుమారు 8300 జాతులు, వీటిలో సగానికి పైగా గతంలో GTDB (వెర్షన్ 89) ఇ ఉపయోగించి వర్గీకరణ ఉల్లేఖనాల ప్రకారం వర్గీకరించబడలేదు, జన్యు రకం ద్వారా జాతుల వర్గీకరణ MAG, SAG మరియు REF లు ఒకదానికొకటి బాగా సరిపోతాయని చూపించాయి. సముద్ర సూక్ష్మజీవి.ప్రత్యేకించి, 55%, 26% మరియు 11% జాతులు వరుసగా MAG, SAG మరియు REF కోసం నిర్దిష్టంగా ఉన్నాయి.BATS, బెర్ముడా అట్లాంటిక్ టైమ్ సిరీస్;GEM, భూమి యొక్క సూక్ష్మజీవుల జన్యువులు;GORG, గ్లోబల్ ఓషన్ రిఫరెన్స్ జీనోమ్;HOT, హవాయి మహాసముద్ర సమయ శ్రేణి.
ఈ డేటాసెట్‌ని ఉపయోగించి, మేము మొత్తం 26,293 MAGలను పునర్నిర్మించాము, ఎక్కువగా బ్యాక్టీరియా మరియు ఆర్కియల్ (Fig. 1b మరియు విస్తరించిన డేటా, Fig. 1b).విభిన్న స్థానాలు లేదా సమయ బిందువుల (పద్ధతులు) నుండి నమూనాల మధ్య సహజ శ్రేణి వైవిధ్యం కుప్పకూలకుండా నిరోధించడానికి మేము ఈ MAGలను విడివిడిగా పూల్ చేసిన మెటాజెనోమిక్ నమూనాల నుండి విడివిడిగా సృష్టించాము.అదనంగా, మేము పెద్ద సంఖ్యలో నమూనాలలో (58 నుండి 610 నమూనాల వరకు, సర్వే; పద్ధతిని బట్టి) వాటి ప్రాబల్య సహసంబంధాల ఆధారంగా జన్యు శకలాలను సమూహపరిచాము.ఇది చాలా పెద్ద-స్థాయి MAG16, 19, 25 పునర్నిర్మాణ పనులలో దాటవేయబడిన మరియు చాలా సమయం తీసుకునే ముఖ్యమైన దశ24 అని మేము కనుగొన్నాము మరియు పరిమాణం (సగటున 2.7 రెట్లు) మరియు నాణ్యతను (సగటున +20%) గణనీయంగా మెరుగుపరుస్తుంది. జీనోమ్.ఇక్కడ అధ్యయనం చేయబడిన మెరైన్ మెటాజినోమ్ నుండి పునర్నిర్మించబడింది (విస్తరించిన డేటా, Fig. 2a మరియు అదనపు సమాచారం).మొత్తంమీద, ఈ ప్రయత్నాలు ఈరోజు అందుబాటులో ఉన్న అత్యంత సమగ్రమైన MAG వనరుతో పోలిస్తే సముద్ర సూక్ష్మజీవుల MAGలలో 4.5 రెట్లు పెరిగాయి (అధిక-నాణ్యత గల MAGలను మాత్రమే పరిగణనలోకి తీసుకుంటే 6 రెట్లు).ఈ కొత్తగా సృష్టించబడిన MAG సెట్‌ను 830 చేతితో ఎంపిక చేసిన MAG26లు, 5969 SAG27లు మరియు 1707 REFలతో కలపడం జరిగింది.సముద్ర బ్యాక్టీరియా మరియు ఆర్కియా యొక్క ఇరవై-ఏడు జాతులు 34,799 జీనోమ్‌ల కలయికను రూపొందించాయి (Fig. 1b).
సముద్ర సూక్ష్మజీవుల సంఘాలకు ప్రాతినిధ్యం వహించే సామర్థ్యాన్ని మెరుగుపరచడానికి మరియు వివిధ జన్యు రకాలను ఏకీకృతం చేయడం యొక్క ప్రభావాన్ని అంచనా వేయడానికి మేము కొత్తగా సృష్టించిన వనరును విశ్లేషించాము.సగటున, ఇది సుమారుగా 40-60% మెరైన్ మెటాజెనోమిక్ డేటాను కవర్ చేస్తుందని మేము కనుగొన్నాము (Figure 1c), లోతు మరియు అక్షాంశం రెండింటిలోనూ మునుపటి MAG-మాత్రమే నివేదికల కంటే రెండు నుండి మూడు రెట్లు ఎక్కువ సీరియల్ 16 లేదా SAG20.అదనంగా, స్థాపించబడిన సేకరణలలో వర్గీకరణ వైవిధ్యాన్ని క్రమపద్ధతిలో కొలవడానికి, మేము జీనోమ్ టాక్సానమీ డేటాబేస్ (GTDB) టూల్‌కిట్ (పద్ధతులు) ఉపయోగించి అన్ని జన్యువులను ఉల్లేఖించాము మరియు సగటు జీనోమ్-వైడ్ న్యూక్లియోటైడ్ గుర్తింపును 95% ఉపయోగించాము.28 8,304 జాతుల సమూహాలను (జాతులు) గుర్తించడానికి.ఈ జాతులలో మూడింట రెండు వంతులు (కొత్త క్లాడ్‌లతో సహా) గతంలో GTDBలో కనిపించలేదు, వీటిలో 2790 ఈ అధ్యయనంలో పునర్నిర్మించిన MAGని ఉపయోగించి కనుగొనబడ్డాయి (Fig. 1d).అదనంగా, వివిధ రకాలైన జన్యువులు అత్యంత పరిపూరకరమైనవని మేము కనుగొన్నాము: 55%, 26% మరియు 11% జాతులు పూర్తిగా MAG, SAG మరియు REF లతో కూడి ఉంటాయి (Fig. 1e).అదనంగా, నీటి కాలమ్‌లో కనిపించే మొత్తం 49 రకాలను MAG కవర్ చేసింది, అయితే SAG మరియు REF వరుసగా 18 మరియు 11 రకాలను మాత్రమే సూచిస్తాయి.ఏదేమైనప్పటికీ, SAG దాదాపు 1300 జాతులను మరియు MAG కేవలం 390 జాతులను కలిగి ఉన్న పెలాజిక్ బాక్టీరియాల్స్ (SAR11) వంటి అత్యంత సాధారణ క్లాడ్‌ల (విస్తరించిన డేటా, Fig. 3a) యొక్క వైవిధ్యాన్ని మెరుగ్గా సూచిస్తుంది.ముఖ్యంగా, REFలు జాతుల స్థాయిలో MAGలు లేదా SAGలతో చాలా అరుదుగా అతివ్యాప్తి చెందుతాయి మరియు ఇక్కడ అధ్యయనం చేయబడిన ఓపెన్ ఓషన్ మెటాజెనోమిక్ సెట్‌లలో కనుగొనబడని సుమారు 1000 జన్యువులలో> 95% ప్రాతినిధ్యం వహిస్తాయి, ప్రధానంగా ఇతర రకాల వివిక్త ప్రతినిధి సముద్ర నమూనాలతో పరస్పర చర్యల కారణంగా (ఉదా. అవక్షేపాలు ) .లేదా హోస్ట్-అసోసియేట్).శాస్త్రీయ సమాజానికి విస్తృతంగా అందుబాటులో ఉండేలా చేయడానికి, ఈ సముద్ర జన్యు వనరు, వర్గీకరించని శకలాలు (ఉదా., అంచనా వేయబడిన ఫేజ్‌లు, జన్యు ద్వీపాలు మరియు MAG పునర్నిర్మాణానికి తగినంత డేటా లేని జన్యు శకలాలు) కూడా కలిగి ఉంటుంది, వర్గీకరణ డేటాతో పోల్చవచ్చు. .ఓషన్ మైక్రోబయాలజీ డేటాబేస్ (OMD; https://microbiomics.io/ocean/)లో జన్యు పనితీరు మరియు సందర్భోచిత పారామితులతో పాటు ఉల్లేఖనాలను యాక్సెస్ చేయండి.
మేము ఓపెన్ ఓషన్ మైక్రోబయోమ్‌లలో బయోసింథటిక్ సంభావ్యత యొక్క గొప్పతనాన్ని మరియు కొత్తదనాన్ని అన్వేషించడానికి బయలుదేరాము.ఈ క్రమంలో, మొత్తం 39,055 BGCలను అంచనా వేయడానికి 1038 మెరైన్ మెటాజినోమ్‌లలో (పద్ధతులు) కనుగొనబడిన అన్ని MAGలు, SAGలు మరియు REFల కోసం మేము మొదట యాంటీస్మాష్‌ని ఉపయోగించాము.స్వాభావిక రిడెండెన్సీ (అంటే, అదే BGCని బహుళ జన్యువులలో ఎన్‌కోడ్ చేయవచ్చు) మరియు సాంద్రీకృత BGCల యొక్క మెటాజెనోమిక్ డేటా ఫ్రాగ్మెంటేషన్ కోసం మేము వీటిని 6907 అనవసరమైన GCFలు మరియు 151 జన్యు క్లస్టర్ పాపులేషన్‌లుగా (GCCలు; అనుబంధ పట్టిక 2 మరియు పద్ధతులు) వర్గీకరించాము.అసంపూర్ణమైన BGCలు ఏవైనా ఉంటే (సప్లిమెంటరీ ఇన్ఫర్మేషన్), GCFలు మరియు GCCల సంఖ్య గణనీయంగా పెరగలేదు, 44% మరియు 86% కేసులలో కనీసం ఒక చెక్కుచెదరని BGC మెంబర్‌ని కలిగి ఉన్నారు.
GCC స్థాయిలో, మేము అనేక రకాల అంచనా వేసిన RiPPలు మరియు ఇతర సహజ ఉత్పత్తులను కనుగొన్నాము (Fig. 2a).వాటిలో, ఉదాహరణకు, ఆరిల్‌పోలీన్‌లు, కెరోటినాయిడ్స్, ఎక్టోయిన్‌లు మరియు సైడెఫోర్స్ జిసిసిలకు చెందినవి విస్తృత ఫైలోజెనెటిక్ పంపిణీ మరియు సముద్రపు మెటాజినోమ్‌లలో అధిక సమృద్ధిని కలిగి ఉంటాయి, ఇవి రియాక్టివ్ ఆక్సిజన్ జాతుల నిరోధకతతో సహా సముద్ర పర్యావరణానికి సూక్ష్మజీవుల విస్తృత అనుసరణను సూచిస్తాయి. ఆక్సీకరణ మరియు ద్రవాభిసరణ ఒత్తిడి..లేదా ఇనుము శోషణ (మరింత సమాచారం).ఈ క్రియాత్మక వైవిధ్యం NCBI RefSeq డేటాబేస్ (BiG-FAM/RefSeq, ఇకపై RefSeq గా సూచిస్తారు) 29, NCBI RefSeq లో నిల్వ చేయబడిన సుమారు 190,000 జన్యువులలో సుమారు 1.2 మిలియన్ BGCల యొక్క ఇటీవలి విశ్లేషణతో విభేదిస్తుంది. సింథేస్ (PKS) BGCలు (సప్లిమెంటరీ ఇన్ఫర్మేషన్).మేము MAGలో మాత్రమే ఏదైనా RefSeq BGC (\(\bar{d}\) RefSeq > 0.4; Fig. 2a మరియు పద్ధతులు) మరియు 53 (35%) GCC లకు మాత్రమే సుదూర సంబంధం ఉన్న 44 (29%) GCCలను కనుగొన్నాము , సంభావ్యతను హైలైట్ చేస్తుంది OMDలో గతంలో వివరించని రసాయనాలను గుర్తించడానికి.ఈ GCCలు ప్రతి ఒక్కటి అత్యంత వైవిధ్యభరితమైన బయోసింథటిక్ ఫంక్షన్‌లను సూచిస్తున్నందున, సారూప్య సహజ ఉత్పత్తుల కోసం కోడ్ చేయడానికి అంచనా వేసిన BGCల యొక్క మరింత వివరణాత్మక సమూహాన్ని అందించే ప్రయత్నంలో మేము GCF స్థాయిలో డేటాను మరింత విశ్లేషించాము.గుర్తించబడిన మొత్తం 3861 (56%) GCFలు RefSeqతో అతివ్యాప్తి చెందలేదు మరియు > 97% GCFలు MIBiGలో లేవు, ఇది ప్రయోగాత్మకంగా ధృవీకరించబడిన BGCల యొక్క అతిపెద్ద డేటాబేస్‌లలో ఒకటి (మూర్తి 2b).రిఫరెన్స్ జీనోమ్ ద్వారా బాగా ప్రాతినిధ్యం వహించని సెట్టింగ్‌లలో అనేక సంభావ్య నవల మార్గాలను కనుగొనడం ఆశ్చర్యం కలిగించనప్పటికీ, బెంచ్‌మార్కింగ్‌కు ముందు BGCలను GCFలుగా విడదీసే మా పద్ధతి మునుపటి నివేదికల నుండి భిన్నంగా ఉంటుంది 16 మరియు కొత్తదనం యొక్క నిష్పాక్షిక అంచనాను అందించడానికి మమ్మల్ని అనుమతిస్తుంది.కొత్త వైవిధ్యం (3012 GCF లేదా 78%) ఊహించిన టెర్పెనెస్, RiPP లేదా ఇతర సహజ ఉత్పత్తులకు అనుగుణంగా ఉంటాయి మరియు చాలా వరకు (1815 GCF లేదా 47%) వాటి బయోసింథటిక్ సంభావ్యత కారణంగా తెలియని రకాలుగా ఎన్‌కోడ్ చేయబడ్డాయి.PKS మరియు NRPS క్లస్టర్‌ల మాదిరిగా కాకుండా, ఈ కాంపాక్ట్ BGCలు మెటాజెనోమిక్ అసెంబ్లీ 31 సమయంలో విచ్ఛిన్నమయ్యే అవకాశం తక్కువగా ఉంటుంది మరియు వాటి ఉత్పత్తులకు ఎక్కువ సమయం మరియు వనరు-ఇంటెన్సివ్ ఫంక్షనల్ క్యారెక్టరైజేషన్‌ను అనుమతిస్తాయి.
మొత్తం 39,055 BGCలు 6,907 GCFలు మరియు 151 GCCలుగా వర్గీకరించబడ్డాయి.a, డేటా ప్రాతినిధ్యం (అంతర్గత బాహ్య).GCC ఆధారంగా BGC దూరాల యొక్క క్రమానుగత క్లస్టరింగ్, వీటిలో 53 MAG ద్వారా మాత్రమే నిర్ణయించబడతాయి.GCC వివిధ టాక్సా (ln-ట్రాన్స్‌ఫార్మ్డ్ గేట్ ఫ్రీక్వెన్సీ) మరియు విభిన్న BGC తరగతుల నుండి BGCలను కలిగి ఉంది (సర్కిల్ పరిమాణం దాని ఫ్రీక్వెన్సీకి అనుగుణంగా ఉంటుంది).ప్రతి GCCకి, బయటి పొర BGCల సంఖ్య, ప్రాబల్యం (నమూనాల శాతం) మరియు BiG-FAM నుండి BGCకి దూరాన్ని (కనీస BGC కొసైన్ దూరం (min(dMIBiG))) సూచిస్తుంది.ప్రయోగాత్మకంగా ధృవీకరించబడిన BGC లకు (MIBiG) దగ్గరి సంబంధం ఉన్న BGCలతో ఉన్న GCCలు బాణాలతో హైలైట్ చేయబడ్డాయి.b ఊహించిన (BiG-FAM) మరియు ప్రయోగాత్మకంగా ధృవీకరించబడిన (MIBiG) BGCలతో GCFని పోల్చి చూస్తే, 3861 కొత్త (d–>0.2) GCFలు కనుగొనబడ్డాయి.ఈ కోడ్‌లో చాలా వరకు (78%) RiPP, టెర్పెనెస్ మరియు ఇతర సహజ ఉత్పత్తుల కోసం.c, 1038 మెరైన్ మెటాజినోమ్‌లలో కనుగొనబడిన OMDలోని అన్ని జన్యువులు OMD యొక్క ఫైలోజెనెటిక్ కవరేజీని చూపించడానికి GTDB బేస్ ట్రీలో ఉంచబడ్డాయి.OMDలో ఎటువంటి జన్యువులు లేని క్లాడ్‌లు బూడిద రంగులో చూపబడ్డాయి.BGCల సంఖ్య ఇచ్చిన క్లాడ్‌లో ప్రతి జన్యువుకు అత్యధిక సంఖ్యలో అంచనా వేయబడిన BGCలకు అనుగుణంగా ఉంటుంది.స్పష్టత కోసం, చివరి 15% నోడ్‌లు కూలిపోయాయి.బాణాలు మైకోబాక్టీరియం, గోర్డోనియా (రోడోకాకస్‌కు రెండవది), మరియు క్రోకోస్ఫేరా (సైనెకోకాకస్‌కు మాత్రమే రెండవది) మినహా BGC (>15 BGC) సమృద్ధిగా ఉన్న క్లాడ్‌లను సూచిస్తాయి.d, తెలియని c.ఎరెమియోబాక్టీరోటా అత్యధిక బయోసింథటిక్ వైవిధ్యాన్ని చూపించింది (సహజ ఉత్పత్తి రకం ఆధారంగా షానన్ సూచిక).ప్రతి బ్యాండ్ జాతులలో అత్యధిక BGCలు ఉన్న జన్యువును సూచిస్తుంది.T1PKS, PKS రకం I, T2/3PKS, PKS రకం II మరియు రకం III.
రిచ్‌నెస్ మరియు కొత్తదనంతో పాటు, మేము సముద్ర సూక్ష్మజీవి యొక్క బయోసింథటిక్ సంభావ్యత యొక్క బయోజియోగ్రాఫిక్ నిర్మాణాన్ని అన్వేషిస్తాము.సగటు మెటాజెనోమిక్ GCF కాపీ సంఖ్య పంపిణీ (పద్ధతులు) ద్వారా నమూనాలను సమూహపరచడం తక్కువ-అక్షాంశం, ఉపరితలం, ప్రొకార్యోటిక్-రిచ్ మరియు వైరస్-పేద కమ్యూనిటీలు, ఎక్కువగా ఉపరితలం లేదా లోతైన సూర్యరశ్మి జలాల నుండి, RiPP మరియు BGC టెర్పెన్‌లలో సమృద్ధిగా ఉన్నాయని తేలింది.దీనికి విరుద్ధంగా, పోలార్, డీప్ సీ, వైరస్- మరియు పార్టికల్-రిచ్ కమ్యూనిటీలు NRPS మరియు PKS BGC (విస్తరించిన డేటా, Fig. 4 మరియు అదనపు సమాచారం) యొక్క అధిక సమృద్ధితో అనుబంధించబడ్డాయి.చివరగా, బాగా అధ్యయనం చేయబడిన ఉష్ణమండల మరియు పెలాజిక్ కమ్యూనిటీలు కొత్త టెర్పెన్‌ల యొక్క అత్యంత ఆశాజనకమైన వనరులు అని మేము కనుగొన్నాము (ఆగ్మెంటెడ్ డేటా ఫిగర్).PKS, RiPP మరియు ఇతర సహజ ఉత్పత్తులకు అత్యధిక సంభావ్యత (విస్తరించిన డేటాతో మూర్తి 5a).
మెరైన్ మైక్రోబయోమ్‌ల బయోసింథటిక్ సంభావ్యత గురించి మా అధ్యయనాన్ని పూర్తి చేయడానికి, మేము వాటి ఫైలోజెనెటిక్ పంపిణీని మ్యాప్ చేయడం మరియు కొత్త BGC- సుసంపన్నమైన క్లాడ్‌లను గుర్తించడం లక్ష్యంగా పెట్టుకున్నాము.ఈ క్రమంలో, మేము సముద్ర సూక్ష్మజీవుల జన్యువులను సాధారణీకరించిన GTDB13 బ్యాక్టీరియా మరియు ఆర్కియల్ ఫైలోజెనెటిక్ చెట్టులో ఉంచాము మరియు అవి ఎన్‌కోడ్ చేసే పుటేటివ్ బయోసింథటిక్ మార్గాలను అతివ్యాప్తి చేసాము (Fig. 2c).సైనోబాక్టీరియా (సైనెకోకాకస్) మరియు టిస్ట్రెల్లా32,33 వంటి ప్రోటీయస్ బాక్టీరియా వంటి వాటి బయోసింథటిక్ పొటెన్షియల్‌కు ప్రసిద్ధి చెందిన సముద్రపు నీటి నమూనాలలో (పద్ధతులు) అనేక BGC-సుసంపన్నమైన క్లాడ్‌లను (15 BGCలకు పైగా ప్రాతినిధ్యం వహిస్తుంది) మేము సులభంగా గుర్తించాము లేదా ఇటీవల వాటిపై దృష్టిని ఆకర్షించాము. సహజ ఉత్పత్తులు.మైక్సోకోకోటా (సాండరాసినేసి), రోడోకాకస్ మరియు ప్లాంక్టోమైసెటోటా34,35,36 వంటివి.ఆసక్తికరంగా, ఈ క్లాడ్‌లలో గతంలో అన్వేషించని అనేక వంశాలను మేము కనుగొన్నాము.ఉదాహరణకు, ఫైలా ప్లాంక్టోమైసెటోటా మరియు మైక్సోకోకోటాలో అత్యంత సంపన్నమైన బయోసింథటిక్ సంభావ్యత కలిగిన జాతులు వరుసగా నిర్దేశించని అభ్యర్థి ఆర్డర్‌లు మరియు జాతులకు చెందినవి (సప్లిమెంటరీ టేబుల్ 3).కలిసి చూస్తే, OMD సూక్ష్మజీవులతో సహా గతంలో తెలియని ఫైలోజెనెటిక్ సమాచారానికి ప్రాప్యతను అందిస్తుంది, ఇది ఎంజైమ్ మరియు సహజ ఉత్పత్తి ఆవిష్కరణ కోసం కొత్త లక్ష్యాలను సూచిస్తుంది.
తర్వాత, మేము BGC-సుసంపన్నమైన క్లాడ్‌ను దాని సభ్యులు ఎన్‌కోడ్ చేసిన గరిష్ట సంఖ్యలో BGCలను లెక్కించడం ద్వారా మాత్రమే కాకుండా, ఈ BGCల యొక్క వైవిధ్యాన్ని అంచనా వేయడం ద్వారా కూడా వర్గీకరించాము, ఇది వివిధ రకాల సహజ అభ్యర్థి ఉత్పత్తుల యొక్క ఫ్రీక్వెన్సీని వివరిస్తుంది (Fig. 2c మరియు పద్ధతులు. ).ఈ అధ్యయనంలో ప్రత్యేకంగా ఇంజనీరింగ్ చేయబడిన బాక్టీరియల్ MAGల ద్వారా అత్యంత బయోసింథటిక్‌గా విభిన్న జాతులు ప్రాతినిధ్యం వహించాయని మేము కనుగొన్నాము.ఈ బ్యాక్టీరియా సాగు చేయని ఫైలమ్ కాండిడాటస్ ఎరెమియోబాక్టీరోటాకు చెందినది, ఇది కొన్ని జన్యు అధ్యయనాలు కాకుండా ఎక్కువగా అన్వేషించబడలేదు37,38.ఇది గమనించదగినది “ca.Eremiobacterota జాతి భూసంబంధమైన వాతావరణంలో మాత్రమే విశ్లేషించబడింది39 మరియు BGCలో సమృద్ధిగా ఉన్న సభ్యులను చేర్చినట్లు తెలియదు.ఇక్కడ మేము ఒకే జాతికి చెందిన ఎనిమిది MAGలను పునర్నిర్మించాము (న్యూక్లియోటైడ్ గుర్తింపు > 99%) 23. అందువల్ల మేము గ్రీకు పురాణాలు మరియు సాహసయాత్రలలో ఒక అందమైన బహుమతి అయిన నెరీడ్ (సముద్ర వనదేవత) పేరు పెట్టబడిన "కాండిడాటస్ యుడోరెమైక్రోబియం మలాస్పిని" అనే జాతి పేరును ప్రతిపాదించాము.'కా.ఫైలోజెనెటిక్ ఉల్లేఖనం 13 ప్రకారం, E. మలాస్పినీకి సీక్వెన్స్ లెవెల్ కంటే ఇంతకు ముందు తెలిసిన బంధువులు లేరు మరియు ఆ విధంగా మేము ప్రతిపాదిస్తున్న కొత్త బ్యాక్టీరియా కుటుంబానికి చెందినది “Ca.E. malaspinii” రకం జాతులుగా మరియు “Ca.Eudormicrobiaceae” అధికారిక పేరు (సప్లిమెంటరీ ఇన్ఫర్మేషన్).'Ca' యొక్క సంక్షిప్త మెటాజెనోమిక్ పునర్నిర్మాణం.E. మలాస్పినీ జీనోమ్ ప్రాజెక్ట్ చాలా తక్కువ ఇన్‌పుట్, లాంగ్ రీడ్ మెటాజెనోమిక్ సీక్వెన్సింగ్ మరియు 75 kb డూప్లికేషన్‌తో ఒకే 9.63 Mb లీనియర్ క్రోమోజోమ్‌గా ఒకే నమూనా (మెథడ్స్) యొక్క లక్ష్య అసెంబ్లీ ద్వారా ధృవీకరించబడింది.మాత్రమే మిగిలి ఉన్న సందిగ్ధత.
ఈ జాతి యొక్క ఫైలోజెనెటిక్ సందర్భాన్ని స్థాపించడానికి, లక్ష్య జన్యు పునర్నిర్మాణం ద్వారా తారా మహాసముద్ర యాత్ర నుండి అదనపు యూకారియోటిక్-సుసంపన్నమైన మెటాజెనోమిక్ నమూనాలలో మేము 40 దగ్గరి సంబంధం ఉన్న జాతుల కోసం శోధించాము.క్లుప్తంగా, మేము మెటాజెనోమిక్ రీడ్‌లను “Caతో అనుబంధించబడిన జన్యు శకలాలకు లింక్ చేసాము.E. malaspinii” మరియు ఈ నమూనాలో పెరిగిన రిక్రూట్‌మెంట్ రేటు ఇతర బంధువుల (పద్ధతులు) ఉనికిని సూచిస్తుందని ఊహించారు.ఫలితంగా, మేము కొత్తగా నిర్వచించిన కుటుంబంలో (అంటే "Ca. Eudormicrobiaceae") మూడు జాతులలో ఐదు జాతులను సూచించే 19 MAGల కలయికతో 10 MAGలను కనుగొన్నాము.మాన్యువల్ తనిఖీ మరియు నాణ్యత నియంత్రణ (విస్తరించిన డేటా, Fig. 6 మరియు అదనపు సమాచారం) తర్వాత, మేము "Ca.Eudormicrobiaceae జాతులు ఇతర "Ca" సభ్యుల కంటే పెద్ద జన్యువులను (8 Mb) మరియు రిచ్ బయోసింథటిక్ సంభావ్యత (ప్రతి జాతికి 14 నుండి 22 BGC) కలిగి ఉంటాయి.క్లాడ్ ఎరెమియోబాక్టీరోటా (7 BGC వరకు) (Fig. 3a-c).
a, ఐదు 'Ca యొక్క ఫైలోజెనెటిక్ స్థానాలు.Eudormicrobiaceae జాతులు ఈ అధ్యయనంలో గుర్తించబడిన సముద్ర రేఖలకు ప్రత్యేకమైన BGC గొప్పతనాన్ని చూపించాయి.ఫైలోజెనెటిక్ చెట్టు మొత్తం 'Ca'ని కలిగి ఉంటుంది.MAG Eremiobacterota మరియు GTDB (వెర్షన్ 89)లో అందించబడిన ఇతర ఫైలా (బ్రాకెట్లలో జన్యు సంఖ్యలు) సభ్యులు పరిణామ నేపథ్యం (పద్ధతులు) కోసం ఉపయోగించబడ్డారు.బయటి పొరలు కుటుంబ స్థాయిలో ("Ca. Eudormicrobiaceae" మరియు "Ca. Xenobiaceae") మరియు తరగతి స్థాయిలో ("Ca. Eremiobacteria") వర్గీకరణలను సూచిస్తాయి.ఈ అధ్యయనంలో వివరించిన ఐదు జాతులు ఆల్ఫాన్యూమరిక్ కోడ్‌లు మరియు ప్రతిపాదిత ద్విపద పేర్లు (సప్లిమెంటరీ ఇన్ఫర్మేషన్) ద్వారా సూచించబడతాయి.b, సరే.Eudormicrobiaceae జాతులు ఏడు సాధారణ BGC కేంద్రకాలను పంచుకుంటాయి.A2 క్లాడ్‌లో BGC లేకపోవడం ప్రతినిధి MAG (సప్లిమెంటరీ టేబుల్ 3) యొక్క అసంపూర్ణత కారణంగా ఉంది.BGCలు “Ca.యాంఫిథోమైక్రోబియం” మరియు “Ca.యాంఫిథోమైక్రోబియం” (క్లాడ్‌లు A మరియు B) చూపబడలేదు.c, అన్ని BGCలు “Ca.తారా మహాసముద్రాల నుండి తీసిన 623 మెటాట్రాన్స్‌క్రిప్టోమ్‌లలో యుడోరెమైక్రోబియం టారోసియాని వ్యక్తీకరించబడినట్లు కనుగొనబడింది.ఘన వృత్తాలు క్రియాశీల లిప్యంతరీకరణను సూచిస్తాయి.ఆరెంజ్ సర్కిల్‌లు లాగ్2-ట్రాన్స్‌ఫార్మ్డ్ ఫోల్డ్ మార్పులను హౌస్ కీపింగ్ జన్యు వ్యక్తీకరణ రేటు (పద్ధతులు) క్రింద మరియు పైన సూచిస్తాయి.d, సాపేక్ష సమృద్ధి వక్రతలు (పద్ధతులు) 'Ca.Eudormicrobiaceae జాతులు చాలా సముద్రపు బేసిన్లలో మరియు మొత్తం నీటి కాలమ్‌లో (ఉపరితలం నుండి కనీసం 4000 మీటర్ల లోతు వరకు) విస్తృతంగా వ్యాపించి ఉన్నాయి.ఈ అంచనాల ఆధారంగా, మేము 'Ca.లోతైన సముద్రపు పెలాజిక్ ధాన్యం-సంబంధిత కమ్యూనిటీలలో E. మలాస్పిని' 6% వరకు ప్రొకార్యోటిక్ కణాలను కలిగి ఉంది.ఇచ్చిన డెప్త్ లేయర్ పరిమాణంలో ఏదైనా భిన్నంలో కనుగొనబడినట్లయితే, సైట్‌లో ఒక జాతి ఉన్నట్లు మేము పరిగణించాము.IO - హిందూ మహాసముద్రం, NAO - ఉత్తర అట్లాంటిక్, NPO - ఉత్తర పసిఫిక్, RS - ఎర్ర సముద్రం, SAO - దక్షిణ అట్లాంటిక్, SO - దక్షిణ మహాసముద్రం, SPO - దక్షిణ పసిఫిక్.
Ca యొక్క సమృద్ధి మరియు పంపిణీని అధ్యయనం చేస్తోంది.Eudormicrobiaceae, ఇది మేము కనుగొన్నట్లుగా, చాలా సముద్రపు బేసిన్లలో, అలాగే మొత్తం నీటి కాలమ్ (Fig. 3d)లో ప్రధానంగా ఉంటుంది.స్థానికంగా, వారు సముద్ర సూక్ష్మజీవుల సంఘంలో 6% ఉన్నారు, వాటిని ప్రపంచ సముద్ర సూక్ష్మజీవిలో ముఖ్యమైన భాగంగా చేశారు.అదనంగా, మేము Ca యొక్క సంబంధిత కంటెంట్‌ని కనుగొన్నాము.Eudormicrobiaceae జాతులు మరియు వాటి BGC వ్యక్తీకరణ స్థాయిలు యూకారియోటిక్ సుసంపన్నమైన భిన్నం (Fig. 3c మరియు పొడిగించిన డేటా, Fig. 7)లో అత్యధికంగా ఉన్నాయి, ఇది పాచితో సహా నలుసు పదార్థంతో సాధ్యమయ్యే పరస్పర చర్యను సూచిస్తుంది.ఈ పరిశీలన 'Ca'కి కొంత పోలికను కలిగి ఉంది.తెలిసిన మార్గాల ద్వారా సైటోటాక్సిక్ సహజ ఉత్పత్తులను ఉత్పత్తి చేసే యూడోరెమైక్రోబియం BGCలు దోపిడీ ప్రవర్తనను (సప్లిమెంటరీ ఇన్ఫర్మేషన్ అండ్ ఎక్స్‌పాండెడ్ డేటా, ఫిగర్ 8) ప్రదర్శిస్తాయి, ఇది ఇతర మాంసాహారుల మాదిరిగానే మైక్సోకాకస్41 వంటి జీవక్రియలను ప్రత్యేకంగా ఉత్పత్తి చేస్తుంది.Ca యొక్క ఆవిష్కరణ.తక్కువ అందుబాటులో ఉన్న (లోతైన సముద్రంలో) యూడోర్మైక్రోబియాసి లేదా ప్రొకార్యోటిక్ నమూనాల కంటే యూకారియోటిక్ సహజ ఆహార పరిశోధన సందర్భంలో ఈ బ్యాక్టీరియా మరియు వాటి ఊహించని BGC వైవిధ్యం ఎందుకు అస్పష్టంగా ఉన్నాయో వివరించవచ్చు.
అంతిమంగా, కొత్త మార్గాలు, ఎంజైమ్‌లు మరియు సహజ ఉత్పత్తులను కనుగొనడంలో మా మైక్రోబయోమ్ ఆధారిత పని యొక్క వాగ్దానాన్ని ప్రయోగాత్మకంగా ధృవీకరించడానికి మేము ప్రయత్నించాము.BGCల యొక్క వివిధ తరగతులలో, పరిపక్వ ఎంజైమ్‌ల ద్వారా కోర్ పెప్టైడ్ యొక్క వివిధ అనువాద అనంతర మార్పుల కారణంగా RiPP మార్గం గొప్ప రసాయన మరియు క్రియాత్మక వైవిధ్యాన్ని ఎన్‌కోడ్ చేస్తుంది.కాబట్టి మేము రెండు 'Ca ఎంచుకున్నాము.Eudoremicrobium' RiPP BGCలు (గణాంకాలు 3b మరియు 4a-e) ఏదైనా తెలిసిన BGC (\(\bar{d}\)MIBiG మరియు \(\bar{d}\)RefSeq 0.2 పైన) ఆధారంగా ఉంటాయి.
a–c, లోతైన సముద్ర Ca జాతుల కోసం ప్రత్యేకమైన RiPP బయోసింథసిస్ యొక్క నవల (\(\bar{d}\) RefSeq = 0.29) యొక్క ఇన్ విట్రో హెటెరోలాగస్ ఎక్స్‌ప్రెషన్ మరియు ఇన్ విట్రో ఎంజైమాటిక్ అస్సేస్.E. మలాస్పిని' డైఫాస్ఫోరైలేటెడ్ ఉత్పత్తుల ఉత్పత్తికి దారితీసింది.c, అధిక-రిజల్యూషన్ (HR) MS/MS (రసాయన నిర్మాణంలో b మరియు y అయాన్లచే సూచించబడిన ఫ్రాగ్మెంటేషన్) మరియు NMR (విస్తరించిన డేటా, Fig. 9) ఉపయోగించి గుర్తించబడిన మార్పులు.d, ఈ ఫాస్ఫోరైలేటెడ్ పెప్టైడ్ క్షీరద న్యూట్రోఫిల్ ఎలాస్టేస్ యొక్క తక్కువ మైక్రోమోలార్ నిరోధాన్ని ప్రదర్శిస్తుంది, ఇది కంట్రోల్ పెప్టైడ్ మరియు డీహైడ్రేటింగ్ పెప్టైడ్ (రసాయన తొలగింపు ప్రేరిత నిర్జలీకరణం)లో కనిపించదు.ఇలాంటి ఫలితాలతో ప్రయోగం మూడుసార్లు పునరావృతమైంది.ఉదాహరణకు, ప్రోటీన్ బయోసింథసిస్ యొక్క రెండవ నవల \(\bar{d}\)RefSeq = 0.33) క్లస్టర్ యొక్క వైవిధ్య వ్యక్తీకరణ 46 అమైనో యాసిడ్ కోర్ పెప్టైడ్‌ను సవరించే నాలుగు పరిపక్వ ఎంజైమ్‌ల పనితీరును విశదపరుస్తుంది.HR-MS/MS, ఐసోటోప్ లేబులింగ్ మరియు NMR విశ్లేషణ (సప్లిమెంటరీ ఇన్ఫర్మేషన్) ద్వారా అంచనా వేయబడిన సవరణ సైట్ ప్రకారం అవశేషాలు తడిసినవి.గీసిన రంగు రెండు అవశేషాలలో దేనిలోనైనా మార్పు జరుగుతుందని సూచిస్తుంది.ఒకే కేంద్రకంపై ఉన్న అన్ని పరిపక్వ ఎంజైమ్‌ల కార్యకలాపాలను చూపించడానికి అనేక వైవిధ్య నిర్మాణాల సంకలనం ఈ బొమ్మ.h, వెన్నెముక అమైడ్ N-మిథైలేషన్ కోసం NMR డేటా యొక్క ఇలస్ట్రేషన్.పూర్తి ఫలితాలు అంజీర్‌లో చూపబడ్డాయి.10 పొడిగించిన డేటాతో.i, MIBiG 2.0 డేటాబేస్‌లో కనుగొనబడిన అన్ని FkbM డొమైన్‌లలో పరిపక్వమైన FkbM ప్రోటీన్ క్లస్టర్ ఎంజైమ్ యొక్క ఫైలోజెనెటిక్ స్థానం N-మిథైల్‌ట్రాన్స్‌ఫేరేస్ కార్యాచరణతో (సప్లిమెంటరీ ఇన్ఫర్మేషన్) ఈ కుటుంబం యొక్క ఎంజైమ్‌ను వెల్లడిస్తుంది.BGCs (a, e), పూర్వగామి పెప్టైడ్ నిర్మాణాలు (b, f) మరియు సహజ ఉత్పత్తుల యొక్క పుటేటివ్ రసాయన నిర్మాణాలు (c, g) యొక్క స్కీమాటిక్ రేఖాచిత్రాలు చూపబడ్డాయి.
మొదటి RiPP మార్గం (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) లోతైన సముద్ర జాతులలో మాత్రమే కనుగొనబడింది “Ca.E. malaspinii” మరియు పెప్టైడ్- పూర్వగామి కోసం సంకేతాలు (Fig. 4a, b).ఈ పరిపక్వ ఎంజైమ్‌లో, లాంటిపెప్టైడ్ సింథేస్ యొక్క డీహైడ్రేషన్ డొమైన్‌కు సజాతీయంగా ఒకే ఫంక్షనల్ డొమైన్‌ను మేము గుర్తించాము, ఇది సాధారణంగా ఫాస్ఫోరైలేషన్‌ను ఉత్ప్రేరకపరుస్తుంది మరియు 43 (సప్లిమెంటరీ ఇన్ఫర్మేషన్) యొక్క తదుపరి తొలగింపు.అందువల్ల, పూర్వగామి పెప్టైడ్ యొక్క మార్పు అటువంటి రెండు-దశల నిర్జలీకరణాన్ని కలిగి ఉంటుందని మేము అంచనా వేస్తున్నాము.అయినప్పటికీ, టెన్డం మాస్ స్పెక్ట్రోమెట్రీ (MS/MS) మరియు న్యూక్లియర్ మాగ్నెటిక్ రెసొనెన్స్ స్పెక్ట్రోస్కోపీ (NMR)ని ఉపయోగించి, మేము ఒక పాలీఫాస్ఫోరైలేటెడ్ లీనియర్ పెప్టైడ్ (Fig. 4c)ని గుర్తించాము.ఊహించనిది అయినప్పటికీ, దాని తుది ఉత్పత్తికి మద్దతునిచ్చే అనేక ఆధారాలను మేము కనుగొన్నాము: రెండు వేర్వేరు హెటెరోలాజస్ హోస్ట్‌లు మరియు ఇన్ విట్రో అస్సేస్‌లో డీహైడ్రేషన్ లేదు, పరిపక్వ ఎంజైమ్ యొక్క ఉత్ప్రేరక నిర్జలీకరణ ప్రదేశంలో పరివర్తన చెందిన కీలక అవశేషాలను గుర్తించడం.అన్నీ "Ca" ద్వారా పునర్నిర్మించబడ్డాయి.E. malaspinii జీనోమ్ (విస్తరించిన డేటా, Fig. 9 మరియు అదనపు సమాచారం) మరియు, చివరకు, ఫాస్ఫోరైలేటెడ్ ఉత్పత్తి యొక్క జీవసంబంధమైన చర్య, కానీ రసాయనికంగా సంశ్లేషణ చేయబడిన నిర్జలీకరణ రూపం (Fig. 4d).వాస్తవానికి, ఇది న్యూట్రోఫిల్ ఎలాస్టేస్‌కు వ్యతిరేకంగా తక్కువ మైక్రోమోలార్ ప్రోటీజ్ ఇన్‌హిబిటరీ యాక్టివిటీని ప్రదర్శిస్తుందని, ఏకాగ్రత పరిధిలోని ఇతర సంబంధిత సహజ ఉత్పత్తులతో పోల్చవచ్చు (IC50 = 14.3 μM) 44 , వాస్తవం ఉన్నప్పటికీ పర్యావరణ పాత్ర స్పష్టంగా చెప్పవలసి ఉంది.ఈ ఫలితాల ఆధారంగా, మేము మార్గానికి "ఫాస్పెప్టిన్" అని పేరు పెట్టాలని ప్రతిపాదిస్తున్నాము.
రెండవ సందర్భం 'Ca'కి ప్రత్యేకమైన సంక్లిష్టమైన RiPP మార్గం.యూడోరెమైక్రోబియం (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) సహజ ప్రోటీన్ ఉత్పత్తులను ఎన్‌కోడ్ చేస్తుందని అంచనా వేయబడింది (Fig. 4e).సాపేక్షంగా చిన్న BGCs45 ద్వారా ఎన్‌కోడ్ చేయబడిన ఎంజైమ్‌లచే స్థాపించబడిన ఊహించిన సాంద్రత మరియు వివిధ రకాల అసాధారణ రసాయన సవరణల కారణంగా ఈ మార్గాలు ప్రత్యేక బయోటెక్నాలజీ ఆసక్తిని కలిగి ఉన్నాయి.ఈ ప్రోటీన్ మునుపు వర్గీకరించబడిన ప్రోటీన్‌ల నుండి భిన్నంగా ఉందని మేము కనుగొన్నాము, దీనిలో పాలీసెరమైడ్‌ల యొక్క ప్రధాన NX5N మూలాంశం మరియు ల్యాండోర్నామైడ్స్ 46 యొక్క లాంథియోనిన్ లూప్ రెండూ లేవు.సాధారణ వైవిధ్య వ్యక్తీకరణ నమూనాల పరిమితులను అధిగమించడానికి, మేము వాటిని నాలుగు పరిపక్వ పాత్‌వే ఎంజైమ్‌లను (పద్ధతులు) వర్గీకరించడానికి అనుకూల మైక్రోవిర్గులా ఏరోడెనిట్రిఫికన్స్ సిస్టమ్‌తో పాటు ఉపయోగించాము.MS/MS, ఐసోటోప్ లేబులింగ్ మరియు NMR కలయికను ఉపయోగించి, మేము పెప్టైడ్ యొక్క 46-అమినో యాసిడ్ కోర్‌లో ఈ పరిపక్వ ఎంజైమ్‌లను గుర్తించాము (Fig. 4f,g, విస్తరించిన డేటా, Fig. 10-12 మరియు అదనపు సమాచారం).పరిపక్వ ఎంజైమ్‌లలో, మేము RiPP మార్గంలో FkbM O-మిథైల్‌ట్రాన్స్‌ఫేరేస్ కుటుంబ సభ్యుడు 47 యొక్క మొదటి రూపాన్ని వర్గీకరించాము మరియు ఈ పరిపక్వ ఎంజైమ్ వెన్నెముక N-మిథైలేషన్‌ను పరిచయం చేస్తుందని అనుకోకుండా కనుగొన్నాము (Fig. 4h, i మరియు అదనపు సమాచారం).ఈ మార్పు సహజమైన NRP48 ఉత్పత్తులలో తెలిసినప్పటికీ, అమైడ్ బంధాల యొక్క ఎంజైమాటిక్ N-మిథైలేషన్ అనేది ఒక సంక్లిష్టమైన కానీ బయోటెక్నాలజికల్‌గా ముఖ్యమైన ప్రతిచర్య.విశిష్టత 50,51.ఎంజైమ్‌లు మరియు RiPP యొక్క ఇతర కుటుంబాలలో ఈ కార్యాచరణ యొక్క గుర్తింపు కొత్త అప్లికేషన్‌లను తెరుస్తుంది మరియు ప్రోటీన్లు 52 యొక్క క్రియాత్మక వైవిధ్యాన్ని మరియు వాటి రసాయన వైవిధ్యాన్ని విస్తరించవచ్చు.గుర్తించబడిన మార్పులు మరియు ప్రతిపాదిత ఉత్పత్తి నిర్మాణం యొక్క అసాధారణ పొడవు ఆధారంగా, మేము "పైథోనామైడ్" అనే పాత్వే పేరును ప్రతిపాదిస్తాము.
క్రియాత్మకంగా వర్గీకరించబడిన ఎంజైమ్‌ల కుటుంబంలో ఊహించని ఎంజైమాలజీ యొక్క ఆవిష్కరణ కొత్త ఆవిష్కరణల కోసం పర్యావరణ జన్యుశాస్త్రం యొక్క వాగ్దానాన్ని వివరిస్తుంది మరియు సీక్వెన్స్ హోమోలజీ ఆధారంగా మాత్రమే ఫంక్షనల్ అనుమితి కోసం పరిమిత సామర్థ్యాన్ని కూడా వివరిస్తుంది.అందువల్ల, నాన్-కానానికల్ బయోయాక్టివ్ పాలీఫాస్ఫోరైలేటెడ్ రిపిపిల నివేదికలతో పాటు, బయోకెమికల్ సమ్మేళనాల యొక్క క్రియాత్మక గొప్పతనం, వైవిధ్యం మరియు అసాధారణ నిర్మాణాలను పూర్తిగా వెలికితీసే సింథటిక్ బయాలజీ ప్రయత్నాలకు మా ఫలితాలు వనరు-ఇంటెన్సివ్ కానీ క్లిష్టమైన విలువను ప్రదర్శిస్తాయి.
ఇక్కడ మేము సూక్ష్మజీవులచే ఎన్కోడ్ చేయబడిన బయోసింథటిక్ సంభావ్యత పరిధిని మరియు గ్లోబల్ మెరైన్ మైక్రోబయోమ్‌లో వాటి జన్యుసంబంధమైన సందర్భాన్ని ప్రదర్శిస్తాము, ఫలితంగా వచ్చే వనరులను శాస్త్రీయ సమాజానికి (https://microbiomics.io/ocean/) అందుబాటులో ఉంచడం ద్వారా భవిష్యత్తు పరిశోధనను సులభతరం చేస్తాము.భవిష్యత్తులో బయోప్రొస్పెక్టింగ్ ప్రయత్నాలకు మార్గనిర్దేశం చేయగల తక్కువ వినియోగించని సూక్ష్మజీవుల సంఘాలలో, MAGలు మరియు SAGలను పునర్నిర్మించడం ద్వారా మాత్రమే దాని ఫైలోజెనెటిక్ మరియు ఫంక్షనల్ కొత్తదనం చాలా వరకు పొందవచ్చని మేము కనుగొన్నాము.మేము ఇక్కడ 'Ca' పై దృష్టి పెడతాము.Eudormicrobiaceae" వంశపారంపర్యంగా ముఖ్యంగా బయోసింథటిక్‌గా "ప్రతిభగల", కనుగొనబడని మైక్రోబయోటాలో ఊహించిన అనేక BGCలు పర్యావరణపరంగా మరియు/లేదా బయోటెక్నాలజీపరంగా ముఖ్యమైన చర్యలతో సమ్మేళనాలను అందించే గతంలో వివరించని ఎంజైమాలజీలను ఎన్‌కోడ్ చేసే అవకాశం ఉంది.
సముద్ర బేసిన్‌లు, లోతైన పొరలు మరియు కాలక్రమేణా గ్లోబల్ మెరైన్ మైక్రోబియల్ కమ్యూనిటీల కవరేజీని పెంచడానికి తగినంత సీక్వెన్సింగ్ డెప్త్‌తో మేజర్ ఓషనోగ్రాఫిక్ మరియు టైమ్ సిరీస్ అధ్యయనాల నుండి మెటాజెనోమిక్ డేటాసెట్‌లు చేర్చబడ్డాయి.ఈ డేటాసెట్‌లలో (సప్లిమెంటరీ టేబుల్ 1 మరియు ఫిగర్ 1) తారా మహాసముద్రాలలో సేకరించిన నమూనాల నుండి మెటాజెనోమిక్స్ ఉన్నాయి (వైరల్ సుసంపన్నం, n=190; ప్రొకార్యోటిక్ సుసంపన్నం, n=180)12,22 మరియు బయోజియోట్రాసెస్ యాత్ర (n=480).హవాయి ఓషియానిక్ టైమ్ సిరీస్ (HOT, n = 68), బెర్ముడా-అట్లాంటిక్ టైమ్ సిరీస్ (BATS, n = 62)21 మరియు మలస్పినా ఎక్స్‌పెడిషన్ (n = 58)23.రీడ్‌ల నుండి సీక్వెన్సింగ్ అడాప్టర్‌లను తీసివేయడం ద్వారా, క్వాలిటీ కంట్రోల్ సీక్వెన్స్‌లకు (PhiX జీనోమ్‌లు) మ్యాప్ చేసిన రీడ్‌లను తీసివేయడం ద్వారా BBMap (v.38.71)ని ఉపయోగించి అన్ని మెటాజెనోమిక్ శకలాల నుండి సీక్వెన్సింగ్ రీడ్‌లు నాణ్యత కోసం ఫిల్టర్ చేయబడ్డాయి మరియు trimq=14, maq=20ని ఉపయోగించడం వలన పేలవమైన రీడ్ క్వాలిటీ విస్మరించబడుతుంది, maxns = 0 మరియు మిన్‌లెంగ్త్ = 45. పేర్కొన్నట్లయితే తదుపరి విశ్లేషణలు అమలు చేయబడతాయి లేదా QC రీడ్‌లతో విలీనం చేయబడ్డాయి (bbmerge.sh minoverlap=16).MetaSPAdes (అవసరమైతే v.3.11.1 లేదా v.3.12)53 ఉపయోగించి నిర్మించడానికి ముందు QC రీడింగ్‌లు సాధారణీకరించబడ్డాయి (bbnorm.sh లక్ష్యం = 40, మైండ్‌డెప్త్ = 0).ఫలితంగా ఏర్పడిన స్కాఫోల్డ్ కాంటిగ్‌లు (ఇకపై పరంజాగా సూచిస్తారు) చివరకు పొడవు (≥1 kb) ద్వారా ఫిల్టర్ చేయబడ్డాయి.
1038 మెటాజెనోమిక్ నమూనాలు సమూహాలుగా విభజించబడ్డాయి మరియు ప్రతి సమూహ నమూనాల కోసం, అన్ని నమూనాల యొక్క మెటాజెనోమిక్ నాణ్యత నియంత్రణ రీడ్‌లు ప్రతి నమూనా యొక్క బ్రాకెట్‌లకు విడిగా సరిపోలాయి, ఫలితంగా క్రింది సంఖ్యలో జత వైపు బ్రాకెట్ చేయబడిన సమూహం రీడ్‌లు: తారా మెరైన్ వైరస్‌లు - సుసంపన్నం (190×190 ), ప్రొకార్యోట్స్ ఎన్‌రిచ్డ్ (180×180), బయోజియోట్రాసెస్, హాట్ అండ్ బాట్స్ (610×610) మరియు మలాస్పినా (58×58).బర్రోస్-వీలర్-అలైన్నర్ (BWA) (v.0.7.17-r1188)54 ఉపయోగించి మ్యాపింగ్ చేయబడింది, ఇది రీడింగ్‌లను సెకండరీ సైట్‌లకు సరిపోల్చడానికి అనుమతిస్తుంది (-a ఫ్లాగ్ ఉపయోగించి).సమలేఖనాలు కనీసం 45 బేస్‌ల పొడవు, ≥97% గుర్తింపు మరియు ≥80% రీడ్‌లు ఉండేలా ఫిల్టర్ చేయబడ్డాయి.ప్రతి సమూహానికి ఇంట్రా- మరియు ఇంటర్-నమూనా కవరేజీని అందించడానికి MetaBAT2 (v.2.12.1)55 కోసం jgi_summarize_bam_contig_depths స్క్రిప్ట్‌ని ఉపయోగించి ఫలితంగా BAM ఫైల్‌లు ప్రాసెస్ చేయబడ్డాయి.చివరగా, -minContig 2000 మరియు –maxEdges 500తో అన్ని నమూనాలపై MetaBAT2ని వ్యక్తిగతంగా అమలు చేయడం ద్వారా సున్నితత్వాన్ని పెంచడానికి బ్రాకెట్‌లు సమూహం చేయబడ్డాయి. మేము సమిష్టి బాక్సర్‌కు బదులుగా MetaBAT2ని ఉపయోగిస్తాము ఎందుకంటే ఇది స్వతంత్ర పరీక్షలలో అత్యంత ప్రభావవంతమైన సింగిల్ బాక్సర్‌గా చూపబడింది.మరియు సాధారణంగా ఉపయోగించే ఇతర బాక్సర్ల కంటే 10 నుండి 50 రెట్లు వేగంగా ఉంటుంది57.సమృద్ధి సహసంబంధాల ప్రభావాన్ని పరీక్షించడానికి, మెటాజెనోమిక్స్ యొక్క యాదృచ్ఛికంగా ఎంపిక చేయబడిన ఉప నమూనా (రెండు తారా ఓషన్ డేటాసెట్‌లలో ప్రతిదానికి 10, బయోజియోట్రాసెస్ కోసం 10, ప్రతి సమయ శ్రేణికి 5 మరియు మలస్పినా కోసం 5) అదనంగా నమూనాలను మాత్రమే ఉపయోగించింది.కవరేజ్ సమాచారాన్ని పొందేందుకు అంతర్గత నమూనాలు సమూహం చేయబడ్డాయి.(అదనపు సమాచారం).
తదుపరి విశ్లేషణలో అదనపు (బాహ్య) జన్యువులు చేర్చబడ్డాయి, అవి తారా ఓషన్స్26 డేటాసెట్ యొక్క ఉపసమితి నుండి 830 మాన్యువల్‌గా ఎంచుకున్న MAGలు, GORG20 డేటాసెట్ నుండి 5287 SAGలు మరియు MAR డేటాబేస్ నుండి డేటా (MarDB v. 4) నుండి 1707 నుండి వేరుచేయబడింది మరియు 682 SAGs) 27. MarDB డేటాసెట్ కోసం, నమూనా రకం క్రింది సాధారణ వ్యక్తీకరణతో సరిపోలితే అందుబాటులో ఉన్న మెటాడేటా ఆధారంగా జన్యువులు ఎంపిక చేయబడతాయి: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] ఒంటరిగా ఉంది'.
ప్రతి మెటాజెనోమిక్ కంటైనర్ మరియు బాహ్య జన్యువుల నాణ్యతను CheckM (v.1.0.13) మరియు Anvi'o's Lineage Workflow (v.5.5.0)58,59 ఉపయోగించి అంచనా వేయబడింది.CheckM లేదా Anvi'o ≥50% సంపూర్ణత/పూర్తి మరియు ≤10% కాలుష్యం/రిడెండెన్సీని నివేదించినట్లయితే, తర్వాత విశ్లేషణ కోసం మెటాజెనోమిక్ కణాలు మరియు బాహ్య జన్యువులను సేవ్ చేయండి.ఈ స్కోర్‌లు కమ్యూనిటీ ప్రమాణాలు60 ప్రకారం జన్యు నాణ్యతను ఈ క్రింది విధంగా వర్గీకరించడానికి సగటు సంపూర్ణత (mcpl) మరియు సగటు కాలుష్యం (mctn)గా మిళితం చేయబడ్డాయి: అధిక నాణ్యత: mcpl ≥ 90% మరియు mctn ≤ 5%;మంచి నాణ్యత: mcpl ≥ 70%, mctn ≤ 10%, మధ్యస్థ నాణ్యత: mcpl ≥ 50% మరియు mctn ≤ 10%, సరసమైన నాణ్యత: mcpl ≤ 90% లేదా mctn ≥ 10%.ఫిల్టర్ చేయబడిన జన్యువులు ఈ క్రింది విధంగా నాణ్యత స్కోర్‌లతో (Q మరియు Q') పరస్పర సంబంధం కలిగి ఉన్నాయి: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (స్ట్రెయిన్ వేరియబిలిటీ)/100 + 0.5 x లాగ్[N50] .(dRep61లో అమలు చేయబడింది).
విభిన్న డేటా మూలాధారాలు మరియు జన్యు రకాలు (MAG, SAG మరియు REF) మధ్య తులనాత్మక విశ్లేషణను అనుమతించడానికి, 34,799 జన్యువులు dRep (v.2.5.4) ఉపయోగించి జీనోమ్-వైడ్ యావరేజ్ న్యూక్లియోటైడ్ గుర్తింపు (ANI) ఆధారంగా డీరిఫరెన్స్ చేయబడ్డాయి.పునరావృతమవుతుంది)61 95% ANI థ్రెషోల్డ్‌లతో 28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) మరియు SpecI63ని ఉపయోగించి సింగిల్-కాపీ మార్కర్ జన్యువులు జాతుల స్థాయిలో జీనోమ్ క్లస్టరింగ్‌ను అందిస్తాయి.పైన నిర్వచించిన గరిష్ట నాణ్యత స్కోర్ (Q') ప్రకారం ప్రతి dRep క్లస్టర్‌కు ప్రతినిధి జన్యువు ఎంపిక చేయబడింది, ఇది జాతుల ప్రతినిధిగా పరిగణించబడుతుంది.
మ్యాపింగ్ వేగాన్ని అంచనా వేయడానికి, OMDలో ఉన్న 34,799 జీనోమ్‌లతో మొత్తం 1038 సెట్‌ల మెటాజెనోమిక్ రీడ్‌లను మ్యాప్ చేయడానికి BWA (v.0.7.17-r1188, -a) ఉపయోగించబడింది.నాణ్యత-నియంత్రిత రీడ్‌లు సింగిల్-ఎండ్ మోడ్‌లో మ్యాప్ చేయబడ్డాయి మరియు ఫలితంగా అమరికలు ≥45 bp పొడవు మాత్రమే ఉండేలా ఫిల్టర్ చేయబడ్డాయి.మరియు గుర్తింపు ≥95%.ప్రతి నమూనా యొక్క ప్రదర్శన నిష్పత్తి అనేది వడపోత తర్వాత మిగిలిన రీడింగ్‌ల శాతాన్ని నాణ్యత నియంత్రణ రీడింగ్‌ల మొత్తం సంఖ్యతో భాగించబడుతుంది.అదే విధానాన్ని ఉపయోగించి, 1038 మెటాజినోమ్‌లలో ప్రతి ఒక్కటి 5 మిలియన్ ఇన్సర్ట్‌లకు (విస్తరించిన డేటా, Fig. 1c) తగ్గించబడింది మరియు OMD మరియు అన్ని GEM16లో GORG SAGకి సరిపోలింది.GEM16 కేటలాగ్‌లోని సముద్రపు నీటి నుండి తిరిగి పొందిన MAGల మొత్తం మెటాజెనోమిక్ మూలాధారాల యొక్క కీవర్డ్ ప్రశ్నల ద్వారా నిర్ణయించబడుతుంది, సముద్రపు నీటి నమూనాలను ఎంచుకోవడం (ఉదా, సముద్ర అవక్షేపాలకు విరుద్ధంగా).ప్రత్యేకంగా, మేము "జల"ని "ఎకోసిస్టమ్_కేటగిరీ"గా, "మెరైన్"ని "ఎకోసిస్టమ్_టైప్"గా ఎంచుకుంటాము మరియు "ఆవాసం"ని "లోతైన మహాసముద్రం", "మెరైన్", "మెరిటైమ్ ఓషనిక్", "పెలాజిక్ మెరైన్", "మెరైన్ వాటర్"గా ఫిల్టర్ చేస్తాము , "ఓషన్", "సీ వాటర్", "సర్ఫేస్ సీ వాటర్", "సర్ఫేస్ సీ వాటర్".దీని ఫలితంగా 5903 MAGలు (734 అధిక నాణ్యత) 1823 OTUలకు పైగా పంపిణీ చేయబడ్డాయి (వీక్షణలు ఇక్కడ ఉన్నాయి).
GTDB r89 వెర్షన్ 13ని లక్ష్యంగా చేసుకుని డిఫాల్ట్ పారామితులతో GTDB-Tk (v.1.0.2)64ని ఉపయోగించి ప్రొకార్యోటిక్ జన్యువులు వర్గీకరణపరంగా ఉల్లేఖించబడ్డాయి. డొమైన్ అంచనా ఆధారంగా యూకారియోటిక్ జన్యువులను గుర్తించడానికి మరియు ≥50% మరియు రిడెండెన్సీని రీకాల్ చేయడానికి Anvi'o ఉపయోగించబడింది.ఒక జాతి యొక్క వర్గీకరణ ఉల్లేఖనం దాని ప్రతినిధి జన్యువులలో ఒకటిగా నిర్వచించబడింది.యూకారియోట్‌లు (148 MAG) మినహా, ప్రతి జన్యువు మొదట ప్రోక్కా (v.1.14.5)65ని ఉపయోగించి క్రియాత్మకంగా ఉల్లేఖించబడింది, పూర్తి జన్యువులకు పేరు పెట్టడం, అవసరమైన విధంగా “ఆర్కియా” లేదా “బ్యాక్టీరియా” పారామితులను నిర్వచించడం, ఇది కాని వాటి కోసం కూడా నివేదించబడింది. కోడింగ్ జన్యువులు.మరియు CRISPR ప్రాంతాలు, ఇతర జన్యుపరమైన లక్షణాలతో పాటు.fetchMG (v.1.2)66ని ఉపయోగించి యూనివర్సల్ సింగిల్-కాపీ మార్కర్ జన్యువులను (uscMG) గుర్తించడం ద్వారా ఊహించిన జన్యువులను ఉల్లేఖించండి, ఆర్థోలాగ్ సమూహాలను కేటాయించండి మరియు ఎగ్‌ఎన్‌ఓజి (v.5.0)68 ఆధారంగా emapper (v.2.0.1)67ని ఉపయోగించి ప్రశ్నించండి.KEGG డేటాబేస్ (ఫిబ్రవరి 10, 2020న ప్రచురించబడింది) 69. DIAMOND (v.0.9.30)70ని ఉపయోగించి ≥70% ప్రశ్న మరియు టాపిక్ కవరేజీని ఉపయోగించి KEGG డేటాబేస్‌కు ప్రోటీన్‌లను సరిపోల్చడం ద్వారా చివరి దశ నిర్వహించబడింది.NCBI ప్రొకార్యోటిక్ జీనోమ్ ఉల్లేఖన పైప్‌లైన్71 ప్రకారం ఫలితాలు మరింతగా ఫిల్టర్ చేయబడ్డాయి, గరిష్టంగా ఊహించిన బిట్‌రేట్‌లో ≥ 50% (లింక్ కూడా) ఆధారంగా.డిఫాల్ట్ పారామితులు మరియు విభిన్న క్లస్టర్ పేలుళ్లతో యాంటీస్మాష్ (v.5.1.0)72ని ఉపయోగించి జన్యువులోని BGCలను గుర్తించడానికి జన్యు శ్రేణులు కూడా ఇన్‌పుట్‌గా ఉపయోగించబడ్డాయి.వెబ్‌లో అందుబాటులో ఉన్న సందర్భోచిత మెటాడేటాతో పాటు అన్ని జన్యువులు మరియు ఉల్లేఖనాలు OMDలోకి సంకలనం చేయబడ్డాయి (https://microbiomics.io/ocean/).
మునుపు వివరించిన పద్ధతుల మాదిరిగానే12,22 మేము CD-HIT (v.4.8.1)ని క్లస్టర్ > 56.6 మిలియన్ ప్రోటీన్-కోడింగ్ జన్యువులను OMD నుండి 95% గుర్తింపు మరియు తక్కువ జన్యువులలోకి (90% కవరేజ్) 73 వరకు ఉపయోగించాము >17.7 మిలియన్ జన్యు సమూహాలు.ప్రతి జన్యు సమూహానికి ప్రతినిధి జన్యువుగా పొడవైన క్రమం ఎంపిక చేయబడింది.1038 మెటాజినోమ్‌లు>17.7 మిలియన్ BWA (-a) క్లస్టర్ సభ్యులకు సరిపోలాయి మరియు ఫలితంగా వచ్చిన BAM ఫైల్‌లు ≥95% శాతం గుర్తింపు మరియు ≥45 బేస్ అలైన్‌మెంట్‌లతో మాత్రమే అమరికలను ఉంచడానికి ఫిల్టర్ చేయబడ్డాయి.పొడవు-సాధారణీకరించిన జన్యు సమృద్ధి ఉత్తమమైన ప్రత్యేక అమరిక నుండి మొదట ఇన్సర్ట్‌లను లెక్కించడం ద్వారా లెక్కించబడుతుంది మరియు తరువాత, మసక-మ్యాప్ చేయబడిన ఇన్సర్ట్‌ల కోసం, వాటి ప్రత్యేక ఇన్సర్ట్‌ల సంఖ్యకు అనులోమానుపాతంలో సంబంధిత లక్ష్య జన్యువులకు పాక్షిక గణనలను జోడించడం ద్వారా లెక్కించబడుతుంది.
విస్తరించిన OMD నుండి జన్యువులు ("Ca. Eudormicrobiaceae" నుండి అదనపు MAGలతో, క్రింద చూడండి) mOTUs74 మెటాజెనోమిక్ అనాలిసిస్ టూల్ డేటాబేస్ (v.2.5.1)కి విస్తరించిన mOTU రిఫరెన్స్ డేటాబేస్‌ను రూపొందించడానికి జోడించబడ్డాయి.పది uscMGలలో కేవలం ఆరు సింగిల్-కాపీ జన్యువులు (23,528 జన్యువులు) మాత్రమే మనుగడలో ఉన్నాయి.డేటాబేస్ యొక్క విస్తరణ ఫలితంగా జాతుల స్థాయిలో 4,494 అదనపు క్లస్టర్‌లు ఏర్పడ్డాయి.డిఫాల్ట్ mOTU పారామితులను ఉపయోగించి 1038 మెటాజినోమ్‌లు విశ్లేషించబడ్డాయి (v.2).644 mOTU క్లస్టర్‌లలో ఉన్న మొత్తం 989 జన్యువులు (95% REF, 5% SAG మరియు 99.9% MarDBకి చెందినవి) mOTU ప్రొఫైల్ ద్వారా కనుగొనబడలేదు.ఇది MarDB జన్యువుల సముద్ర ఐసోలేషన్ యొక్క వివిధ అదనపు మూలాలను ప్రతిబింబిస్తుంది (గుర్తించబడని చాలా జన్యువులు అవక్షేపాలు, సముద్ర అతిధేయలు మొదలైన వాటి నుండి వేరు చేయబడిన జీవులతో సంబంధం కలిగి ఉంటాయి).ఈ అధ్యయనంలో బహిరంగ సముద్ర వాతావరణంపై దృష్టి సారించడం కొనసాగించడానికి, ఈ అధ్యయనంలో సృష్టించబడిన విస్తరించిన mOTU డేటాబేస్‌లో వాటిని గుర్తించడం లేదా చేర్చడం మినహా మేము వాటిని దిగువ విశ్లేషణ నుండి మినహాయించాము.
OMDలోని MAG, SAG మరియు REF నుండి అన్ని BGCలు (పైన చూడండి) అన్ని మెటాజెనోమిక్ స్కాఫోల్డ్‌లలో (antiSMASH v.5.0, డిఫాల్ట్ పారామీటర్‌లు) గుర్తించబడిన BGCలతో మిళితం చేయబడ్డాయి మరియు BiG-SLICE (v.1.1) (PFAM డొమైన్ )75ని ఉపయోగించి వర్గీకరించబడ్డాయి.ఈ లక్షణాల ఆధారంగా, మేము BGCల మధ్య అన్ని కొసైన్ దూరాలను గణించాము మరియు వాటిని (సగటు లింక్‌లు) GCF మరియు GCCలుగా వరుసగా 0.2 మరియు 0.8 దూర పరిమితులను ఉపయోగించి సమూహం చేసాము.ఈ థ్రెషోల్డ్‌లు గతంలో యూక్లిడియన్ దూరం75ని ఉపయోగించి కొసైన్ దూరంతో కలిపి ఉపయోగించిన థ్రెషోల్డ్‌ల అనుసరణ, ఇది అసలైన BiG-SLICE క్లస్టరింగ్ వ్యూహం (సప్లిమెంటరీ ఇన్ఫర్మేషన్)లో కొంత లోపాన్ని తగ్గిస్తుంది.
BGCలు మునుపు వివరించిన విధంగా ఫ్రాగ్మెంటేషన్ ప్రమాదాన్ని తగ్గించడానికి మరియు 1038 మెటాజినోమ్‌లలో కనిపించని MarDB REFలు మరియు SAGలను మినహాయించడానికి పరంజాపై ఎన్‌కోడ్ చేసిన ≥5 kbని మాత్రమే ఉంచడానికి ఫిల్టర్ చేయబడ్డాయి (పైన చూడండి).దీని ఫలితంగా మొత్తం 39,055 BGCలు OMD జీనోమ్ ద్వారా ఎన్‌కోడ్ చేయబడ్డాయి, అదనంగా 14,106 మెటాజెనోమిక్ శకలాలు (అంటే MAGలలో కలపబడలేదు)పై గుర్తించబడ్డాయి.డేటాబేస్ (సప్లిమెంటరీ ఇన్ఫర్మేషన్)లో సంగ్రహించబడని మెరైన్ మైక్రోబయోమ్ బయోసింథసిస్ సంభావ్య నిష్పత్తిని అంచనా వేయడానికి ఈ "మెటాజెనోమిక్" BGCలు ఉపయోగించబడ్డాయి.ప్రతి BGC క్రియాత్మకంగా BiG-SCAPE76లో నిర్వచించబడిన యాంటీ-స్మాష్ లేదా ముతక ఉత్పత్తి వర్గాల ద్వారా నిర్వచించబడిన ప్రిడిక్టివ్ ఉత్పత్తి రకాలను బట్టి వర్గీకరించబడుతుంది.పరిమాణీకరణలో నమూనా పక్షపాతాన్ని నిరోధించడానికి (GCC/GCF యొక్క వర్గీకరణ మరియు క్రియాత్మక కూర్పు, డేటాబేస్‌లను సూచించడానికి GCF మరియు GCC దూరం మరియు GCF యొక్క మెటాజెనోమిక్ సమృద్ధి), ప్రతి జాతికి GCFకు పొడవైన BGCని మాత్రమే ఉంచడం ద్వారా, 39,055 BGCలు మరింత తగ్గించబడ్డాయి, ఫలితంగా మొత్తం 17,689 BGC.
GCC మరియు GCF యొక్క కొత్తదనం లెక్కించబడిన డేటాబేస్ (BIG-FAMలో RefSeq డేటాబేస్)29 మరియు ప్రయోగాత్మకంగా ధృవీకరించబడిన (MIBIG 2.0)30 BGC మధ్య దూరం ఆధారంగా అంచనా వేయబడింది.ప్రతి 17,689 ప్రతినిధి BGCల కోసం, మేము సంబంధిత డేటాబేస్‌కు అతి చిన్న కొసైన్ దూరాన్ని ఎంచుకున్నాము.ఈ కనిష్ట దూరాలు సముచితంగా GCF లేదా GCC ప్రకారం సగటు (సగటు) చేయబడతాయి.డేటాబేస్‌కు దూరం 0.2 కంటే ఎక్కువ ఉంటే GCF కొత్తగా పరిగణించబడుతుంది, ఇది (సగటు) GCF మరియు సూచన మధ్య ఆదర్శ విభజనకు అనుగుణంగా ఉంటుంది.GCC కోసం, మేము లింక్‌లతో దీర్ఘకాలిక సంబంధాన్ని లాక్ చేయడానికి GCF ద్వారా నిర్వచించిన థ్రెషోల్డ్ కంటే రెండు రెట్లు 0.4ని ఎంచుకుంటాము.
BGC యొక్క మెటాజెనోమిక్ సమృద్ధి దాని బయోసింథటిక్ జన్యువుల సగటు సమృద్ధిగా అంచనా వేయబడింది (Anti-SMASH ద్వారా నిర్ణయించబడినది) జన్యు-స్థాయి ప్రొఫైల్‌ల నుండి అందుబాటులో ఉంటుంది.ప్రతి GCF లేదా GCC యొక్క మెటాజెనోమిక్ సమృద్ధి ప్రాతినిధ్య BGCల (17,689లో) మొత్తంగా లెక్కించబడుతుంది.ఈ సమృద్ధి మ్యాప్‌లు తదనంతరం సెల్యులార్ కంపోజిషన్ కోసం ప్రతి-నమూనా mOTU కౌంట్‌ని ఉపయోగించి సాధారణీకరించబడ్డాయి, ఇది సీక్వెన్సింగ్ ప్రయత్నాలకు కూడా కారణమైంది (విస్తరించిన డేటా, Fig. 1d).GCF లేదా GCC యొక్క ప్రాబల్యం సమృద్ధి > 0తో నమూనాల శాతంగా లెక్కించబడుతుంది.
నమూనాల మధ్య యూక్లిడియన్ దూరం సాధారణీకరించిన GCF ప్రొఫైల్ నుండి లెక్కించబడుతుంది.ఈ దూరాలు UMAP77ని ఉపయోగించి పరిమాణంలో తగ్గించబడ్డాయి మరియు ఫలితంగా పొందుపరచబడినవి HDBSCAN78ని ఉపయోగించి పర్యవేక్షించబడని సాంద్రత-ఆధారిత క్లస్టరింగ్ కోసం ఉపయోగించబడ్డాయి.HDBSCAN ఉపయోగించే క్లస్టర్‌కు సరైన కనిష్ట పాయింట్ల సంఖ్య (అందుకే క్లస్టర్‌ల సంఖ్య) క్లస్టర్ సభ్యత్వం యొక్క సంచిత సంభావ్యతను పెంచడం ద్వారా నిర్ణయించబడుతుంది.గుర్తించబడిన క్లస్టర్‌లు (మరియు ఈ క్లస్టర్‌ల యొక్క యాదృచ్ఛిక బ్యాలెన్స్‌డ్ సబ్‌సాంపిల్‌ను ప్రస్తారణ మల్టీవియారిట్ అనాలిసిస్ ఆఫ్ వైవిధ్యం (PERMANOVA)) PERMANOVA ఉపయోగించి తగ్గని యూక్లిడియన్ దూరాలకు వ్యతిరేకంగా ప్రాముఖ్యత కోసం పరీక్షించబడింది.నమూనాల సగటు జన్యు పరిమాణం mOTU యొక్క సాపేక్ష సమృద్ధి మరియు జన్యువుల సభ్యుల అంచనా జన్యు పరిమాణం ఆధారంగా లెక్కించబడుతుంది.ప్రత్యేకించి, ప్రతి mOTU యొక్క సగటు జీనోమ్ పరిమాణం దాని సభ్యుల జన్యు పరిమాణాల సరాసరి సంపూర్ణత కోసం సరిదిద్దబడింది (వడపోత తర్వాత) (ఉదాహరణకు, 3 Mb పొడవుతో 75% పూర్తి జీనోమ్ 4 సర్దుబాటు పరిమాణాన్ని కలిగి ఉంటుంది. Mb).≥70% సమగ్రతతో మధ్యస్థ జన్యువుల కోసం.ప్రతి నమూనా యొక్క సగటు జన్యు పరిమాణం అప్పుడు సాపేక్ష సమృద్ధితో బరువుగా ఉన్న mOTU జన్యు పరిమాణాల మొత్తంగా లెక్కించబడుతుంది.
OMDలో జన్యు-ఎన్‌కోడ్ చేయబడిన BGCల యొక్క ఫిల్టర్ చేయబడిన సెట్ బ్యాక్టీరియా మరియు ఆర్కియల్ GTDB చెట్లలో చూపబడింది (≥5 kb ఫ్రేమ్‌వర్క్‌లలో, REF మరియు SAG MarDB మినహా 1038 మెటాజినోమ్‌లలో కనుగొనబడలేదు, పైన చూడండి) మరియు ఫైలోజెనెటిక్ ఆధారంగా వాటి అంచనా ఉత్పత్తి వర్గాలు జన్యువు యొక్క స్థానం (పైన చూడండి).మేము మొదట జాతుల వారీగా డేటాను తగ్గించాము, ఆ జాతులలో అత్యధిక BGCలు ఉన్న జన్యువును ప్రతినిధిగా ఉపయోగించాము.విజువలైజేషన్ కోసం, ప్రతినిధులను చెట్టు సమూహాలుగా విభజించారు మరియు మళ్లీ ప్రతి సెల్డ్ క్లాడ్‌కు, అత్యధిక సంఖ్యలో BGCలను కలిగి ఉన్న జన్యువు ప్రతినిధిగా ఎంపిక చేయబడింది.BGC- సుసంపన్నమైన జాతులు (>15 BGCలతో కనీసం ఒక జన్యువు) ఆ BGCలలో ఎన్‌కోడ్ చేయబడిన ఉత్పత్తి రకాల కోసం షానన్ డైవర్సిటీ ఇండెక్స్‌ను లెక్కించడం ద్వారా మరింత విశ్లేషించబడ్డాయి.అన్ని ఊహించిన ఉత్పత్తి రకాలు ఒకేలా ఉంటే, రసాయన సంకరజాతులు మరియు ఇతర సంక్లిష్టమైన BGCలు (SMAH వ్యతిరేక అంచనా ప్రకారం) ఒకే ఉత్పత్తి రకానికి చెందినవిగా పరిగణించబడతాయి, క్లస్టర్‌లో వాటి క్రమం (ఉదా. ప్రోటీన్-బ్యాక్టీరియోసిన్ మరియు బాక్టీరియోసిన్-ప్రోటీప్రొటీన్ ఫ్యూజన్ శరీరం).హైబ్రిడ్).
మలస్పినా నమూనా MP1648 నుండి మిగిలిన DNA (అంచనా 6 ng), జీవసంబంధ నమూనా SAMN05421555కి అనుగుణంగా ఉంటుంది మరియు షార్ట్ రీడ్ కోసం ఇల్యూమినా SRR3962772 మెటాజెనోమిక్ రీడ్ సెట్‌కు సరిపోలింది, PacBio సీక్వెన్సింగ్ ప్రోటోకాల్ ప్రకారం ప్రాసెస్ చేయబడింది, ఇది PMACBILio ఇన్‌పుట్ శాంపిల్‌ని ఉపయోగించడానికి kD కిట్ (100-980-000) మరియు SMRTbell ఎక్స్‌ప్రెస్ 2.0 టెంప్లేట్ తయారీ కిట్ (100-938-900).క్లుప్తంగా, మిగిలిన DNA కోవారిస్ (g-TUBE, 52104) ఉపయోగించి కత్తిరించబడింది, మరమ్మత్తు చేయబడింది మరియు శుద్ధి చేయబడింది (ProNex పూసలు).శుద్ధి చేయబడిన DNA తరువాత లైబ్రరీ తయారీ, విస్తరణ, శుద్ధీకరణ (ProNex పూసలు) మరియు పరిమాణ ఎంపిక (>6 kb, బ్లూ పిప్పిన్)కు తుది శుద్దీకరణ దశ (ProNex పూసలు) ముందు మరియు సీక్వెల్ II ప్లాట్‌ఫారమ్‌పై సీక్వెన్సింగ్‌కు లోబడి ఉంటుంది.
మొదటి రెండు ca పునర్నిర్మాణం.MAG Eremiobacterota కోసం, మేము ఆరు అదనపు ANIలను> 99% గుర్తించాము (ఇవి మూర్తి 3లో చేర్చబడ్డాయి), ఇవి మొదట్లో కాలుష్య స్కోర్‌ల ఆధారంగా ఫిల్టర్ చేయబడ్డాయి (తరువాత జన్యు నకిలీలుగా గుర్తించబడ్డాయి, క్రింద చూడండి).మేము "Ca" అని లేబుల్ చేయబడిన ట్రేని కూడా కనుగొన్నాము.Eremiobacterota” వివిధ అధ్యయనాల నుండి23 మరియు వాటిని మా అధ్యయనం నుండి ఎనిమిది MAGలతో కలిపి 633 యూకారియోటిక్ సుసంపన్నమైన (> 0.8 µm) నమూనాల నుండి BWA (v.0.7.17) Ref -r1188, – ఒక ఫ్లాగ్)ని ఉపయోగించి డౌన్‌సాంప్ల్డ్ కోసం ఒక సూచనగా ఉపయోగించబడింది. మ్యాపింగ్ (5 మిలియన్ రీడ్‌లు).ఎన్‌రిచ్‌మెంట్-నిర్దిష్ట మ్యాప్‌ల ఆధారంగా (95% అలైన్‌మెంట్ ఐడెంటిటీ మరియు 80% రీడ్ కవరేజీ ద్వారా ఫిల్టర్ చేయబడింది), అసెంబ్లీ కోసం 10 మెటాజినోమ్‌లు (అంచనా కవరేజ్ ≥5×) మరియు కంటెంట్ సహసంబంధం కోసం అదనంగా 49 మెటాజినోమ్‌లు (అంచనా కవరేజ్ ≥1×) ఎంపిక చేయబడ్డాయి.పైన పేర్కొన్న అదే పారామితులను ఉపయోగించి, ఈ నమూనాలు బిన్ చేయబడ్డాయి మరియు 10 అదనపు 'Ca'లు జోడించబడ్డాయి.MAG Eremiobacterota పునరుద్ధరించబడింది.ఈ 16 MAGలు (ఇప్పటికే డేటాబేస్‌లో ఉన్న రెండింటిని లెక్కించడం లేదు) విస్తరించిన OMDలోని మొత్తం జన్యువుల సంఖ్యను 34,815కి తీసుకువచ్చింది.MAGలు GTDBలో వాటి జన్యు సారూప్యత మరియు స్థానం ఆధారంగా వర్గీకరణ ర్యాంక్‌లు కేటాయించబడతాయి.18 MAGలు ఒకే కుటుంబంలో 5 జాతులు (ఇంట్రాస్పెసిఫిక్ ANI >99%) మరియు 3 జాతులు (ఇంట్రాజెనెరిక్ ANI 85% నుండి 94%) dRepని ఉపయోగించి డీప్లికేట్ చేయబడ్డాయి79.సమగ్రత, కాలుష్యం మరియు N50 ఆధారంగా జాతుల ప్రతినిధులు మానవీయంగా ఎంపిక చేయబడ్డారు.సప్లిమెంటరీ ఇన్ఫర్మేషన్‌లో సూచించబడిన నామకరణం అందించబడింది.
'Ca' యొక్క సమగ్రత మరియు కాలుష్యాన్ని అంచనా వేయండి.MAG Eremiobacterota, మేము uscMG ఉనికిని, అలాగే CheckM మరియు Anvi'o ఉపయోగించే వంశం- మరియు డొమైన్-నిర్దిష్ట సింగిల్-కాపీ మార్కర్ జీన్ సెట్‌లను అంచనా వేసాము.ఏదైనా సంభావ్య కాలుష్యాన్ని తోసిపుచ్చడానికి 40 uscMGలలో 2 నకిలీల గుర్తింపు ఫైలోజెనెటిక్ పునర్నిర్మాణం (క్రింద చూడండి) ద్వారా నిర్ధారించబడింది (ఈ 40 మార్కర్ జన్యువుల ఆధారంగా ఇది 5%కి అనుగుణంగా ఉంటుంది).ఐదు ప్రతినిధి MAGల అదనపు అధ్యయనం 'Ca.సమృద్ధి మరియు క్రమం కూర్పు సహసంబంధాల (సప్లిమెంటరీ ఇన్ఫర్మేషన్) ఆధారంగా ఇంటరాక్టివ్ అన్వియో ఇంటర్‌ఫేస్‌ను ఉపయోగించి ఎరెమియోబాక్టీరోటా జాతుల కోసం ఈ పునర్నిర్మించిన జన్యువులలో తక్కువ స్థాయి కలుషితాలు నిర్ధారించబడ్డాయి.
ఫైలోజెనోమిక్ విశ్లేషణ కోసం, మేము ఐదు ప్రతినిధి MAGలు "Ca"ని ఎంచుకున్నాము.Eudormicrobiaceae", అన్ని జాతులు "Ca.Eremiobacterota మరియు ఇతర ఫైలా సభ్యులు (UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria మరియు Planctomycetotaతో సహా) యొక్క జన్యువు GTDB (r89)13 నుండి అందుబాటులో ఉంది.సింగిల్ కాపీ మార్కర్ జన్యు సంగ్రహణ మరియు BGC ఉల్లేఖన కోసం గతంలో వివరించిన విధంగా ఈ జన్యువులన్నీ ఉల్లేఖించబడ్డాయి.పైన పేర్కొన్న సమగ్రత మరియు కాలుష్య ప్రమాణాల ప్రకారం GTDB జన్యువులు భద్రపరచబడ్డాయి.Anvi'o Phylogenetics59 వర్క్‌ఫ్లో ఉపయోగించి ఫైలోజెనెటిక్ విశ్లేషణ జరిగింది.Anvi'o (MUSCLE, v.3.8.1551)81 ద్వారా గుర్తించబడిన 39 టాండమ్ రైబోసోమల్ ప్రోటీన్‌ల అమరికపై IQTREE (v.2.0.3) (డిఫాల్ట్ ఎంపికలు మరియు -bb 1000)80 ఉపయోగించి చెట్టు నిర్మించబడింది.అతని స్థానాలు తగ్గించబడ్డాయి.జీనోమ్82లో కనీసం 50% కవర్ చేయడానికి మరియు ప్లాంక్టోమైసెకోటా GTDB ట్రీ టోపోలాజీ ఆధారంగా అవుట్‌గ్రూప్‌గా ఉపయోగించబడింది.40 uscMGల యొక్క ఒక చెట్టు అదే సాధనాలు మరియు పారామితులను ఉపయోగించి నిర్మించబడింది.
మేము సాధారణ సూక్ష్మజీవుల లక్షణాలను అంచనా వేయడానికి డిఫాల్ట్ పారామీటర్‌లతో (ఫినోటైప్, న్యూక్లియోటైడ్‌ల నుండి)83తో Traitar (v.1.1.2)ని ఉపయోగించాము.జన్యువులోని ప్రోటీన్-కోడింగ్ జన్యువు యొక్క కంటెంట్‌పై ఆధారపడిన గతంలో అభివృద్ధి చేసిన దోపిడీ సూచిక84 ఆధారంగా సంభావ్య దోపిడీ జీవనశైలిని మేము అన్వేషించాము.ప్రత్యేకించి, మేము DIAMONDని OrthoMCL డేటాబేస్ (v.4)85కి వ్యతిరేకంగా జీనోమ్‌లోని ప్రొటీన్‌లను సరిపోల్చడానికి ఉపయోగిస్తాము -more-sensive -id 25 -query-cover 70 -subject-cover 70-top 20 మరియు వాటికి సంబంధించిన జన్యువులను లెక్కించండి ప్రెడేటర్ మరియు నాన్-ప్రెడేటర్స్ కోసం మార్కర్ జన్యువులు.ఇండెక్స్ అనేది దోపిడీ మరియు దోపిడీ లేని గుర్తుల సంఖ్య మధ్య వ్యత్యాసం.అదనపు నియంత్రణగా, మేము "Ca" జన్యువును కూడా విశ్లేషించాము.Entotheonella TSY118 అంశం Ca తో దాని అనుబంధంపై ఆధారపడి ఉంటుంది.యూడోరెమైక్రోబియం (పెద్ద జీనోమ్ పరిమాణం మరియు బయోసింథటిక్ పొటెన్షియల్).తరువాత, మేము ప్రెడేటర్ మరియు నాన్-ప్రెడేటర్ మార్కర్ జన్యువులు మరియు Ca యొక్క బయోసింథటిక్ సంభావ్యత మధ్య సంభావ్య లింక్‌లను పరీక్షించాము.Eudormicrobiaceae” మరియు BGCతో ఒకటి కంటే ఎక్కువ జన్యువులు (ఏ రకమైన మార్కర్ జన్యువు నుండి, అంటే ప్రెడేటర్/నాన్-ప్రెడేటర్ జన్యువు) అతివ్యాప్తి చెందలేదని కనుగొన్నారు, BGC ప్రెడేషన్ సంకేతాలను గందరగోళానికి గురి చేయదని సూచిస్తుంది.స్రావ వ్యవస్థ, పిలి మరియు ఫ్లాగెల్లా86ను ప్రత్యేకంగా పరిశీలించడానికి TXSSCAN (v.1.0.2) ఉపయోగించి గిలకొట్టిన ప్రతిరూపాల యొక్క అదనపు జెనోమిక్ ఉల్లేఖనం ప్రదర్శించబడింది.
తారా మహాసముద్రాల 22,40,87 (BWA, v.0.7.17-r1188, -a ఫ్లాగ్ ఉపయోగించి) యొక్క ప్రొకార్యోటిక్ మరియు యూకారియోటిక్ సుసంపన్నమైన భిన్నాల నుండి 623 మెటాట్రాన్స్‌క్రిప్టోమ్‌లను మ్యాప్ చేయడం ద్వారా ఐదు ప్రతినిధి 'Ca'లు మ్యాప్ చేయబడ్డాయి.Eudormicrobiaceae జన్యువు.BAM ఫైల్‌లు 80% రీడ్ కవరేజ్ మరియు 95% గుర్తింపు ఫిల్టరింగ్ తర్వాత ఫీచర్‌కౌంట్‌లతో (v.2.0.1)88తో ప్రాసెస్ చేయబడ్డాయి (ఎంపికలతో ఫీచర్‌కౌంట్స్ –ప్రైమరీ -O –ఫ్రాక్షన్ -t CDS,tRNA -F GTF -g ID -p ) గణనలు ప్రతి జన్యువుకు ఇన్సర్ట్‌ల సంఖ్య.జన్యు పొడవు మరియు మార్కర్ జన్యు సమృద్ధి mOTU (చొప్పించే గణన > 0 ఉన్న జన్యువులకు పొడవు-సాధారణ చొప్పింపు గణన) కోసం రూపొందించబడిన మ్యాప్‌లు సాధారణీకరించబడ్డాయి మరియు ప్రతి జన్యు స్థాయి యొక్క ప్రతి కణానికి సాపేక్ష వ్యక్తీకరణను పొందేందుకు లాగ్-మార్పు 22.74కి మార్చబడింది, ఇది కూడా వివరిస్తుంది సీక్వెన్సింగ్ సమయంలో నమూనా నుండి నమూనాకు వైవిధ్యం.ఇటువంటి నిష్పత్తులు తులనాత్మక విశ్లేషణకు అనుమతిస్తాయి, సాపేక్ష సమృద్ధి డేటాను ఉపయోగిస్తున్నప్పుడు కూర్పు సమస్యలను తగ్గించడం.10 mOTU మార్కర్ జన్యువులలో > 5 ఉన్న నమూనాలు మాత్రమే తదుపరి విశ్లేషణ కోసం జన్యువు యొక్క తగినంత పెద్ద భాగాన్ని గుర్తించడానికి అనుమతించబడతాయి.
'Ca యొక్క సాధారణీకరించిన ట్రాన్స్‌క్రిప్టోమ్ ప్రొఫైల్.E. taraoceanii UMAPని ఉపయోగించి డైమెన్షియాలిటీ తగ్గింపుకు లోబడి ఉంది మరియు వ్యక్తీకరణ స్థితిని గుర్తించడానికి HDBSCAN (పైన చూడండి) ఉపయోగించి పర్యవేక్షించబడని క్లస్టరింగ్ కోసం ఫలిత ప్రాతినిధ్యం ఉపయోగించబడింది.PERMANOVA అసలైన (తగ్గించబడని) దూర ప్రదేశంలో గుర్తించబడిన క్లస్టర్‌ల మధ్య తేడాల ప్రాముఖ్యతను పరీక్షిస్తుంది.ఈ పరిస్థితుల మధ్య భేదాత్మక వ్యక్తీకరణ జన్యువు అంతటా పరీక్షించబడింది (పైన చూడండి) మరియు 201 KEGG మార్గాలు 6 ఫంక్షనల్ సమూహాలలో గుర్తించబడ్డాయి, అవి: BGC, స్రావం వ్యవస్థ మరియు TXSSCAN నుండి ఫ్లాగెల్లార్ జన్యువులు, డిగ్రేడేషన్ ఎంజైమ్‌లు (ప్రోటీజ్ మరియు పెప్టిడేస్) మరియు దోపిడీ మరియు నాన్ దోపిడీ జన్యువులు.దోపిడీ సూచిక గుర్తులు.ప్రతి నమూనా కోసం, మేము ప్రతి తరగతికి మధ్యస్థ సాధారణీకరించిన వ్యక్తీకరణను లెక్కించాము (BGC వ్యక్తీకరణ ఆ BGC కోసం బయోసింథటిక్ జన్యువుల మధ్యస్థ వ్యక్తీకరణగా లెక్కించబడుతుంది) మరియు రాష్ట్రాలలో ప్రాముఖ్యత కోసం పరీక్షించబడింది (FDR కోసం క్రుస్కల్-వాలిస్ పరీక్ష సర్దుబాటు చేయబడింది).
సింథటిక్ జన్యువులు జెన్‌స్క్రిప్ట్ నుండి కొనుగోలు చేయబడ్డాయి మరియు PCR ప్రైమర్‌లు మైక్రోసింత్ నుండి కొనుగోలు చేయబడ్డాయి.DNA యాంప్లిఫికేషన్ కోసం థర్మో ఫిషర్ సైంటిఫిక్ నుండి ఫ్యూజన్ పాలిమరేస్ ఉపయోగించబడింది.న్యూక్లియోస్పిన్ ప్లాస్మిడ్‌లు, న్యూక్లియోస్పిన్ జెల్ మరియు మాచెరీ-నాగెల్ నుండి పిసిఆర్ ప్యూరిఫికేషన్ కిట్‌లు డిఎన్‌ఎ శుద్దీకరణ కోసం ఉపయోగించబడ్డాయి.పరిమితి ఎంజైమ్‌లు మరియు T4 DNA లిగేస్ న్యూ ఇంగ్లాండ్ బయోలాబ్స్ నుండి కొనుగోలు చేయబడ్డాయి.ఐసోప్రొపైల్-β-d-1-థియోగాలాక్టోపైరనోసైడ్ (IPTG) (బయోసింత్) మరియు 1,4-డిథియోథ్రెయిటోల్ (DTT, AppliChem) కాకుండా ఇతర రసాయనాలు సిగ్మా-ఆల్డ్రిచ్ నుండి కొనుగోలు చేయబడ్డాయి మరియు తదుపరి శుద్దీకరణ లేకుండా ఉపయోగించబడ్డాయి.యాంటీబయాటిక్స్ క్లోరాంఫెనికాల్ (Cm), స్పెక్టినోమైసిన్ డైహైడ్రోక్లోరైడ్ (Sm), యాంపిసిలిన్ (Amp), జెంటామిసిన్ (Gt) మరియు కార్బెనిసిలిన్ (Cbn) యాప్లికెమ్ నుండి కొనుగోలు చేయబడ్డాయి.బాక్టో ట్రిప్టోన్ మరియు బాక్టో ఈస్ట్ ఎక్స్‌ట్రాక్ట్ మీడియా భాగాలు BD బయోసైన్సెస్ నుండి కొనుగోలు చేయబడ్డాయి.సీక్వెన్సింగ్ కోసం ట్రిప్సిన్ ప్రోమెగా నుండి కొనుగోలు చేయబడింది.
యాంటీ-స్మాష్ అంచనా వేసిన BGC 75.1 నుండి జన్యు శ్రేణులు సంగ్రహించబడ్డాయి.E. malaspinii (అనుబంధ సమాచారం).
జన్యువులు embA (లోకస్, MALA_SAMN05422137_METAG-ఫ్రేమ్‌వర్క్_127-జీన్_5), embM (లోకస్, MALA_SAMN05422137_METAG-ఫ్రేమ్‌వర్క్_127-జీన్_4), మరియు embAM (ఇంటర్జీన్ 7 ఇన్‌సింటెక్ట్ రీజియన్‌లతో సహా) క్రమానుగతంగా ఉన్నాయి. E లో వ్యక్తీకరణ కోసం ఆప్టిమైజ్ చేయబడిన ఆన్‌లు ఎప్పుడు.embA జన్యువు bamHI మరియు HindIII క్లీవేజ్ సైట్‌లతో pACYCDuet-1(CmR) మరియు pCDFDuet-1(SmR) యొక్క మొదటి బహుళ క్లోనింగ్ సైట్ (MCS1)లోకి సబ్‌క్లోన్ చేయబడింది.embM మరియు embMopt జన్యువులు (కోడాన్-ఆప్టిమైజ్) MCS1 pCDFDuet-1(SmR)లోకి BamHI మరియు HindIIIతో సబ్‌క్లోన్ చేయబడ్డాయి మరియు pCDFDuet-1(SmR) మరియు pRSFDuet-1(KanR) (MCS2) యొక్క రెండవ బహుళ క్లోనింగ్ సైట్‌లో ఉంచబడ్డాయి. NdeI/ChoI.ఎంబామ్ క్యాసెట్‌ను BamHI మరియు HindIII క్లీవేజ్ సైట్‌లతో pCDFDuet1(SmR)లోకి సబ్‌క్లోన్ చేశారు.orf3/embI జన్యువు (లోకస్, MALA_SAMN05422137_METAG-స్కాఫోల్డ్_127-జీన్_3) అతివ్యాప్తి పొడిగింపు PCR ద్వారా ప్రైమర్‌లను EmbI_OE_F_NdeI మరియు EmbI_OE_R_XhoI ఉపయోగించి నిర్మించబడింది, NdeI/XhoIతో అదే విధంగా జీర్ణించబడింది (1CMDతో p స్ట్రిక్షన్ ఎంజైమ్‌లు (సప్లిమెంటరీ పట్టిక).6)తయారీదారుల ప్రోటోకాల్ (న్యూ ఇంగ్లాండ్ బయోలాబ్స్) ప్రకారం పరిమితి ఎంజైమ్ జీర్ణక్రియ మరియు బంధం నిర్వహించబడింది.

 


పోస్ట్ సమయం: మార్చి-14-2023