معلومة

هل هناك قاعدة للتعليق التوضيحي على أصل الموضع الأساسي أو الجين في الجينوم البكتيري؟

هل هناك قاعدة للتعليق التوضيحي على أصل الموضع الأساسي أو الجين في الجينوم البكتيري؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

نظرًا لأن جميع البكتيريا لها كروموسوم دائري واحد ، فلا يوجد أصل محدد لبدء الترقيم المنتظم لموضع الجين. لذلك ، ما هي القاعدة لبدء الترقيم عند نقطة معينة (أي لماذا في بكتريا قولونية سلالة K12 من الجين thrL بالنظر إلى رقم الموضع المرتب b0001؟ إذا كانت الإجابة هي: إنه أول جين في اتجاه مجرى النهر الأساسي -1 ، فلماذا يكون basepair-1 في هذا الموضع بالذات)

لماذا السؤال؟ نظرًا لأن البكتيريا تظهر بشكل متكرر تخليقًا وظيفيًا بين الجينات ، فهل يجب أن أتفاجأ بالعثور على جين مرتبط بشكل متكرر بأصل التعليق التوضيحي (التعسفي؟)؟ إذا كان أصل التعليق التوضيحي هو أي أصل النسخ المتماثل ، فسيكون ذلك حالة مثيرة للاهتمام من التخليق ، ولكن إذا لم توجد مثل هذه القاعدة ، فمن المرجح أن تعكس هذه الحالة فقط التسلسل التاريخي لتسلسل الجينوم


[أنا متأكد من أن لدينا عالم ميكروبيولوجي ماهر في مكان ما هنا ، لذلك كان سيصحح إجابتي.]

إن ضرورة تعيين مواقع الجينات في أنواع النماذج البكتيرية الكلاسيكية سبقت العصر الجينومي ، لذلك لم تكن الخرائط التقليدية عادةً مرتبطة بأصل النسخ المتماثل ، ولم يتم التعبير عنها بالضرورة في أزواج أساسية. في بكتريا قولونية، على سبيل المثال ، تم إنشاء الخريطة التقليدية بناءً على تجارب نقل الحمض النووي بوساطة F-pili.

عندما أصبحت تسلسلات الجينوم الكاملة متاحة ، كان من الطبيعي فقط الاستمرار في الترقيم المحدد تقليديًا من حيث وضع "زوج الأساس الواحد". وهكذا ، في بكتريا قولونية "الخرائط التقليدية والمادية .. خريطة الربط وثيقة الترابط".

إن فهمي للوضع الحالي للبكتيريا بدون تاريخ ما قبل التاريخ الوراثي هو أن جينوماتها مُرقمة إما مرتبطة بالأنواع الكلاسيكية وثيقة الصلة (إن وجدت) أو وفقًا للموقع المفترض لـ ori. فقط لإعطاء مثال على كيفية حل معضلة بوكنيرا الجينوم: "كان من المفترض أن يكون مربع DnaA المنبع لجين gidA هو أصل النسخ المتماثل" وقرر المؤلفون تعيين "بداية مربع DnaA كزوج أساسي واحد".

كما ترى ، مع ذلك ، حتى إذا حاول المؤلفون تعريف "زوج أساسي واحد" استنادًا إلى موقع ori ، فإن المشكلة تكمن في أن هذه النقطة تعتمد على أداة البحث التي يستخدمها المرء وعلى الفهم المعاصر لكيفية أو تبدو المواقع مثل (التحديد المباشر لأصول التكرار ليس بالأمر السهل في كثير من الحالات). انظر على سبيل المثال يحتوي هذا الجدول على مراجعة لمواقع ori في مجموعة من الجينومات: بينما تلقت معظم الجينومات ترقيمها بغض النظر عن ori ، كان بعضها مرتبطًا به بالفعل ، لكن التحليل الجديد أظهر أن هذه المواقع كانت غير دقيقة.


ديناميات النسخ - تنسيق الترجمة تضبط إشارات الإندول البكتيرية

تعد إشارات الإندول مسارًا مهمًا للتواصل بين الأنواع في أمعاء الثدييات. في البكتيريا ، عند الحث بواسطة التربتوفان ، المستشعر الجزيئي (tnaC) يتحكم في التخليق الحيوي للإندول من خلال تنسيق ديناميكيات الآليات الجزيئية المقابلة بدقة أثناء النسخ والترجمة. لا يزال فهمنا لهذا البرنامج التنظيمي محدودًا نظرًا لطبيعته الديناميكية السريعة. لمعالجة هذا القصور ، اعتمدنا طريقة التنميط المتوازي على نطاق واسع لتحديد استجابات 1450 تركيبيًا tnaC المتغيرات في وجود ثلاثة تراكيز من التربتوفان في الخلايا البكتيرية الحية. مكنتنا مجموعة البيانات الناتجة من التحقيق الشامل للحالات الوسيطة الرئيسية للآلات الجزيئية أثناء النسخ والترجمة tnaC. استخدمنا أيضًا النمذجة لتوفير فهم على مستوى الأنظمة لكيفية تشكيل هذه الحالات الحرجة بشكل جماعي لمخرجات هذا البرنامج التنظيمي من الناحية الكمية. من المرجح أن يتم تطبيق منهجية مماثلة على ديناميكيات أخرى غير مفهومة جيدًا رابطة الدول المستقلة- العناصر التنظيمية.


شرح خبير لوظيفة الجينات¶

كيف تملأ نموذج التعليق الجيني؟ ¶

كما هو موضح في الشكل أدناه ، لا يمكن للمضيف تعديل جميع الحقول. علاوة على ذلك ، بعضها مطلوب والبعض الآخر اختياري. يجب ملء هذه الحقول بعد التحليل الدقيق لنتائج الطرق المختلفة. إذا كنت تعمل على كائن آخر غير CDS ، فقد يكون لديك نموذج مختلف ، وإذا ظهر حقل مطلوب لـ CDS في النموذج الخاص بك ، فلا يزال مطلوبًا.

إذا كان أحد الحقول المطلوبة مفقودًا أو تم ملؤه بشكل خاطئ ، فسيظهر تحذير في النافذة.

ما هي "حالة" التعليق التوضيحي المختلفة؟

  • في تقدم : لم ينته المعلق من شرح الخبير
  • تم الانتهاء من : انتهى المعلق من التعليق التوضيحي الخبير
  • مختارة : تمت مراجعة شرح الخبير من قبل متخصص في العملية الوظيفية التي يشارك فيها منتج CDS
  • قطعة أثرية : يتوافق CDS المصطنع مع التنبؤ الخاطئ من قبل برنامج الكشف عن الجينات. لا ينبغي أبدًا أن تكون CDS المصطنعة مشابهة لأي بروتينات من بنوك البيانات (إلا إذا تم إجراء نفس التعليق التوضيحي الخاطئ في جينومات أخرى)
  • chk : يتم استخدام هذه الحالة من قبل الشرح للإشارة إلى أخطاء التسلسل المحتملة في التسلسل. عندما يتم تنفيذ التسلسل في Genoscope ، سيتم إرسال تسلسل chkSeq إلى الأشخاص العاملين في فريق الإنهاء. سيقومون بعد ذلك بفحص التجميع لمعرفة ما إذا كانت جودة التسلسل جيدة أم لا. إذا لزم الأمر ، يمكنهم إجراء بعض تقارير PCR الإضافية لتحسين البيانات.
  • chk ابدأ : يعتقد المعلق أن تعديل موضع البداية قد يكون ضروريًا لـ CDS ، لكنه لم يفعل ذلك حتى الآن.

كيف تتعرف على القطع الأثرية؟ ¶

ما هي فئات "النوع" المختلفة؟

  • CDS
  • FCDS
  • الحمض الريبي النووي النقال
  • الرنا الريباسي
  • منوعات_RNA
  • tmRNA
  • ncRNA
  • يكون
  • ميزة_مختلفة
  • المروجين

كيف تملأ حقل "الطفرة"؟

  • لا = & GT. CDS عادي
  • فرامشيفت = & gt CDS التي تم إثبات تحول إطار حقيقي لها بيولوجيًا
  • مستعار = & GT. تعد CDS جزءًا من جين زائف
  • جزئي = & GT. CDS عبارة عن جزء جيني
  • بقايا الجينات = & gt فإن CDS عبارة عن جزء جيني متحلل للغاية
  • سيلينوسيستين = & gt يحتوي CDS على سيلينوسيستين في تسلسله
  • بيروليزين = & gt يحتوي CDS على pyrrolysine في تسلسله

ما هي فئات "نوع المنتج" المختلفة؟

  • ش: غير معروف
  • ن : RNA
  • هـ: إنزيم
  • F : عامل
  • ص: منظم
  • ج: الناقل
  • ر: الناقل
  • RC: مستقبل
  • س : بنية
  • ل: زعيم الببتيد
  • م: مكون الغشاء
  • ليرة لبنانية: البروتين الدهني
  • cp: عملية الخلية
  • فتاه: النمط الظاهري
  • ح: أصل خارج الصبغية

كيف تستخدم حقل "تفاعل MetaCyc"؟

يسمح هذا الحقل للمستخدم بربط تفاعلات استقلابية خام أكثر من MetaCyc (BioCyc) بالجين المعدل الحالي.

  • أ: تم تنسيق التفاعلات المعروضة في الجزء العلوي من الحقل يدويًا بواسطة المعلق.
  • ب: توفر قائمة الاختيار المتعددة وصولاً سريعًا إلى جميع التفاعلات المتوقعة (غير المحددة) أو المنسقة (المحددة) المرتبطة بهذا الجين.
  • ج: يسمح مربع البحث للشخص بالوصول السريع إلى تفاعلات MetaCyc المقابلة إما لأرقام EC من حقل رقم EC السابق أو كلمة رئيسية معينة.

مربع البحث:

سيؤدي النقر فوق الزر "EC" إلى البحث في جميع تفاعلات MetaCyc المقابلة لرقم EC من حقل "رقم EC".

سيبحث البحث عن الكلمات الرئيسية عن جميع تفاعلات MetaCyc التي لها معرف أو اسم أو تتضمن مركبًا مشابهًا للكلمة الأساسية المحددة.

نتيجة البحث :

يُرجع البحث قائمة بتفاعلات MetaCyc ، مع:

جينات الكائن الحي مرتبطة بالفعل بهذا التفاعل (على سبيل المثال ، الصف الأول من المثال). يتم تمييز الجينات بـ:

  • "تم التحقق من صحتها": تم ربط رد الفعل يدويًا بهذا الجين من قبل المستخدمين.
  • "المشروح": تم ربط التفاعل بجين متماثل ونقله هنا من جينوم قريب.
  • "متنبأ به": تم ربط التفاعل مع هذا الجين بواسطة خوارزمية أدوات المسار.

إذا لم يكن للتفاعل جينات تشفير معروفة ولكنه ينتمي إلى مسار متوقع وجوده في الكائن الحي الحالي ، فسيتم توفير ارتباط قابل للنقر لوصف مسار MetaCyc (على سبيل المثال ، الصف الرابع من المثال).

زر "إعادة تعيين" يحذف جميع النتائج.

كيف تستخدم حقل "رد فعل ريا"؟ ¶

يسمح هذا الحقل للمستخدم بربط تفاعلات استقلابية واحدة من خام أكثر من ريا إلى الجين المعدل الحالي.

  • أ: تم تنسيق التفاعلات المعروضة في الجزء العلوي من الحقل يدويًا بواسطة المعلق.
  • ب: توفر قائمة الاختيار المتعددة وصولاً سريعًا إلى جميع التفاعلات المنسقة المرتبطة بهذا الجين.
  • ج: يسمح مربع البحث للشخص بالوصول السريع إلى تفاعلات Rhea المقابلة إما لأرقام EC من حقل رقم EC السابق أو كلمة رئيسية معينة.

مربع البحث:

سيؤدي النقر فوق الزر "EC" إلى البحث في جميع تفاعلات Rhea المقابلة لرقم EC من حقل "رقم EC".

سيبحث البحث عن الكلمات الرئيسية عن جميع تفاعلات Rhea التي تحتوي على معرف أو اسم يتضمن اسمًا مركبًا أو معرّف Chebi مشابهًا للكلمة الرئيسية المحددة.

نتيجة البحث :

توجد تفاعلات ريا في 4 نموذجية وفقًا للاتجاه:

  • ثنائي الاتجاه: & lt = & GT
  • من اليسار إلى اليمين : = & GT
  • من اليمين الى اليسار : & lt =
  • * غير معروف (رد فعل رئيسي): & lt؟ & GT

يُرجع البحث قائمة بتفاعلات ريا ، مع:

  • معرف التفاعل والاسم. المعرف قابل للنقر عليه وافتح بطاقة رد فعل ريا. بشكل افتراضي ، يتم تقديم رد الفعل الرئيسي. حدد الاتجاه المطلوب في "تحديد الاتجاه".

جينات الكائن الحي مرتبطة بالفعل بهذا التفاعل (على سبيل المثال ، الصف الأول من المثال). يتم تمييز الجينات بـ:

زر "إعادة تعيين" يحذف جميع النتائج

كيفية ربط رد فعل جديد:

لكل رد فعل في مجموعة النتائج ، تسمح خانة الاختيار بإضافة رد فعل من مجموعة النتائج إلى العنصر المحدد. سيتم حفظ جميع التفاعلات المحددة في قائمة الاختيار المتعدد على أنها تم التحقق من صحتها وربطها بهذا الجين. سيؤدي إلغاء تحديد رد فعل في هذه القائمة إلى إزالة هذا الارتباط من البيانات المنسقة.

ما هي فئات "التعريب" المختلفة؟ ¶

  • 1 : مجهول
  • 2 : السيتوبلازم
  • 3 : فيمبريال
  • 4 : فلاجيلار
  • 5 : بروتين الغشاء الداخلي
  • 6 : الغشاء الداخلي المصاحب
  • 7 : بروتين الغشاء الخارجي
  • 8 : الغشاء الخارجي المرتبط
  • 9 : بيريبلاسميك
  • 10 : يفرز
  • 11 : غشاء

ما هو تصنيف "BioProcess"؟ ¶

يعتمد هذا التصنيف الوظيفي على معرّفات دور CMR JCVI.

يتم ملء هذا الحقل اختياريًا أثناء عملية التعليق التوضيحي للخبراء.

ما هو تصنيف "الأدوار"؟ ¶

يتوافق هذا التصنيف الوظيفي مع تصنيف MultiFun الذي طورته Monica Riley من أجل E. coli.

يتم ملء هذا الحقل اختياريًا أثناء عملية التعليق التوضيحي للخبراء.

كيف يتم استخدام حقل PubMedID؟

يتوافق PubMedID أو PMID مع فهرس المنشور في قسم PubMed على موقع NCBI. يمكنك ملء هذا الحقل عندما تريد ربط منشور بتعليقك التوضيحي. إذا كنت تريد إدخال عدة منشورات ، فما عليك سوى كتابة معرفات PMID مفصولة بفواصل.

سوف تجد PMID لمنشور مباشرة على Pubmed كما هو موضح في الشكل أدناه. يمكنك أيضًا العثور على معالجات PMID في قسم "المراجع" في إدخالات UniProt.

إذا كان هذا الحقل ممتلئًا ، فسيكون لديك وصول مباشر إلى المنشورات على PubMed من خلال النقر على PubMed زر أعلى نافذة محرر التعليقات التوضيحية الجينية.

كيف يتم استخدام حقل "البيانات الإضافية"؟ ¶

ال تعليقات الحقل مخصص للمعلقين التوضيحيين الذين يريدون ترك بعض الملاحظات لأنفسهم أو للآخرين من التعليقات التوضيحية من المشروع.

كيف تستخدم حقل "الفصل"؟

ال فصل تعد فئات التعليقات التوضيحية مفيدة لتعيين "مستوى ثقة" لكل تعليق توضيحي جيني. وقد تم استلهامه من "ثقة اسم البروتين" المحددة في PseudoCAP (مشروع شرح المجتمع Pseudomonas aeruginosa).

لا يتم تقديم هذه المعلومات من خلال إجراء التعليق التوضيحي الوظيفي التلقائي ، إلا في حالة نقل التعليق التوضيحي الوظيفي من الجينوم الذي يتم شرحه باستخدام MaGe.

الفئات المختلفة هي:

  • 1 أ: الوظيفة من الأدلة التجريبية في السلالة المدروسة
  • 1 ب: الوظيفة من الأدلة التجريبية في الأنواع المدروسة
  • 1 ج: الوظيفة من الأدلة التجريبية في الجنس المدروس
  • 2 أ: وظيفة من الأدلة التجريبية في الكائنات الحية الأخرى
  • 2 ب: الوظيفة من الأدلة التجريبية غير المباشرة (مثل الأنماط الظاهرية)
  • 3 : الوظيفة المفترضة من أدلة حسابية متعددة
  • 4 : وظيفة غير معروفة ولكنها محفوظة في كائنات أخرى
  • 5 : وظيفة غير معروفة

كيف تختار فئة التعليق التوضيحي "Class"؟ ¶


المواد والأساليب

أخذ العينات وتسلسل الجينوم والتجميع الميتاجينومي

تم وصف مخطط أخذ العينات وخصائص التربة المحلية وتصميم الدراسة التي تم استخدامها في هذا التحليل مسبقًا [29]. في السابق ، تم جمع 60 عينة من التربة على أعماق 10-20 ، و 20-30 ، و 30-40 سم بالقرب من المراكز ذات الصلة من ستة قطع قطر 10 أمتار ، متباعدة 5 أمتار. تم ترتيب قطع أخذ العينات مكانيًا في "كتل" من قطعتين عبر المرج ، وتلقى أحد القطعتين في كل كتلة أمطار ربيعية ممتدة [31]. تم جمع العينات على مدى شهرين قبل هطول الأمطار في الخريف وبعده ، مما أدى إلى 10 عينات لكل قطعة (الشكل 1 أ). باختصار ، تم استخلاص الحمض النووي من 10 جم من التربة لكل عينة باستخدام مجموعة PowerMax Soil DNA للعزل (مختبرات MoBio) من نوى التربة الفردية. تم إعداد مكتبات Metagenomic وتسلسلها باستخدام تسلسل قراءة مقترن 2 × 250 نقطة أساس على منصة Illumina HiSeq2500 في معهد الجينوم المشترك. تمت تصفية قراءات الجودة إلى حد أقصى يبلغ 200 نقطة أساس في الطول باستخدام BBduk [34]. تم تجميع Metagenomes باستخدام IDBA_UD [35] وتم إهمال الجينومات الفردية باستخدام binning التغطية التفاضلية ومجموعة من binners metagenomic كما هو موضح سابقًا [29].

أ منظر من أعلى لمروج المراعي الواقعة في محمية أنجيلو كوست رينج في مقاطعة ميندوسينو ، كاليفورنيا (39 ° 44 ′ 17.7 ″ شمالًا ، 123 ° 37 ′ 48.4 ″ غربًا). ب الرسوم البيانية لمتوسط ​​هوية النوكليوتيدات (ANI) وتغطية المحاذاة (تقريب لمحتوى الجين المشترك) لقيم مقارنات الكل مقابل الكل بين الجينومات المجمعة من تربة المروج. ج الوفرة النسبية للحمض النووي لـ 19 مجموعة بكتيرية تم تحليلها في هذه الدراسة في كل عينة ، مرتبة حسب مخطط تجريبي حيث تم جمع العينة ، مرتبة حسب عمق العينة من اليسار إلى اليمين.

إزالة نسخ الجينوم والتصفية والمقارنة

تم إلغاء نسخ 10،538 حاوية جينوم تم وصفها سابقًا والتي تم الحصول عليها من موقع الدراسة باستخدام dRep [36] مع عتبة التجميع الثانوي -sa 0.97 ، وتم ترشيحها باستخدام CheckM [37] لتوليد مجموعة جينوم على مستوى الأنواع غير المكررة (97٪ ANI) على تستخدم لرسم الخرائط مع اكتمال 70٪ و lt10٪ من التلوث. تم اختيار الجينومات التمثيلية لكل مجموعة من الأنواع بناءً على أعلى درجة اكتمال في CheckM وأقل تلوث باستخدام خوارزمية التسجيل الموصوفة في [36]. من أجل هذا التحليل ، استخدمنا بعد ذلك 19 مجموعة من الجينوم على مستوى النوع مع 12 جينومًا مكررًا على الأقل والتي قُدرت بأنها كاملة بنسبة 80٪ على الأقل مع تلوث بنسبة 10٪ ، تم تجميعها بشكل مستقل وإخراجها من عينات مختلفة. تم تجميع كل من الجينومات الـ 19 التمثيلية من & gt100000 قراءة قصيرة ، ويمكن تخصيص ملايين القراءات لكل مجموعة من العينات الستين. نظرًا لأن التجمعات الميكروبية داخل عينات التربة البالغة 10 جم المستخدمة لاستخراج الحمض النووي تتكون من خلايا أكبر بكثير مما تم تسلسله ، فمن المحتمل أن تكون معظم أزواج القراءة من خلايا فريدة (أو جزيئات DNA) في المجموعة السكانية. تم ترتيب تسلسل كل جينوم تم تجميعه من كل عينة عند تغطية 10 × تقريبًا ، ولكن تراوحت التغطيات على مستوى المروج لكل مجموعة من 224 × 908 × (الجدول التكميلي S2).

تم توقع إطارات القراءة المفتوحة باستخدام Prodigal [38] وتم شرحها باستخدام [1] USEARCH مقابل UniProt [39] و Uniref90 [40] و KEGG [41] و [2] التعليقات التوضيحية المستندة إلى HMM للبروتينات باستخدام PFAM [42] ، و antiSMASH 4.0 [43] للتنبؤ بجينات التخليق الحيوي. تم تشغيل اختبارات PERMANOVA لربط مصفوفات ANI بالبيانات البيئية باستخدام وظيفة adonis2 مع تعيين المعلمة "by" على "الهامش" في الحزمة النباتية في R [44]. تم إجراء مخططات القياس متعدد الأبعاد (MDS) باستخدام وظيفة mds من حزمة smacof في R ، مع ضبط المعلمة ndim على 4. تم إجراء اختبارات Hypergeometric للإثراء الإحصائي لعائلات البروتين باستخدام ميزات PFAM المشروحة HMMER في R.

تمت إزالة التلوث المحتمل من الجينومات التمثيلية باستخدام الجينومات المكررة المجمعة لكل مجموعة من الأنواع. تم تشغيل خط أنابيب تحليل الجينوم الشامل Roary [45] بإعدادات افتراضية على مجموعة الجينومات لكل نوع لتحديد مجموعات البروتين عبر الجينوم. تم بعد ذلك التخلص من المحتويات التي تحتوي على ما لا يقل عن 50٪ من مجموعات البروتين الموجودة في أقل من 25٪ من كل مجموعة جينوم باعتبارها تلوثًا محتملاً (بشكل عام ، تمت إزالة أقل من 20 كونتيجًا ، غالبًا ما تكون صغيرة ، لكل جينوم). لذلك ، احتوت المجموعة النهائية من contigs المستخدمة في هذا التحليل على contigs فقط الذي تم تجميعه بشكل موثوق به وتثبيته بشكل مستقل عن الأنواع في عينات متعددة. تم حساب الوفرة النسبية للحمض النووي للكائن باستخدام العدد الإجمالي للقراءات التي تم تعيينها لكل جينوم في كل عينة والقسمة على العدد الإجمالي للقراءات لكل عينة.

اقرأ رسم الخرائط واستدعاء SNP وتنوع النيوكليوتيدات

تم تعيين جميع القراءات الميتاجينومية باستخدام Bowtie 2 [46] مع معلمات افتراضية باستثناء معلمة حجم الإدراج -X 1000 إلى قاعدة بيانات مفهرسة لجميع الجينومات غير المكررة 664 التي تم الحصول عليها من البيئة ، وهي قاعدة بيانات تحتوي أيضًا على جينومات تمثيلية من كل من 19 نوعا للدراسة. تم استخدام القراءات التي تم تعيينها بشكل فريد للأنواع التمثيلية ذات الأهمية للتحليل. تم إجراء تصفية القراءة لملفات BAM الناتجة باستخدام برنامج نصي مخصص ، filter_reads.py ، متاح على الرابط تحت توفر التعليمات البرمجية.تم بعد ذلك تصفية ملفات التعيين للقراءات التي تفي بالمعايير التالية: (1) كلاهما يقرأ في خريطة زوجية في حدود 1500 نقطة أساس من بعضهما البعض إلى نفس السقالة (كأقصى حد ممكن لحجم الإدخال من النهاية إلى النهاية) ، (2) القراءة المجمعة قم بإقران الخرائط مع هوية نسبية لا تقل عن 96٪ للمرجع [3] ، واحد على الأقل من أزواج القراءة لديه درجة mapq & gt1 ، مما يشير إلى أن هذا هو أفضل تعيين فريد لزوج القراءة هذا في الفهرس. قمنا كذلك بمقارنة تنوع الجينات النوكليوتيدية المحسوبة بـ 96٪ ANIr2 قطع لأولئك الذين لديهم 98٪ ANIr2 قطع ووجد ارتباط قوي (الشكل S1). ثم تم استدعاء SNPs عند الترددات & gt5٪ في كل مجموعة باستخدام قراءات من جميع العينات ، باستخدام نموذج فارغ يفترض معدل اكتشاف خاطئ & lt

بالنسبة لجميع مقاييس التنوع السكاني ، استخدمنا نصوص Python المخصصة القابلة لإعادة الإنتاج (المتوفرة ضمن توفر الشفرة) التي تحسب المقاييس ، كل منها موضح أدناه ، من جميع تعيينات القراءة عبر العينات التي تمت تصفيتها. لكل جينوم تمثيلي في مجموعتنا المكونة من 19 جينومًا ، قمنا بتحليل بياناته في العينات التي اجتازت حدًا لا يقل عن 50 ٪ من الجينوم الذي تمت تغطيته بتغطية 5 × على الأقل. اجتازت خمسمائة وستة وثمانون من أصل 1140 عينة من مقارنة الجينوم (19 جينومًا × 60 عينة) هذا الحد الأدنى من المتطلبات. لم يتم استخدام أزواج أساسية من القراءات ذات درجات Phred أقل من 30 في تحليل SNP أو تحليل الارتباط. تم حساب تنوع النوكليوتيدات على أنه التكرار المتوقع للفرق بين قراءتين متتاليتين في موضع ما ، المعادلة pi = 1 - (أ 2 + ج 2 + جي 2 + تي 2) أين أ, ج, جي, تي والنسب المرصودة لكل نوكليوتيد. هذا يعادل التعريف من [47] محسوبًا بشكل منفصل على كل موضع جيني بتغطية 5 × على الأقل داخل كل عينة ، ثم يتم حساب المتوسط ​​عبر الجينات. تم تجميع تعيينات قراءة العينة عن طريق التكرارات ، ومؤامرة المنشأ ، والكتلة والأصل ، وأخيراً من خلال جميع العينات في المرج ، وتم إعادة حساب تنوع النيوكليوتيدات في كل مجموعة مجمعة من العينات. بالنسبة لتحليلات المصب ، تم تحليل تنوع النيوكليوتيدات لجميع العينات (على مستوى المروج ، الشكل 3) وتنوع النيوكليوتيدات داخل كل من كتل أخذ العينات الثلاثة (على مستوى الكتلة ، الشكل 5). لتقدير تأثير تغيير تغطية التسلسل على تنوع النيوكليوتيدات ، قمنا بإعادة حساب تنوع النيوكليوتيدات لكل جينوم ، وتغطية أخذ العينات الفرعية في كل موضع جينومي (الشكل S2). وجدنا أن التحيز في تنوع النوكليوتيدات بسبب تغطية التسلسل المنخفض كان أقل من 50 × ، وغالبًا ما تكون تغطيتنا على مستوى الكتلة والمرج أعلى بكثير من هذه التغطية. نرى تحيزًا أكبر في تنوع النوكليوتيدات عند أخذ عينات فرعية لتغطية 5x فقط ، لكن هذا التحيز صغير مقارنة بالتباين البيولوجي الملاحظ بين العينات ، وكثير من عينات التربة الفردية لدينا تزيد عن 10 ×.

تم استدعاء SNPs على مجموعة السكان المجمعة على مستوى المرج للقراءات المصفاة. لقد أنشأنا نموذجًا فارغًا بسيطًا استنادًا إلى معدل خطأ قدره 0.01٪ (قطع Phred 30) ومحاكاة أخذ العينات البسيطة مع الاستبدال لإنشاء معدلات تقديرية لأعداد SNP الخاطئة في المواضع الجينية ذات التغطيات المختلفة. المواقف ذات الأليل البديل التي حدثت مع أعداد ذات معدل إيجابي خاطئ

تم استدعاء 10 −6 مع التغطية المعطاة لذلك الموقع في النموذج الفارغ والحد الأدنى لتردد الأليل (MAF) بنسبة 5 ٪ على أنه SNPs. نظرًا لأن التغطيات على مستوى المروج كانت على الأقل 224 × (وتراوحت حتى 908 ×) ، فمن المحتمل أن يكون قطع MAF وحده حدًا صارمًا لمعدلات خطأ Phred 30. تم تعيين SNPs كمرادف أو غير مرادف باستخدام برنامج نصي BioPython مخصص ومكالمات الجينات التي تم شرحها بواسطة Prodigal.

اختلال التوازن ، FST ، واختبارات للاختيار

تم حساب الارتباط ضمن القراءات المعينة لجميع أزواج مواقع الفصل التي امتدت بما لا يقل عن 30 زوجًا للقراءة مع بيانات زوج أساسي عالي الجودة. ص 2 و دتم حساب الارتباطات باستخدام الصيغ الموصوفة بواسطة [48]. تم حساب المعدل النسبي لإعادة التركيب إلى الطفرة (جاما / مو) لكل مجموعة سكانية باستخدام حزمة mcorr (cite) في مواقع كودون ذات الموضع الثالث المترادفة عبر القراءات المعينة التي تمت تصفيتها من جميع العينات. قمنا بتحليل 10 من أصل 19 جينومًا ، حيث كانت هذه الجينوم قد وزعت بشكل طبيعي بقايا لتناسب النموذج وكان متوسط ​​التمهيد في حدود 2 × من التقدير النهائي لجاما / مو. Fشارع، (مقياس الفروق في ترددات الأليل بين مجموعتين من السكان) ، تم حسابه على المواقع التي تم فصلها عبر كلا الكتلتين التي تتم مقارنتها (لجميع مقارنات الكتل الثلاثة) باستخدام طريقة هدسون [49] على النحو الموصى به من قبل [50] ، كما هو مطبق في scikit الحزمة الموازية [51]. يجب أن يكون للموقع تغطية لا تقل عن 20 × في كل كتلة من أجل الحساب Fشارع، والجينات التي كان لها تغطيات في كتلة خارج نطاق اثنين من الانحرافات المعيارية تم استبعادها من التحليل. ثم تم استخدام نسبة المتوسطات لتحديد المتوسط Fشارع لكل جين. تم استخدام اختبار Wilcoxon المكون من عينتين لتحديد ما إذا كان متوسط ​​الارتباط للمواقع شديدة التباين يختلف عن المتوسط ​​الجيني لكل نوع ، وعينتين ر- تم استخدام الاختبارات في R [44] لتحديد ما إذا كان متوسط ​​تنوع النوكليوتيدات للمواقع شديدة التباين يختلف عن المتوسط ​​الجيني. تم تصحيح كلا المجموعتين من الاختبارات لفرضيات متعددة باستخدام طريقة Benjamini-Hochberg [52].


نموذج بيانات البروتين بروتكاريوتيك المرجع - تسلسل واحد واسم لجميع حوادث تسلسل البروتين الدقيق

محور مهمة RefSeq للجينومات بدائية النواة هو نموذج بيانات البروتين غير الزائد (3 ، 4). يشير رقم المدخل الذي يبدأ بـ "WP_" إلى تسلسل بروتين بدائي النواة غير متكرر من RefSeq ، يتوافق مع الترجمات المتطابقة من واحدة على الأقل ، ولكن في بعض الأحيان من آلاف مناطق تسلسل الترميز (CDS) المشروحة على جينومات RefSeq. يمثل كل بروتين RefSeq غير فائض مجموعة البروتين المتطابقة (IPG) الذي يتضمن بروتينات INSDC بالإضافة إلى الترجمات من مجموعات RefSeq لتسلسل الجينوم الكامل أو الكامل (WGS). عندما يتم العثور على بروتين واحد في جينومات متعددة ، فقد يكون الحمض النووي لمناطق الترميز هذه متطابقًا ، أو قد يختلف باختلاف تغييرات الكودون المترادفة. رقم الانضمام إلى المرجع WP_000059093.1 ، "بروتين بادئ النسخ الكروموسومي DnaA ،" يمثل ترجمة الحمض النووي جين السالمونيلا المعوية subsp. enterica serovar Typhimurium str. LT2، على سبيل المثال ، تم الإبلاغ عن تسلسلها في عام 2001 (PMID: 11677609). لكن IPG (https://www.ncbi.nlm.nih.gov/ipg/WP_000059093.1) يشير أيضًا إلى ترجمات ميزات CDS من أكثر من 6000 تجميع إضافي للجينوم المشروح (بحساب كل من إصدارات RefSeq و INSDC).

يقوم NCBI بتقييم المواضع التصنيفية للبروتينات الأعضاء في مجموعة بروتين متطابقة ، من أجل تعيين تصنيف لممثل البروتين غير الزائد عن الحاجة. قد يمثل بروتين WP واحد بروتينات من العديد من الأنواع بسبب نقل الجينات الأفقي. البلازميدات التي ترميز WP_004201164.1 ، "الفئة الفرعية B1 metallo-beta-lactamase NDM-1΄ ، على سبيل المثال ، انتشرت على نطاق واسع (تصل إلى Acinetobacter baumannii و Enterobacter cloacae و Escherichia coli و Klebsiella pneumoniae إلخ) أن RefSeq يعين التخصيص التصنيفي الواسع المناسب "البكتيريا" لهذا البروتين وإلى مجموعة البروتين المتطابقة التي يمثلها.

إذا كان التوصيف الجديد جاهزًا للنشر لبروتين معروف سابقًا مع مجموعة بروتين متطابقة موجودة ، فمن المناسب الاستشهاد بالانضمام "WP_". يوفر استخدام رقم مدخل لتمثيل البروتين وجميع الجينات التي ترمزه بالضبط وضوحًا أكبر من مجرد وصف البروتين أو تسمية الجين. يصعب ربط المعلومات الوصفية البحتة بالتسلسلات الفعلية وغالبًا ما يتضح أنها غامضة.

تتمثل الميزة الحاسمة لنموذج بيانات البروتين غير الزائد في أنه يسمح بالتكوين الحيوي المستمر والتحديثات الآلية للتعليق التوضيحي الوظيفي بعد التشغيل الأولي لخط أنابيب التعليقات التوضيحية لـ PGAP. مع اكتشاف المزيد من المعلومات حول وظيفة البروتين ، يمكن للمكلفين الحيويين RefSeq إضافة أو تحسين أسماء البروتين المرتبطة بأدلة التماثل الداعمة. ثم تنتشر الأسماء المحدثة في السجلات المطابقة. على سبيل المثال ، البروتين من الموضع المسمى Rv0693 من جينوم السل الفطري تم شرح H37Rv ، المتسلسل في عام 1998 (5) ، على أنه "بروتين تخليقي محتمل لأنزيم PQQ ، وهو تخمين معقول في ذلك الوقت. يقترح العمل الأكثر حداثة الآن اسم "mycofactocin root SAM maturase" له (6) ، وللمنتجات الجينية المتطابقة من أكثر من 9000 جينوم مشروح. يبلغ طول تقرير مجموعة البروتين المتطابق على https://www.ncbi.nlm.nih.gov/ipg/WP_003403490.1 أكثر من 200 صفحة ، مع شروح RefSeq أولاً ، جميعها متطابقة وصحيحة. في المقابل ، تظهر سجلات INSDC في آخر 100 صفحة عدم التجانس والمعلومات القديمة والأخطاء العرضية المتوقعة في البيانات الأرشيفية.

على الرغم من أن التعليقات التوضيحية لـ RefSeq لأسماء البروتين مصممة لتكون موجزة ، إلا أنها تهدف أيضًا إلى إعلام أكبر قدر ممكن ، وليس فقط لتحديد البروتين. في رأينا ، WP_000180747.1 من هيليكوباكتر بيلوري لا ينبغي تسمية "مستضد مناعي مرتبط بالسمية الخلوية" ، وهو غامض وعفا عليه الزمن ، ولا "exotoxin CagA" ، وهو محدد ولكنه غني بالمعلومات فقط. اختارت RefSeq اسم "النوع الرابع من نظام إفراز المستجيب السرطاني CagA." هذا البناء لاسم البروتين ينبه المستخدمين إلى أهميته الطبية الحيوية ، ومشاركته في مجموعة معقدة من تفاعلات المضيف الممرض ، واعتماده على نظام كامل من البروتينات الإضافية لـ إيصالها ووظيفتها (7). لقد صممنا اسم هذا البروتين كما لو كنا نبني تسلسلاً هرميًا لأسماء البروتين حيث تعكس أوجه التشابه في الأسماء أوجه التشابه في الخصائص المهمة مثل الوظيفة الجزيئية والعملية البيولوجية و / أو الأصل التطوري. يجب أن يساعد التعليق التوضيحي الناتج أولئك الذين يبحثون عن جميع مؤثرات نظام الإفراز من النوع الرابع ، أو عن جميع السموم البكتيرية المسببة للأورام المعروفة (يعتبر CagA الأول) ، وليس فقط هؤلاء المستخدمين الذين يعرفون بالفعل ما هو CagA وكيف يعمل.

خارج عدد صغير جدًا من الكائنات الحية النموذجية المدروسة جيدًا ، تفتقر معظم البروتينات من جينومات بدائية النواة إلى التوصيف التجريبي المباشر. يجب الاستدلال على وظيفتها الجزيئية و / أو دورها البيولوجي من خلال التنادد. في كثير من الأحيان ، يمكن تطبيق نوع عام جدًا من الاسم الوظيفي فقط. يطبق RefSeq اسمًا على كل بروتين متوقع في الجينوم باستخدام قواعد هرمية (انظر أدناه) ، حتى لو كان الاسم منخفضًا نسبيًا في محتوى المعلومات. تصادف فئة متزايدة من الباحثين الجينات وترجماتها البروتينية كميزات جينومية أولاً ، وبعد ذلك فقط سترى التعليقات التوضيحية التي تحملها. قد تتضمن أساليبهم علم الجينوم الأساسي: فحص حي الجينات ، واكتشاف جزيرة الجينوم من خلال مقارنات شاملة للجينوم ، وإيجاد ارتباط التسلسل من خلال عمليات البحث بلاست ، أو ببساطة تصفح البروتينات المتوقعة من الأنواع المتسلسلة حديثًا. أو قد تتضمن الأساليب تجارب عالية الإنتاجية: RNA-Seq لمتابعة مستويات التعبير الجيني ، والتحليل الطيفي الشامل للعثور على مواقع التعديل بعد الترجمة ، و TnSeq لإنشاء قوائم الجينات الضرورية للنمو في ظل ظروف مختلفة ، وما إلى ذلك. -أسماء المعلومات أفضل من لا شيء. عند النظر إليها معًا في سياق الأحياء الجينية أو التجمعات الأخرى ، فإن الأسماء التي تنقل معلومات قليلة نسبيًا بشكل فردي قد لا تزال تقدم أدلة مهمة تساعد الباحثين الذين يهدفون إلى توصيف أنظمة الجينات الجديدة والعمليات البيولوجية المقابلة لها (8).

تعمل RefSeq على جعل أسلوب التعليق التوضيحي الوظيفي الخاص بها متسقًا قدر الإمكان مع الأسلوب المستخدم من قبل SwissProt / UniProt والذي يفضله GenBank ، والاتفاق على الأسماء الفعلية حيثما أمكن ، وعلى الإرشادات الخاصة بكيفية هيكلة أسماء البروتين في قواعد البيانات الخاصة بنا. لا يزال دليل تم إنشاؤه بشكل مشترك للاستخدامات الموصى بها في تسمية البروتين في شكل مسودة حتى كتابة هذه السطور ، ولكن يجب إتاحته للجمهور من قبل كلا المجموعتين في غضون بضعة أشهر. سوف تشرح هذه الوثيقة عناصر تسمية البروتين كما تم إجراؤها في قواعد البيانات المعنية وتقترح أسلوبًا قد يستخدمه مقدمو التعليقات التوضيحية إلى INSDC. ترتبط الأسماء الفعلية التي يطبقها RefSeq ارتباطًا وثيقًا بأشكال الأدلة التي نستخدمها لتخصيص الأسماء. تم وصف استخدام RefSeq للتسلسل الهرمي لأدلة التماثل لقواعد التعليقات التوضيحية لتسمية البروتينات في أقسام لاحقة.


مراجع

Markowitz VM و Chen IM و Palaniappan K و Chu K و Szeto E و Pillay M et al. نسخة IMG 4 من نظام التحليل المقارن للجينوم الميكروبي المتكامل. الدقة الأحماض النووية. 201442: D560–7.

Reddy TB و Thomas AD و Stamatis D و Bertsch J و Isbandi M و Jansson J وآخرون. قاعدة بيانات الجينوم على الخط (GOLD) v.5: نظام إدارة البيانات الوصفية على أساس أربعة مستويات (ميتا) تصنيف مشروع الجينوم. الدقة الأحماض النووية. 201543: D1099–106.

Morgulis A و Gertz EM و Schäffer AA و Agarwala R. تنفيذ سريع ومتناسق DUST لإخفاء تسلسل الحمض النووي منخفض التعقيد. J كومبوت بيول. 20065: 1028-1040.

بلاند سي ، رامزي تل ، سابري إف ، لوي إم ، براون ك ، كيربيديس إن سي ، وآخرون. أداة التعرف على CRISPR (CRT): أداة للكشف التلقائي عن التكرارات المتجمعة المنتظمة والمتباعدة بشكل منتظم. المعلوماتية الحيوية BMC. 20078: 209.

إدغار آر سي. PILER-CR: تحديد سريع ودقيق لتكرارات CRISPR. المعلوماتية الحيوية BMC. 20078: 18.

Lowe TM ، Eddy SR. tRNAscan-SE: برنامج لتحسين الكشف عن نقل جينات الحمض النووي الريبي في التسلسل الجيني. الدقة الأحماض النووية. 199725: 955–64.

إيدي SR. تسريع عمليات البحث عن ملف HMM. بلوس كومبوت بيول. 20117 ، e1002195.

Griffiths-Jones S ، Moxon S ، Marshall M ، Khanna A ، Eddy SR ، Bateman A. Rfam: شرح الحمض النووي الريبي غير المشفر في الجينوم الكامل. الدقة الأحماض النووية. 200533: D121–4.

Nawrocki EP، Kolbe DL، Eddy SR. الجهنمية 1.0: استنتاج محاذاة الحمض النووي الريبي. المعلوماتية الحيوية. 200925: 1335-137.

حياة دي ، تشين جي إل ، لوكاسسيو بي إف ، لاند إم إل ، لاريمر إف دبليو ، هاوزر إل جي. الضال: التعرف على الجينات بدائية النواة وتحديد موقع بدء الترجمة. المعلوماتية الحيوية BMC. 201011: 119.

Mukherjee S ، Huntemann M ، Ivanova N ، Kyrpides NC ، Pati A. تلوث واسع النطاق لجينومات العزلات الميكروبية عن طريق التحكم في Illumina PhiX. الوقوف علم الجينوم. 201510: 18.

مارشلر-باور أ ، أندرسون جيه بي ، ديربيشاير إم كيه ، ديويز سكوت سي ، جونزاليس إن آر ، جوادز إم ، وآخرون. CDD: قاعدة بيانات مجال محفوظة لتحليل عائلة المجال البيني. الدقة الأحماض النووية. 200735: D237-40.

Kanehisa M و Goto S و Sato Y و Kawashima M و Furumichi M و Tanabe M. البيانات والمعلومات والمعرفة والمبدأ: العودة إلى التمثيل الغذائي في KEGG. الدقة الأحماض النووية. 201442: D199–205.

إدغار آر سي. بحث وتجميع الطلبات من حيث الحجم أسرع من الانفجار. المعلوماتية الحيوية. 201026: 2460-1.

Caspi R و Altman T و Billington R و Dreher K و Foerster H و Fulcher CA وآخرون. قاعدة بيانات MetaCyc لمسارات التمثيل الغذائي والإنزيمات ومجموعة BioCyc لقواعد بيانات المسار / الجينوم. الدقة الأحماض النووية. 201442: D459–71.

Punta M و Coggill PC و Eberhardt RY و Mistry J و Tate J و Boursnell C et al. قاعدة بيانات عائلات بروتين Pfam. الدقة الأحماض النووية. 201240: D290–301.

Selengut JD ، و Haft DH ، و Davidsen T ، و Ganapathy A ، و Gwinn-Giglio M ، و Nelson WC ، وآخرون. TIGRFAMs وخصائص الجينوم: أدوات لتعيين الوظيفة الجزيئية والعملية البيولوجية في جينومات بدائية النواة. الدقة الأحماض النووية. 200735: D260–4.

Jones P ، Binns D ، Chang HY ، Fraser M ، Li W ، McAnulla C ، وآخرون. InterProScan 5: تصنيف وظيفة البروتين على نطاق الجينوم. المعلوماتية الحيوية. 201430: 1236-40.

Chen IM و Markowitz VM و Chu K و Anderson I و Mavromatis K و Kyrpides NC et al. تحسين شروح الجينوم الميكروبي في سياق قاعدة بيانات متكامل. بلوس واحد. 20138 ، e54859.

Petersen TN ، Brunak S ، von Heijne G ، Nielsen H. SignalP 4.0: تمييز ببتيدات الإشارة من مناطق الغشاء. طرق نات. 201010: 785-6.

Krogh A ، Larsson B ، von Heijne G ، Sonnhammer EL. توقع طوبولوجيا البروتين عبر الغشاء باستخدام نموذج ماركوف المخفي: تطبيق لإكمال الجينوم. J مول بيول. 20013: 567–80.


المواد والأساليب

مجموعات البيانات

تم تنزيل تسلسل البروتين والجينوم المستخدم في هذه الدراسة من قاعدة بيانات المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) (Tatusova et al. 2014). في هذه الدراسة ، ركزنا على الأنواع البكتيرية التي يتوفر لها ما لا يقل عن عشرة جينومات متسلسلة ومشروحة بالكامل. كانت هذه البيانات متاحة لأربعة أنواع مُمْرِضة تم الإبلاغ عنها سابقًا أنها نسيليّة: MTBC (Hershberg et al. 2008 Comas and Gagneux 2011 Namouchi et al. 2012) ، يرسينيا بيستيس (Achtman et al. 1999 Chain et al.2004) ، السل الكاذب الوتدي (كونور وآخرون 2007 Soares وآخرون 2013) ، و فرانسيسيلا تولارينسيس (جوهانسون وآخرون 2004 نوبل وآخرون 2006 فوغلر وآخرون 2009). بالإضافة إلى ذلك ، اخترنا عشوائياً عشرة أنواع من البكتيريا المسببة للأمراض لم يتم الإبلاغ عنها على أنها نسيليّة. يسرد الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت ، جميع السلالات البكتيرية المستخدمة في بحثنا.

بعد تنزيل البيانات الجينية للسلالات التي تم فحصها ، استخدمنا المعلومات المتاحة على NCBI للتحقق يدويًا من أن هذه السلالات متسلسلة ومغلقة بالكامل بالفعل. تمت إزالة السلالات التي لا يتضمن وصف عملية تسلسل الجينوم خطوات الإنهاء ، مثل سد الفجوة ، من التحليل الإضافي لمنع التحيز الحسابي أثناء تحليل فقدان الجينات بسبب التسلسل غير الكامل. بالإضافة إلى ذلك ، أزلنا السلالات الناتجة عن التلاعبات المحددة لسلالات أخرى في المختبر والجينومات التي تمثل استنساخًا متعددًا مأخوذًا من موقع واحد بدلاً من سلالات مختلفة. يتم سرد السلالات التي تمت إزالتها في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت.

لقد اجتمعنا هالشريشيا القولونية و شيغيلا النيابة. مجموعات البيانات في مجموعة واحدة ، حيث تشير الدراسات إلى ذلك شيغيلا هو نوع فرعي من بكتريا قولونية (رولاند وآخرون ، 1998 بوبو وآخرون ، 2000). من 13 كلوستريديوم البوتولينوم السلالات المتوفرة في قاعدة بيانات NCBI ، قمنا بتحليل عشر سلالات فقط تنتمي إلى النسب 1 (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت).تم إجراء ذلك لأن السلالات الثلاثة المتبقية أظهرت قيمًا منخفضة بشكل ملحوظ لتعريف الأحماض الأمينية (AAI) عند مقارنتها بالسلالات الأخرى من نفس النوع وحتى عند مقارنتها مع بعضها البعض (56-60٪ AAI). تثير قيم AAI المنخفضة هذه مشكلة مع صحة الادعاء بأن هذه السلالات تنتمي إلى نفس الأنواع مثل السلالات العشر المتبقية.

تصنيف الأنواع البكتيرية التي تم فحصها إلى نسيلي وغير نسيلي

كان تصنيف الأنواع البكتيرية إلى نسيلي وغير نسيلي (أو إعادة اتحاد) يعتمد في البداية على الأدبيات التي تشير إلى أن الأنواع الأربعة التي نعتبرها نسيليًا هي بالفعل نسيلي. لمزيد من البحث في هذا الأمر ، أردنا فحص ما إذا كان لكل نوع نرى بعض المؤشرات على حدوث إعادة التركيب داخل جيناتهم. من المتوقع أن تكون الطرق المستخدمة للكشف عن الجينات المؤتلفة حساسة لطول التسلسلات التي تم فحصها. يمكن أن تتأثر أيضًا بإدراج المعادلات في التحليل والاختلافات في عدد التسلسلات المستخدمة. لذلك ، بالنسبة لكل نوع من أنواع البكتيريا ، قمنا بتحليل الجينات "الأساسية" ونسخة واحدة فقط (كما تم تحديدها بواسطة pangenomes لهذه الأنواع ، انظر أدناه). استخرجنا تسلسل الجينات الأساسية من ملفات fna (الملفات التي تتضمن تسلسل النيوكليوتيدات المشروحة لجميع الجينات في الكائن الحي المعطى) من السلالات التي تم فحصها وقمنا بمحاذاةهم باستخدام MUSCLE (Edgar 2004) مع المعلمات الافتراضية. تم اختيار 900 موقع مركزي لكل محاذاة لتحليل إعادة التركيب لمنع التحيزات الحسابية بسبب الاختلافات في طول الجين. تم تجاهل الجينات الأقصر من 900 نقطة أساس والجينات التي تحتوي على أكثر من 10٪ فجوات داخل إطار 900 نقطة أساس.

لاختبار ما إذا كانت محاذاة الجينات الأساسية المتعامدة تحتوي على دليل ذي دلالة إحصائية على إعادة التركيب ، طبقنا اختبار مؤشر Homoplasy المتماثل (PHI) (Bruen et al. 2006) باستخدام حزمة برامج Phipack (Bruen 2005). تم استخدام المعلمات التالية: حجم النافذة 100 نقطة أساس ، ص القيمة المحسوبة من 1000 تبديلات. قمنا بتصنيف المحاذاة على أنها "مؤتلفة" عندما يكون ملف ص كانت قيمة اختبار التقليب أقل من 0.05 لاختبار PHI و "nonrecombinant" عندما كانت أعلى من 0.05. تم اعتبار المحاذاة التي تفتقر إلى مواقع إعلامية كافية لإجراء اختبارات إعادة التركيب "غير إعلامية".

من المهم ملاحظة أننا لم نحاول استخدام PHI لفحص معدلات إعادة التركيب. بدلاً من ذلك ، كان اقتراحنا الوحيد هو فحص ما إذا كان يمكن العثور على بعض إشارات إعادة التركيب ضمن تسلسل الجينات المختلفة. من المحتمل أن تتطور الأنواع التي نادرًا ما يتم العثور على مثل هذه الإشارة فيها. في الوقت نفسه ، من المحتمل ألا تتطور الأنواع التي تُظهر العديد من الجينات إشارة لخضوعها لإعادة التركيب المتماثل كليًا.

تحديد العلاقة بين AAI والسيولة الجينومية للأنواع البكتيرية التي تم فحصها

لكل نوع / مجموعة بكتيرية ، استخدمنا FASTA (Pearson and Lipman 1988) لإجراء مقارنات زوجية لجميع السلالات الموجودة داخل المجموعة المحددة. تم تحديد التسلسلات المتعامدة من خلال طلب أفضل الضربات المتبادلة. باتباع العتبات التي حددتها POGO-DB ، لإدراج زوج مفترض لتقويم العظام في حسابات هوية الأحماض الأمينية ، يجب أن يكون له حد هوية لا يقل عن 30٪ عبر 70٪ على الأقل من طول البروتين (Lan et al. 2013) ). تم حساب متوسط ​​هوية الأحماض الأمينية (AAI) لزوج من الجينوم بعد ذلك على أنه متوسط ​​النسبة المئوية لـ AAI عبر جميع أزواج البروتين المتعامدة.

إزالة Paralog

لا توجد قواعد واضحة حول كيفية التعامل مع نظائر Paralogs عند توليد pangenome ، وبالتالي ، فإن إدراجها في pangenome قد يولد تحيزات حسابية. وبالتالي أزلنا جميع الجينات التي كان لها نظير في بعض أو كل الجينومات التي تم تحليلها من الاعتبار ، قبل توليد pangenomes. لإزالة المتشابهات ، تمت مقارنة تسلسل البروتين من كل جينوم مع جميع البروتينات الأخرى داخل هذا الجينوم ، باستخدام FASTA (Pearson and Lipman 1988). تمت تسمية تسلسلات الاستعلام التي تتعرف داخل تسلسل الجينوم بخلاف نفسها باسم "تسلسلات Paralog" وإزالتها من الملف ، جنبًا إلى جنب مع التسلسلات التي تتعرف عليها. كعتبة للنظر في التسلسل كمطابقة ، طلبنا ما لا يقل عن 80 ٪ NI بين التسلسلات.

بعد تحديد المشابهات ، استخدمنا FASTA (Pearson and Lipman 1988) لإزالة جميع التسلسلات المرتبطة بالبارالوغ من الملفات أيضًا. المتواليات ذات الصلة بالمشاهير هي تسلسلات جينية ترميز ليس لها نظائر في جينوم معين ولكنها تتعرف مع تسلسل Paralog في جينوم آخر أعلى من عتبة 80٪ NI. بسبب إزالة تسلسل Paralog سيتم تمثيل هذه التسلسلات تمثيلاً ناقصًا في pangenome وسيؤدي تضمينها في الحسابات إلى إنشاء القطع الأثرية. لتعظيم حساسية خطوة إزالة المتواليات ذات الصلة بالبارالوج والبارالوج ، أجرينا محاذاة التسلسل والمقارنة في كل من مستويات البروتين والنيوكليوتيدات. تم استخدام التسلسلات التي تم العثور عليها فقط غير متكافئة وغير مرتبطة في كل من مستويات البروتين والحمض النووي لبناء pangenome.

بناء بانجينوم

بعد إزالة جميع الجينات المرتبطة بالبارالوج والبارالوج ، أنشأنا مكتبة تحتوي على ملفات تسلسل البروتين المشروحة لكل من السلالات المدروسة. تم اختيار أحد ملفات البروتين بشكل عشوائي كملف قاعدة البيانات الأولية وتمت مقارنة الملف الثاني بقاعدة البيانات الأولية باستخدام FASTA (Pearson and Lipman 1988). تم اعتبار تسلسل بروتين الاستعلام الذي حدد تسلسل بروتين داخل قاعدة البيانات موجودًا في كلا الكائنات الحية. تم اعتبار الاستعلام الذي لا يتطابق مع أي تسلسل في قاعدة البيانات غائبًا عن قاعدة البيانات وتمت إضافته إلى قاعدة البيانات الأولية. كعتبة للنظر في التسلسل كمطابقة ، طلبنا 80 ٪ NI. بعد مقارنة جميع البروتينات الموجودة في جينوم الاستعلام بقاعدة البيانات ، تمت مقارنة ملف ثالث بقاعدة البيانات الموسعة وتكررت العملية على جميع ملفات تسلسل البروتين داخل المكتبة.

من المرجح أن يتجاوز استعلام البروتين الأقصر مقارنة ببروتين قاعدة البيانات الأطول حد 80٪ NI مقارنة ببروتين استعلام أطول مقارنة ببروتين قاعدة بيانات قصيرة. قد يؤدي هذا إلى إدخال تحيزات في بنية pangenome ، والتي من خلالها سيتغير pangenome المتولد اعتمادًا على الترتيب الذي تمت فيه مقارنة الملفات مع بعضها البعض. لمنع مثل هذه القطع الأثرية ، تمت مقارنة pangenome الذي تم إنشاؤه كما هو موضح أعلاه مع نفسه باستخدام FASTA (Pearson and Lipman 1988). تم دمج Pangenes التي تتطابق مع pangenes بخلاف نفسها فوق العتبة الموصوفة أعلاه في بنجين واحد.

تم استخدام نتائج محاذاة FASTA لحساب عدد السلالات التي تم العثور فيها على كل بنجين داخل الأنواع. تم استخدام توزيع هذه الأرقام لتكوين مخطط pangenome للأنواع (انظر الشكلين 2 و 3 ، العمود الأيسر).

قطع Pangenome لعشرة أنواع بكتيرية معاد توحيدها. لتوليد هذه المؤامرات ، تمت مقارنة جميع السلالات داخل النوع وتم تجميع الجينات المتعامدة معًا في مجموعات. يسمح هذا بحساب التكرار الذي يتم من خلاله العثور على كل مجموعة من الجينات المتعامدة (يشار إليها باسم "pangene") بين أعضاء نوعها. تم تصوير توزيعات الترددات التي توجد بها pangenes داخل كل نوع. يتم توفير قطعتين لكل نوع: اليسار: مخطط pangenome البروتيني - تم إنشاؤه بناءً على تسلسل البروتين المشروح على اليمين: مخطط pangenome المصحح من HGT-artifact - تمت مقارنة البروتين pangenome مع تسلسل DNA الكامل للسلالات التي تم تكوينها منها. ظهرت Pangenes في أقل من 50 ٪ من السلالات داخل الأنواع على مستوى البروتين المشروح ، ولكن في أكثر من 75 ٪ من السلالات على مستوى الحمض النووي بالكامل ، تمت إزالتها من المؤامرة.

قطع Pangenome لعشرة أنواع بكتيرية معاد توحيدها. لتوليد هذه المؤامرات ، تمت مقارنة جميع السلالات داخل النوع وتم تجميع الجينات المتعامدة معًا في مجموعات. يسمح هذا بحساب التكرار الذي يتم من خلاله العثور على كل مجموعة من الجينات المتعامدة (يشار إليها باسم "pangene") بين أعضاء نوعها. تم تصوير توزيعات الترددات التي توجد بها pangenes داخل كل نوع. يتم توفير قطعتين لكل نوع: اليسار: مخطط pangenome البروتيني - تم إنشاؤه بناءً على تسلسل البروتين المشروح على اليمين: مخطط pangenome المصحح من HGT-artifact - تمت مقارنة البروتين pangenome مع تسلسل DNA الكامل للسلالات التي تم تكوينها منها. ظهرت Pangenes في أقل من 50 ٪ من السلالات داخل الأنواع على مستوى البروتين المشروح ، ولكن في أكثر من 75 ٪ من السلالات على مستوى الحمض النووي بالكامل ، تمت إزالتها من المؤامرة.

قطع Pangenome لأربعة أنواع بكتيرية نسيلية. لتوليد هذه المؤامرات ، تمت مقارنة جميع السلالات داخل النوع وتم تجميع الجينات المتعامدة معًا في مجموعات. يسمح هذا بحساب التكرار الذي يتم من خلاله العثور على كل مجموعة من الجينات المتعامدة (يشار إليها باسم "pangene") بين أعضاء نوعها. تم تصوير توزيعات الترددات التي توجد بها pangenes داخل كل نوع. يتم توفير قطعتين لكل نوع: اليسار: مخطط pangenome البروتيني - تم إنشاؤه بناءً على تسلسل البروتين المشروح إلى اليمين: مؤامرة pangenome HGT المصححة - تمت مقارنة البروتين pangenome مع تسلسل DNA الكامل للسلالات التي تم تكوينها منها. ظهرت Pangenes في أقل من 50 ٪ من السلالات داخل الأنواع على مستوى البروتين المشروح ، ولكن في أكثر من 75 ٪ من السلالات على مستوى الحمض النووي بالكامل ، تمت إزالتها من المؤامرة.

قطع Pangenome لأربعة أنواع بكتيرية نسيلية. لتوليد هذه المؤامرات ، تمت مقارنة جميع السلالات داخل النوع وتم تجميع الجينات المتعامدة معًا في مجموعات. يسمح هذا بحساب التكرار الذي يتم من خلاله العثور على كل مجموعة من الجينات المتعامدة (يشار إليها باسم "pangene") بين أعضاء نوعها. تم تصوير توزيعات الترددات التي توجد بها pangenes داخل كل نوع. يتم توفير قطعتين لكل نوع: اليسار: مخطط pangenome البروتيني - تم إنشاؤه بناءً على تسلسل البروتين المشروح على اليمين: مخطط pangenome المصحح من HGT-artifact - تمت مقارنة البروتين pangenome مع تسلسل DNA الكامل للسلالات التي تم تكوينها منها. ظهرت Pangenes في أقل من 50 ٪ من السلالات داخل الأنواع على مستوى البروتين المشروح ، ولكن في أكثر من 75 ٪ من السلالات على مستوى الحمض النووي بالكامل ، تمت إزالتها من المؤامرة.

تحليل اكتساب الجينات (HGT)

تم إجراء هذا التحليل لتحديد ما إذا كانت البانجينات "النادرة" (الموجودة في 25٪ أو أقل من الجينوم) من المحتمل أن تكون نتيجة اكتساب الجينات من خلال HGT. تحقيقا لهذه الغاية ، تمت مقارنة pangenome الأولي مع ملفات تسلسل الحمض النووي الكامل للسلالات البكتيرية المدروسة باستخدام برنامج FASTA TFASTX (الذي يسمح بمقارنة استعلام بروتيني مع تسلسل DNA) (Pearson and Lipman 1988). البانجينات التي تعتبر "نادرة" بسبب إدخالها إلى الأنواع من خلال HGT ستغيب عن الجينومات التي لا توجد فيها على مستوى الحمض النووي أيضًا. ومع ذلك ، إذا تم تحديد البنجين على أنه "نادر" استنادًا إلى التعليقات التوضيحية للبروتين ولكنه موجود في العديد من الجينومات الإضافية عند مقارنته بالحمض النووي الكامل ، فمن غير المحتمل أن يكون نتيجة HGT. وبدلاً من ذلك ، من المرجح جدًا أن تمثل هذه البانجينيات تعليقات خاطئة تحدث فقط في جينوم واحد أو عدد قليل من الجينومات. إذا تم العثور على pangene وفقًا لمحاذاة مستوى الجينوم الكامل TFASTX في أكثر من 75 ٪ من سلالات الأنواع ، ولكن وفقًا لمحاذاة مستوى شرح البروتين FASTA ، تم العثور عليه في أقل من 50 ٪ من السلالات ، كقطعة أثرية وإزالتها من pangenome الأولي. تظهر pangenomes بعد إزالة القطع الأثرية المحتملة في المخططات المعروضة في الشكلين 2 و 3 ، العمود الأيمن.

تقدير نسبة Pangenes "القريبة من النواة" المفقودة التي يتم الاحتفاظ بها كجينات خادعة

بالنسبة إلى البانجينات "القريبة من النواة" ، سألنا عن نسبة الجينومات التي غابت عنها هذه الجينات على مستوى البروتين والتي لا تزال تحتوي عليها على مستوى الحمض النووي للجينوم بأكمله. تحقيقا لهذه الغاية ، تمت مقارنة تسلسل البروتين لهذه البانجين مع تسلسل الحمض النووي للجينومات التي وجد أنها غائبة على مستوى البروتين المشروح باستخدام TFASTX.

جيل من Pangenomes RAST المستندة إلى التعليقات التوضيحية

للحصول على شروح متسقة من pangenomes البكتيرية التي تم فحصها ، استخدمنا خادم الويب للتعليقات التوضيحية RAST (عزيز وآخرون ، 2008 Overbeek وآخرون ، 2014) ، مع معلمات افتراضية. قمنا بعد ذلك ببناء pangenomes المستندة إلى تسلسل البروتين ، استنادًا إلى هذه التعليقات التوضيحية التي تم إنشاؤها تلقائيًا ، وقمنا بتصحيحها لوجود عناصر HGT محتملة (كما هو موضح في pangenomes التي تم إنشاؤها بناءً على تعليقات NCBI ، انظر التين التكميلي S1 والبيانات التكميلية ، التكميلية المواد عبر الإنترنت ، الأعمدة اليسرى).


حواشي

1 (GenBank BI386673 بتاريخ 20 مايو 2003). تم نشر هذا التسلسل على الصفحة الرئيسية لـ Cytochrome P450 في عام 2005 ، على الرغم من أنه لم يتم التعرف عليه كملف CYP74 عضو العشيرة في ذلك الوقت.

2 Unikonts و bikonts والحفريات هي ثلاثة أقسام أحادية الخلية من حقيقيات النوى تحددها طرق بناء شجرة متعددة الجينات ، باستخدام محاذاة تسلسلية كبيرة متسلسلة [15]. الأحاديات المورفولوجية (الحيوانات ، الفطريات ، Amoebozoa) و bikonts (النباتات ، الحويصلات الهوائية ، Stramenopiles ، Rhizaria) لها سوط واحد أو اثنين في نقطة معينة من دورة حياتها. تحتوي الحفريات على أخدود تغذية بطني مميز على سطح الخلية (الأمثلة على ذلك Jakobids ، يوجلينا, الجيارديا، المثقبيات). يجادل كافاليير سميث بأن الحفريات عبارة عن قطع من البيكونت [16].

3 Xenambulacraria = نصفي حبال + شوكيات الجلد + xenoturbellarids.

4 يبدو أن عدد الجينات 236 P450 لـ Branchiostoma (lancelet) مرتفع مقارنة بالحبال الأخرى. ورقة بوتنام وآخرون. [23] يدافع عن علاقة تماثل صارمة إلى حد ما مع الفقاريات ، لذلك يجب أن يكون للفقاريات P450s سلائف ohnolog في lancelet. توسع كبير غير متوقع. قد يكون جزء من الزيادة ناتجًا عن احتساب الأليلات كجينات مختلفة. لم يتم تسمية P450s من lancelet بشكل منهجي حتى الآن ، لذا لا يمكن تأكيد هذا الاحتمال الآن. الاحتمال الآخر هو ازدهار الجينات الدراماتيكي في بعض العشائر. لاحظ في الشكل 2 القطاع الكبير جدًا في CYP2 عشيرة بين الساعة 08.00 و 09.00 التي تبدو وكأنها ازدهار جيني كبير. تمت مناقشة أزهار P450s بواسطة Sezutsu وآخرون. [10].

5 RPL28 يحدث في موقعين جينومين مختلفين في لانسيليت كما هو موضح في الشكل 3.

6 الفطريات لديها حوالي 15-20 عشيرة لم يتم تحديدها بالكامل بعد. سي واي بي 51 و CYP7 يظهر أفراد العشيرة في الفطريات. تم العثور على توزيع 7 أعضاء عشيرة فقط في بعض الفطريات الخيطية مما يشير بقوة إلى انتقال جانبي من الحيوانات إلى الفطريات. لذلك ، يظهر على شكل علامة النجمة في الشكل 4. تختلف العشائر الفطرية الأخرى عن عشائر الحيوانات.

8 XM_001627677 ، XM_001627678 ، XM_001627679.

10 مجموعة Fugu: ENSTRUG00000004549 ، مجموعة أسماك الزرد: ENSDARG00000060094.

11 تواريخ عقد الاختلاف المبكر للحيوانات: السوطيات القمعية مقابل جميع الحيوانات الأخرى 863 مليونًا (711-1052) الإسفنج مقابل ctenophores ، تريشوبلاكس، cnidarians و bilaterians 812 Ma (671-985) ctenophores مقابل تريشوبلاكس، cnidarians و bilaterians 733 مليون (603-893) تريشوبلاكس مقابل الكائنات المجوفة والثنائية 592 مليون سنة (551-696).

مراجع

Wisedpanichkij R و Grams R و Chaijaroenkul W و amp Na-Bangchang K

. 2011 اعتراض على وجود إنزيمات السيتوكروم P450 المحفوظة بالتسلسل في المتصورة المنجلية . اكتا تروب. 119، 19-22. دوي:

2011 ال ميديكاغو يوفر الجينوم نظرة ثاقبة لتطور التكافل الجذري. طبيعة سجية 480، 520-524.doi:

1996 P450 superfamily: تحديث للتسلسلات الجديدة ، ورسم الخرائط الجينية ، وأرقام المدخلات والتسميات. علم الوراثة الدوائية 6، 1–42. دوى:

. 2006 تاريخ تطوري منقح لعائلة CYP1A الفرعية: تكرار الجينات ، وتحويل الجينات ، والاختيار الإيجابي. جيه مول. Evol. 62، 708-717. دوي:

. 1995 مجموعة من جينات السيتوكروم P450 لعائلة CYP6 في ذبابة المنزل. بيول خلية الحمض النووي. 14، 73-82. دوى:

. 1992 تطور مجموعة جينية بشرية متعددة الأشكال للسيتوكروم P450: CYP2D6. علم الجينوم 14، 49-58. دوي:

Kubota A و Stegeman JJ و Goldstone JV و Nelson DR و Kim EY و Tanabe S & amp Iwata H

. جينات 2011 Cytochrome P450 CYP2 في الغاق الشائع: العلاقات التطورية مع 130 تسلسل عشيرة CYP2 ديابسيد والتأثيرات الكيميائية على تعبيرها. شركات بيوتشيم. فيسيول. توكسيكول. فارماكول. 153، 280-289.doi:

Nelson DR و Zeldin DC و Hoffman SM و Maltais LJ و Wain HM & amp Nebert DW

. 2004 مقارنة بين جينات السيتوكروم P450 (CYP) المأخوذة من الفأر والجينوم البشري ، بما في ذلك توصيات التسميات للجينات والجينات الكاذبة ومتغيرات اللصق البديلة. علم الوراثة الدوائية 14، 1–18. دوى:

Sezutsu H و Le Goff G و amp Feyereisen R.

. 2013 أصول التنوع P450. فيل. عبر. R. Soc. ب 368، 20120428.doi:

. 1999 السيتوكروم P450 وتفرد الأنواع. قوس. بيوتشيم. بيوفيز. 369، 1-10. دوى:

. 1998 تطور ميتازوان السيتوكروم P450. شركات بيوتشيم. فيسيول. 121، 15-22. منحة جوجل

. 2003 مقارنة بين P450s من الإنسان و fugu: 420 مليون سنة من تطور P450 الفقاريات. قوس. بيوتشيم. بيوفيز. 409، 18-24. دوي:

لي دي إس ، نيوش بي ، هامبرج إم أند رامان سي إس

. 2008 رؤى هيكلية في المسارات التطورية للأنزيمات التخليقية الحيوية للأوكسيليبين. طبيعة سجية 455، 363 - 368. دوى:

بوركي ف ، شالتشيان-تبريزي ك & أمبير باولوسكي ج

. 2008 علم الجينوميات يكشف عن "مجموعة عملاقة" تضم معظم حقيقيات النوى الضوئية. بيول. بادئة رسالة. 4، 366-369.

. 2006 تطور الخلية وتاريخ الأرض: الركود والثورة. فيل. عبر. R. Soc. ب 361، 969-1006. دوى:

. 2012 تأصيل شجرة حقيقية النواة ببروتينات الميتوكوندريا والبكتيريا. مول. بيول. Evol. 29، 1277-1289. دوي:

Yoshida Y و Aoyama Y و Noshiro M & amp Gotoh O

. 2000 ستيرول 14-ديميثيلاز P450 (CYP51) يوفر اختراقًا للمناقشة حول تطور عائلة جين السيتوكروم P450 الفائقة. بيوتشيم. بيوفيز. الدقة. كومون. 273، 799-804.

Rezen T، Debeljak N، Kordis D & amp Rozman D

. 2004 جوانب جديدة في تطور لانوستيرول 14 ألفا-ديميثيلاز وسيتوكروم P450: تنويع اللانوستيرول / سيكلو أرتينول والانتقال الجانبي. جيه مول. Evol. 59، 51-58. دوي:

. 2002 الأصل الجديد للبكتيريا الأثرية ، والجذر البكتيري للشجرة العالمية والتصنيف البكتيري الضخم. كثافة العمليات J. Syst. Evol. ميكروبيول. 52، 7-76. كروسريف ، PubMed ، ISI ، الباحث العلمي من Google

كاتشن جي إم ، كونري شبيبة وأمبير بوستليثويت JH

. 2009 التعرف الآلي على التخليق المحفوظ بعد تكرار الجينوم الكامل. الدقة الجينوم. 19، 1497-1505. دوي:

Housworth EA & amp Postlethwait J

. 2002 تدابير الحفظ التركيبي بين أزواج الأنواع. علم الوراثة 162، 441 - 448. PubMed ، الباحث العلمي من Google

2008 جينوم الأمفيوكس وتطور النمط النووي الحبلي. طبيعة سجية 453، 1064-1071. دوى:

Verslycke T و Goldstone JV و amp Stegeman JJ

. 2006 عزل وتطور جينات السيتوكروم P450 الجديدة من tunicates (سيونا spp.): خط CYP3 في الديوتروستوم المبكر؟ مول. نسالة. Evol. 40، 760-771. دوى:

. 1970 التطور عن طريق الازدواج الجيني . برلين ، ألمانيا: سبرينغر. كروسريف ، الباحث العلمي من Google

. 2000 المتانة: إنها ليست المكان الذي تعتقد أنه موجود فيه. نات. جينيه. 25، 3-4. دوى:

. 2007 جينوم الزرد في السياق: اختفاء ohnologs. J. إكسب. زول. ب مول. ديف. Evol. 308، 563-577.doi:

Postlethwait J، Amores A، Cresko W، Singer A & amp Yan YL

. 2004 تقسيم الوظائف الفرعية ، الإشعاع البعيد وشرح الجينوم البشري. اتجاهات الجينات. 20، 481-490.doi:

. 2005 جولتان من تكرار الجينوم الكامل في أسلاف الفقاريات. بلوس بيول. 3، e314.doi:

. 2005 من 2R إلى 3R: دليل على ازدواج الجينوم الخاص بالأسماك (FSGD). مقولات بيولوجية 27، 937-945. دوي:

Siegel N و Hoegg S و Salzburger W و Braasch I & amp Meyer A.

. 2007 علم الجينوم المقارن لمجموعات ParaHox لأسماك teleost: تفكك مجموعة الجينات والاحتفاظ بمجموعات الجينات بعد تكرار الجينوم الكامل. علم الجينوم BMC 8، 312. دوى:

. 2008 نظرة ثاقبة في علم الجينوميات cyclostome: قبل 2R أو بعد 2R. زول. علوم. 25، 960–968.doi:

كوراكو إس وماير إيه وكوراتاني إس

. 2009 توقيت الازدواجية في الجينوم بالنسبة إلى أصل الفقاريات: هل تباعدت السيكلوستومات قبل أم بعد؟ مول. بيول. Evol. 26، 47-59. دوي:

2009 تقييم جذر الحيوانات ثنائية الطور باستخدام طرق نسالة قابلة للتطوير. بروك. R. Soc. ب 276، 4261-4270.doi:

. 2012 التحليلات الوراثية والوظيفية لعائلة السيتوكروم P450 4. مول. نسالة. Evol. 62، 458-471.doi:

Edgecombe GD و Giribet G و Dunn CW و Hejnol A و Kristensen RM و Neves RC و Rouse GW و Worsaae K & amp Sorensen MV

. 2011 علاقات ميتازوان عالية المستوى: التقدم الأخير والأسئلة المتبقية. منظمة. الغواصون. Evol. 11، 151 - 172.

Xian-Guang H ، Aldridge RJ ، Siveter DJ ، Siveter DJ & amp Xiang-hong F

. 2002 دليل جديد على علم التشريح والتطور في الفقاريات الأقدم. بروك. R. Soc. لوند. ب 269، ١٨٦٥-١٨٦٩.doi:

Xian-Guang H ، Aldridge RJ ، Bergström J ، Siveter DJ ، Siveter DJ & amp Xiang-hong F

. 2003 الحفريات الكمبري في تشنغجيانغ ، الصين: ازدهار الحياة الحيوانية المبكرة . لندن ، المملكة المتحدة: Blackwell Publishing Ltd. كروسريف ، الباحث العلمي من Google

Zhu M و Zhao W و Jia L و Lu J و Qiao T & amp Qu Q

. 2009 أقدم osteichthyan مفصلي يكشف عن شخصيات الفسيفساء gnathostome. طبيعة سجية 458، 469-474.

Sansom IJ و Smith MM و amp Smith MP

. 1996 قشور ثيلودونت والأسماك الشبيهة بأسماك القرش من Ordovician of Colorado. طبيعة سجية 379، 628-630. دوى:

. 2009 الحيوانات (ميتازوا). في الجدول الزمني للحياة (محرران

) ، ص 223-230. أكسفورد ، المملكة المتحدة: مطبعة جامعة أكسفورد. منحة جوجل

هيدجز SB و Blair JE و Venturi ML و amp Shoe JL

. 2004 مقياس زمني جزيئي لتطور حقيقيات النوى وظهور الحياة المعقدة متعددة الخلايا. BMC Evol. بيول. 42. دوى:

هوفمان بي إف ، كوفمان إيه جيه ، هالفرسون جي بي وأمبير شراج دي بي

. 1998 أرض كرة ثلجية بطرازات حديثة. علم 281، 1342-1346. دوي:

. 2008 Snowball Earth: الوضع والتطورات الجديدة. GEO (IGC Special Climate Issue) 11، 44-46. منحة جوجل

كولييه إف ، بوبوفيسي سي ، فيليت آر وأمبير بيرنباوم د

. 2000 مجموعات جينية MetaHox. J. إكسب. زول. 288، 345–351.

رايان جيه إف ، بانغ ك ، موليكين جيه سي ، مارتينديل إم كيو وأمبير باكسيفانيس إيه دي

. 2010 تكملة المجال المنزلي من ctenophore Mnemiopsis leidyi يشير إلى أن Ctenophora و Porifera تباعدا قبل ParaHoxozoa. Evodevo 19. doi:

Pett W و Ryan JF و Pang K و Mullikin JC و Martindale MQ و Baxevanis AD و amp Lavrov DV

. 2011 تطور الميتوكوندريا المتطرف في ctenophore Mnemiopsis leidyi: نظرة ثاقبة من mtDNA والجينوم النووي. الحمض النووي للميتوكوندريا 22، 130-142.

2008 أخذ عينات واسعة من السلالات الحيوانية يحسن دقة شجرة الحياة الحيوانية. طبيعة سجية 452، 745-749.doi:

2005 تحدد الخريطة الجينية لأسماك الزرد كروموسومات أسلاف الفقاريات. الدقة الجينوم. 15، 1307-1314. دوي:

Kevei Z و Seres A و Kereszt A و Kalo P و Kiss P و Toth G و Endre G & amp Kiss GB

. 2005 تم الكشف عن تزاوج دقيق كبير مع إضاءات تطورية جديدة بين أرابيدوبسيس والنباتات البقولية على الرغم من نقص التركيب الكلي. مول. جينيه. علم الجينوم 274، 644-657. دوى:

2012 الحفظ الشامل للتركيبات الدقيقة القديمة عبر metazoans بسبب القيود التنظيمية لرابطة الدول المستقلة. الدقة الجينوم. (دوى: 10.1101 / غرام 139725.112). كروسريف ، الباحث العلمي من Google

. 2003 2R or not 2R: اختبار فرضيات ازدواج الجينوم في الفقاريات المبكرة. J. الهيكل. Funct. جينوم. 3، 85-93. دوى:

. 2003 التوزيع الزمني لأحداث الازدواج الجيني في مجموعة من عائلات الجينات البشرية المحفوظة للغاية. مول. بيول. Evol. 20، 154–161. كروسريف ، PubMed ، الباحث العلمي من Google

Kent WJ و Sugnet CW و Furey TS و Roskin KM و Pringle TH و Zahler AM و amp Haussler D

. 2002 متصفح الجينوم البشري في جامعة كاليفورنيا. الدقة الجينوم. 12، 996-1006.

2011 قاعدة بيانات مستعرض الجينوم UCSC: تحديث 2011. الدقة الأحماض النووية. 39، D876-D882.doi:

2009 قاعدة بيانات مستعرض الجينوم UCSC: تحديث 2009. الدقة الأحماض النووية. 37، D755 – D761.doi:

. 2002 BLAT: أداة محاذاة تشبه الانفجار. الدقة الجينوم. 12، 656-664. دوى:

2008 ال تريشوبلاكس الجينوم وطبيعة Placozoans. طبيعة سجية 454، 955-960.doi:

يكشف جينوم شقائق النعمان البحري لعام 2007 عن ذخيرة جينية أسلاف eumetazoan وتنظيم الجينوم. علم 317، 86–94. doi:

2011 باستخدام ملف ديجيتيفيرا أكروبورا الجينوم لفهم استجابات المرجان للتغير البيئي. طبيعة سجية 476، 320 - 323 دوى:

2006 الدفاعية الكيميائية: جينات الاستشعار والاستجابة البيئية في Strongylocentrotus بوربوراتوس الجينوم. ديف. بيول. 300، 366-384.

. 2008 جينات الاستشعار والاستجابة البيئية في Cnidaria: المادة الكيميائية الدفاعية في شقائق النعمان البحرية Nematostella vectensis . خلية بيول. توكسيكول. 24، 483-502.

Goldstone JV و McArthur AG و Kubota A و Zanette J و Parente T و Jonsson ME و Nelson DR & amp Stegeman JJ

. 2010 تحديد والتعبير التنموي للمكمل الكامل لجينات السيتوكروم P450 في الزرد. جينوم BMC. 11، 643.doi:

بالدوين دبليو إس ، ماركو بي بي وأمبير نيلسون د

. 2009 كانت عائلة السيتوكروم P450 (CYP) الجينية الفائقة في Daphnia pulex . جينوم BMC. 10دوى 169.

. 2006 تطور الحشرة P450. بيوتشيم. شركة عبر. 34، 1252-1255.doi:

. 2011 الملف الشخصي المعجل عمليات البحث HMM. PLoS Comput. بيول. 7، e1002195.doi:

جونسون إل إس ، إيدي إس آر وأمبير بورتغالي إي

. 2010 نموذج ماركوف المخفي سرعة مجريات الأمور وتكرارية إجراء بحث HMM. المعلوماتية الحيوية BMC 11، 431. دوى:

. 1998 نماذج ماركوف الشخصية المخفية. المعلوماتية الحيوية 14، 755–763.doi:

. 2004 MUSCLE: طريقة محاذاة متعددة التسلسل مع تقليل الوقت وتعقيد المكان. المعلوماتية الحيوية BMC 5، 113. دوى:

. 2006 RAxML-VI-HPC: تحليلات النشوء والتطور القائمة على الاحتمالية القصوى مع الآلاف من الأصناف والنماذج المختلطة. المعلوماتية الحيوية 22، 2688-2690.doi:

Ott M، Zola J، Aluru S & amp Stamatakis A

. 2007 تحليل النشوء والتطور على نطاق واسع على نطاق واسع على أساس الاحتمالية القصوى على IBM BlueGene / L. مؤتمر الحوسبة الفائقة ACM / IEEE 2007 (محرر.

) ، نيويورك ، نيويورك: Association for Computing Machinery. منحة جوجل

. 2006 نماذج التطور الوراثي لعدم تجانس المعدل: منظور حوسبة عالية الأداء. في وقائع الندوة العشرون للمعالجة المتوازية والموزعة IEEE / ACM الدولية، رودوس ، اليونان. بيسكاتواي ، نيوجيرسي: IEEE. منحة جوجل

Stamatakis A و Hoover P & amp Rougemont J

. 2008 خوارزمية تمهيدية سريعة لخوادم الويب RAxML. النظام. بيول. 57، 758-771.

. 2003 تطبيق التمهيد في إعادة بناء نسالة. ستات. علوم. 18، 256-267. كروسريف ، آي إس آي ، الباحث العلمي من جوجل

. 2011 Arthropod CYPomes يوضح الإيقاع والوضع في تطور P450. بيوكيم. بيوفيز. اكتا 1814، 19-28. دوي:

. 2007 تطور سريع للولادة والوفاة خاص بجينات السيتوكروم P450 الغريبة الحيوية في الفقاريات. بلوس جينيت. 3، e67.doi:

2008 CYP3 phylogenomics: دليل على الاختيار الإيجابي لـ CYP3A4 و CYP3A7. فارماكوجينيت. جينوم. 18، 53-66. دوى:

برينر إس ، إلغار جي ، ساندفورد آر ، ماكراي أ ، فينكاتيش ب وأمبير أباريسيو إس

. 1993 توصيف جينوم السمكة المنتفخة (Fugu) كنموذج مضغوط جينوم الفقاريات. طبيعة سجية 366، 265-268.

Avadhani NG ، Sangar MC ، Bansal S & amp Bajpai P.

. 2011 استهداف ثنائي النسق للسيتوكروم P450s للشبكة الإندوبلازمية والميتوكوندريا: مفهوم الإشارات الكيميرية. FEBS J. 278، 4218-4229. دوى:

Bhagwat SV ، Biswas G ، Anandatheerthavarada HK ، Addya S ، Pandak W & amp Avadhani NG

. 1999 خاصية الاستهداف المزدوج لتسلسل إشارة N-terminal P4501A1. استهداف البروتينات غير المتجانسة للشبكة الإندوبلازمية والميتوكوندريا. J. بيول. تشيم. 274، 24 014-24 022.doi:

Neve EP & amp Ingelman-Sundberg M

. 2001 تحديد وتوصيف إشارة استهداف الميتوكوندريا في الفئران سيتوكروم P450 2E1 (CYP2E1). J. بيول. تشيم. 276، 11 317-11 322. دوى:

. 2011 أصل وتطور قدرة الربط الترابطي للمستقبلات النووية. مول. زنزانة. إندوكرينول. 334، 21-30. دوي:

. 2005 Xenobiotics وتطور الحيوانات متعددة الخلايا: ظهور وتنويع عوامل النسخ التي يتم تنشيطها بواسطة ligand. تكامل. شركات بيول. 45، 172 - 178.

Schierwater B ، Kamm K ، Srivastava M ، Rokhsar D ، Rosengarten RD & amp Dellaporta SL

. 2008 الذخيرة المبكرة لجينات ANTP: رؤى من جينوم placozoan. بلوس واحد 3، e2457.doi:

جونسون NS ، Yun SS ، Thompson HT ، Brant CO & amp Li W

. 2009 فرمون مُركَّب يحث على حركة المنبع في أنثى لامبري البحر ويستدعيهم في الفخاخ. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 106، 1021-1026. دوى:

هيرنانديز ري ، Putzke AP ، Myers JP ، Margaretha L & amp Moens CB

. 2007 إنزيمات Cyp26 تولد نمط استجابة حمض الريتينويك الضروري لتطوير الدماغ المؤخر. تطوير 134، 177–187.

Emoto Y و Wada H و Okamoto H و Kudo A و amp Imai Y

. 2005 إنزيم استقلاب حمض الريتينويك Cyp26a1 ضروري لتحديد مناطق الدماغ الخلفي والحبل الشوكي في أسماك الزرد. ديف. بيول. 278، 415-427.doi:

McCaffery P و Wagner E و O'Neil J و Petkovich M & amp Drager UC

. 1999 مناطق الشبكية الظهرية والبطنية المحددة من خلال تخليق حمض الريتينويك ، والتحلل والتعبير عن المستقبلات النووية. ميكانيكي. ديف. 82، 119-130. دوى:

كان را ، فولبيتشيلي دالي إل ، بوزارد ب ، شريفاستافا-رانجان بي ، لي واي ، تشو سي ، أمبير كننغهام إل

. 2005 Arf family GTPases: الأدوار في حركة الأغشية وديناميكيات الأنابيب الدقيقة. بيوتشيم. شركة عبر. 33، ١٢٦٩-١٢٧٢.

. 2005 Arf-like GTPase Arl1 ودورها في حركة الأغشية. بيوتشيم. شركة عبر. 33، 601-605. دوى:

كان را ، شيرفيلس ج ، إلياس إم ، لوفرينج آر سي ، مونرو إس أند شورمان أ

. 2006 تسمية لعائلة Arf البشرية لبروتينات ربط GTP: بروتينات ARF و ARL و SAR. J. خلية بيول. 172، 645-650. doi:

Nebert D و Wikvall K و amp Miller WL

. 2013 السيتوكرومات البشرية P450 في الصحة والمرض. فيل. عبر. R. Soc. ب 368، 20120431.doi:

Markov GV و Tavares R و Dauphin-Villemant C و Demeneix BA و Baker ME & amp Laudet V

. 2009 تطوير مستقل لمسارات إشارات هرمون الستيرويد في metazoans. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 10611 913-11 918. دوى:

. 2007 وجود المنشطات الجنسية وجينات السيتوكروم P450 في الأمفيوكسوس. طب الغدد الصماء 148، 3554–3565.doi:

Castro LF ، و Santos MM ، و Reis-Henriques MA

. 2005 البيئة الجينومية حول جين Aromatase: رؤى تطورية. BMC Evol. بيول. 5، 43. دوى:

Nebert DW ، Nelson DR & amp Feyereisen R

. 1989 تطور جينات السيتوكروم P450. Xenobiotica 19، 1149-1160. دوي:

. 2005 نشأة وتطور مجموعات الجينات المثلية. نات. القس جينيه. 6، 881-892.

Larroux C و Fahey B و Degnan SM و Adamski M و Rokhsar DS و amp Degnan BM

. 2007 تسبق الكتلة الجينية لـ NK homeobox أصل جينات Hox. بالعملة. بيول. 17، 706-710.doi:

Mulley JF و Chiu CH & amp Holland PW

. 2006 تفكك كتلة homeobox بعد تكرار الجينوم في teleosts. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 103، 10369-10 372.

. 1995 انعكاس المحور الظهري المركزي. طبيعة سجية 373، 110-111.

. 1996 انعكاس المحور الظهري المركزي: منظور النشوء والتطور. مقولات بيولوجية 18، 251-254.

. 1822 اعتبارات عامة حول الفقرات. مم. المصحف. اصمت. نات. 9، 89-119. منحة جوجل

. 2006 مقياس زمني جزيئي لتطور حقيقيات النوى تمت إعادة معايرته مع سجل الحفريات الدقيقة المستمر. بروك. R. Soc. ب 273، ١٨٦٧-١٨٧٢.

. 2010 غزو الأرض بالنباتات: متى وأين؟ فيتول جديد. 188، 306-309. كروسريف ، PubMed ، ISI ، الباحث العلمي من Google

ويلمان سي إتش ، أوسترلوف بل ، وأمبير محي الدين يو

. 2003 شظايا من أقدم النباتات البرية. طبيعة سجية 425، 282-285. دوي:

Vinogradov SN و Hoogewijs D & amp Arredondo-Peter R.

. 2011 ما هي أصول وتطور الهيموجلوبين النباتي.؟ كومون. تكامل. بيول. 4، 443-445.doi:

Ghoshroy S و Binder M و Tartar A و Robertson DL

. 2010 التطور الجزيئي لمركب الجلوتامين II: دليل علم الوراثة لحدث نقل الجينات غير التعايش الداخلي في وقت مبكر من تطور النبات. BMC Evol. بيول. 10، 198. دوى:

إميلياني جي ، فوندي إم ، فاني آر أند جيريبالدو إس

. 2009 نقل جيني أفقي في أصل استقلاب فينيل بروبانويد: تكيف رئيسي للنباتات مع الأرض. بيول. مباشر. 4، 7.دوي:

. 2010 التخليق الحيوي Phenylpropanoid. مول. مصنع 3، 2-20. دوى:

Batard Y و Schalk M و Pierrel MA و Zimmerlin A و Durst F & amp Werck-Reichhart D

. 1997 تنظيم سينامات 4-هيدروكسيلاز (CYP73A1) في درنات الخرشوف بالقدس استجابة للجروح والمعالجات الكيميائية. نبات فيزيول. 113، 951-959. كروسريف ، PubMed ، الباحث العلمي من Google

. 2006 التمثيل الغذائي الوسيط في قنفذ البحر: الاستنتاجات الأولى من تسلسل الجينوم. ديف. بيول. 300، 282-292.

Kaneko M و Ohnishi Y و amp Horinouchi S

. 2003 سينامات: أنزيم أ يجاز من البكتيريا الخيطية Streptomyces coelicolor A3 (2). J. باكتيريول. 185، 20-27. دوى:

Yin L، Zhu M، Knoll AH، Yuan X، Zhang J & amp Hu J

. 2007 أجنة Doushantuo محفوظة داخل أكياس بيض السبات. طبيعة سجية 446، 661-663. دوى:

Chernikova D و Motamedi S و Csuros M و Koonin EV و amp Rogozin IB

. 2011 أصل متأخر للتنوع حقيقيات النوى الموجود: تقديرات وقت الاختلاف باستخدام تغييرات جينومية نادرة. بيول. مباشر. 6، 26. دوى:

Rozman D، Stromstedt M، Tsui LC، Scherer SW & amp Waterman MR

. 1996 هيكل ورسم خرائط لجين لانوستيرول 14 ألفا-ديميثيلاز البشري (CYP51) الذي يشفر السيتوكروم P450 المشارك في مقارنة التركيب الحيوي للكوليسترول بين منظمة إكسون / إنترون مع جينات ثدييات وفطرية أخرى. علم الجينوم 38، 371-381.

لامب دي سي ، كيلي دي ، أمبير كيلي سي إل

. 1998 التنوع الجزيئي لركائز ستيرول 14 ألفا-ديميثيلاز في النباتات والفطريات والبشر. FEBS ليت. 425، 263-265. دوى:


نتائج

نشاط مضاد للفطريات واسع الطيف وقابل للانتشار ينتج بواسطة كاليفورنياكال 35

في فحوصات المواجهة بدون اتصال على لوحات المساعد الرقمي الشخصي ، كاليفورنياCal35 يمنع توسع مستعمرة أ. النيجر, أوكسيسبوروم الفيوزاريوم f.sp. ليكوبيرسيسي (Fol)، F. oxysporum f.sp. فراجاريا (فوف), ريزوكتونيا سولاني, Sclerotium rolfsii, Sclerotinia sclerotiorum, الفرتيسيليوم الداليا و ماغنابورثي جريسي (الشكل 1 ، اللوحات A2-H2) ، مقارنة بلوحات التحكم (الفطريات فقط ، الشكل 1 ، الألواح A1-H1). ل النيجر هذا النشاط المضاد للفطريات كاليفورنياأظهر Cal35 (الشكل 2 ب ، مقارنة بـ 2 أ ، الفطريات فقط) أنه قابل للانتشار ويعبر عنه في غياب الفطريات ، على النحو التالي. بعد الزراعة كاليفورنياCal35 في وجود (الشكل 2 ب) أو غياب (الشكل 2 د) النيجر على لوحات أجار PDA لمدة 3 أيام ، تمت إزالة أقسام الآجار المحتوية على البكتيريا والفطريات باستخدام شفرة جراحية معقمة. تم تلقيح الأجزاء المتبقية من أجار النيجر الجراثيم على مسافات مختلفة بالنسبة للمكان كاليفورنياكان Cal35 ينمو على الطبق. بالمقارنة مع عنصر التحكم (الشكل 2 أ) ، النيجر لم يكن قادرًا على النمو على أجار عليه كاليفورنياكان Cal35 قد نما سابقًا وقريبًا بحضور النيجر (الشكل 2C) ، مما يشير إلى أن النشاط المضاد للفطريات كاليفورنياكان Cal35 قابل للذوبان في الماء وقابل للانتشار من خلال أجار. لاحظنا أيضًا أن نمو النيجر تم منعه على أجار عليه كاليفورنياكان Cal35 قد نما سابقًا في حالة عدم وجود النيجر وأن درجة التثبيط انخفضت كدالة على المسافة بين النيجر و كاليفورنياCal35 (الشكل 2E-G). تتوافق هذه الملاحظة مع انتشار وتخفيف النشاط المضاد للفطريات بعيدًا عن مصدره ، كاليفورنياكال 35. نفترض أن هذا النشاط المضاد للفطريات يمثل مستقلبًا ثانويًا سيشار إليه فيما بعد باسم carenaemin.

المكافحة الحيوية للذبول Fusarium الطماطم كاليفورنياCal35 بالاشتراك مع بفFZB42

على الرغم من النشاط المضاد للفطريات الملحوظ كاليفورنياكال 35 ضد Fol على أطباق أجار (الشكل 1 ، اللوحة B2) ، لم تكن نباتات الطماطم المزروعة في الصوبات محمية من Folالناجم عن فقدان الكتلة الحيوية (الشكل 3 أ) أو تغير لون الأوعية الدموية (الشكل 3 ب) عن طريق تلقيح جذر سابق مع كاليفورنياكال 35. في ظل نفس الظروف ، بفلم يحمي FZB42 نباتات الطماطم من Fol إما (الشكل 3 أ و ب). ومع ذلك ، عند مزجها معًا ، كاليفورنياCal35 و بفFZB42 (يشار إليها باسم "كولي42 بوصة) مخفضة بشكل ملحوظ (ص & lt 0.05) Folالناجم عن فقدان الكتلة الحيوية (الشكل 3 أ) وكذلك تغير لون الأوعية الدموية (الشكل 3 ب). Fol- تحدى النباتات التي كانت كولي42 - بدت وكأنها لم يتم تحديها (أي لاFol) نباتات (الشكل S1D و A ، على التوالي) ، بينما Fol-النباتات المتحدية التي تمت معالجتها كاليفورنيابدا Cal35 أو BvFZB42 غير معالج Fol- النباتات المتحدية (الشكل S1C و E و B على التوالي).

حماية بواسطة كولي42 لوحظ أيضًا في تجربة Fol-حقل نبات الطماطم المصاب: فقط كولي42 علاج بشكل ملحوظ (ص & lt 0.05) مخفضة Fol- تلون الأوعية الدموية الناجم عن ذلك كاليفورنياCal35 في حد ذاته أو بفلم FZB42 في حد ذاته (الشكل 4 أ). كوليأعاد 42 أيضًا أعلى محصول قابل للتسويق لجميع المعاملات (أي 37.46 طنًا أمريكيًا من فاكهة الطماطم الحمراء لكل فدان) ، لكن الاختلافات بين المعاملات لم تكن معنوية (الشكل 4 ب).

العزلة وتوصيف كاليفورنياCal35 طفرات ترانسبوسون مع نشاط مضاد للفطريات منخفض

لتحديد الجين (الجينات) الكامن وراء نشاط مضاد للفطريات والتحكم الحيوي لـ كاليفورنياCal35 ، حوالي 6500 عشوائي EZ-Tn5 طفرات الإدراج ينقلب كاليفورنياتم إنشاء Cal35 وفحصها لتقليل النشاط المضاد للفطريات النيجر في إعداد لوحة ميكروتيتر بلا قاع 96 بئر (انظر الإجراءات التجريبية). تم تحديد اثنين من هذه المسوخ ، المعينين 46A06 و 60 C09 (الشكل S2). أكدنا في اختبار المواجهة القياسي أن كلا الطافرين فقدا القدرة على تثبيط نمو الخيوط النيجر (الشكل 1 ، اللوحات A3 و A4). لم ينتج عن خلط الطافرين معًا استعادة مستويات التثبيط من النوع البري (الشكل 1 ، اللوحة A5). أيضا، النيجر ظهر غير متأثر بعد التلقيح على صفيحة PDA حيث نمت 46A06 أو 60C09 عليها سابقًا (الشكل 2H-I و J-K على التوالي).

فقدت المسوخات 46A06 و 60 C09 أيضًا ، كليًا أو جزئيًا ، القدرة على التثبيط Fol, فوف ، ر. سولاني ، س. رولفسي, S. sclerotiorum و خامسا الداليا (الشكل 1 و B3-G3 و B4-G4 على التوالي). بالنسبة لأي من هذه الفطريات ، لم يحقق الطافران مستويات من النوع البري من تثبيط الفطريات عند مزجهما معًا (الشكل 1 ، B5-F5). م. جريسي كان الفطر الوحيد الذي لا يزال مثبطًا بواسطة الطفرة 46A06 وكذلك 60C09 (الشكل 1 و H3 و H4 ، على التوالي) ، مما يشير إلى أن إدخال الينقولات في هذه المسوخات لم يؤثر كاليفورنياقمع Cal35 ل م. جريسي.

في تجارب الدفيئة ، خليط من بفلم يحمي FZB42 والمتحول 46A06 نباتات الطماطم بشكل كبير من Folالناجم عن فقدان الكتلة الحيوية ، ولا خليط من النوع البري كاليفورنياCal35 و بفFZB42 متحولة AK3 ، أو خليط من اثنين من المسوخ (46A06 و AK3) (الشكل 5 أ). كان الانخفاض في تلون الأوعية الدموية الذي لوحظ مع هذه الخلائط أقل من ذلك الذي تم تحقيقه مع كولي42 ، ولكن ليس بشكل ملحوظ (الشكل 5 ب).

التوصيف الجيني للطفرة 46A06

كشف تسلسل الجناح الجينومي لـ transposon في متحولة 46A06 عن موقع الإدراج كـ 5’-GTGTACGGA-3 'داخل الموضع LT85_RS01670 (الشكل S3A-C). هذا الجين هو جزء من منطقة 76.95 كيلو بايت من كاليفورنياجينوم Cal35 (إحداثيات NCBI 365،248-442،201 من NZ_CP009962.1). تحتوي هذه المنطقة على 35 جينًا متوقعًا على الأقل (الجدول 1) وتم تمييزها بواسطة antiSMASH على أنها تحتوي على مجموعة جينية هجينة PKS-NRPS. لم يتم العثور على مجموعات جينية هجينة PKS-NRPS مثلها على الجينومات المنشورة للآخرين كوليموناس سلالات ، بما في ذلك C. الفطريات Ter6 و Ter331 ، C. pratensis Ter91 و Ter291 ، C. arenae Ter10 و Ter282 و كوليموناس ص. ES_Al-A1 و PA-H2 و OK607 و OK242 و OK412 و OK307 و UBA1456. ومع ذلك ، تمكنا من تحديد مجموعات الجينات ذات التركيب المتشابه والوظيفة المتوقعة على جينومات كروموباكتيريوم فيولاسيوم ATCC 53434 (باركر وآخرون. ، 1988 سينغ وآخرون., 1988 ), Chitinimonas koreensis DSM 17726 (كيم وآخرون., 2006 ), بارابوركولديريا ميجا بوليتانا LMG 23650 (Vandamme وآخرون. ، 2007) و بارابوركولديريا أسيدوفيلا ATCC 31363 (هورسمان وآخرون. ، 2017). يبدو أن التشابه يقتصر على امتداد الجينات المقابلة لـ LT85_RS01720 → LT85_RS01665 في كاليفورنياCal35 ، والذي يتضمن الجين الذي يحمل إدخال الترانسبوزون في 46A06 ، أي LT85_RS01670 (الشكل S4).

علامة موضع NCBI البروتين المتوقع معرف البروتين NCBI
LT85_RS01600 أسيتيل- CoA C- أسيل ترانسفيراز WP_038484473.1
LT85_RS01615 أوكسيريدوكتاز عائلة حقوق السحب الخاصة WP_038484482.1
LT85_RS01625 البروتين افتراضية WP_038484490.1
LT85_RS01630 بروتين يحتوي على مجال DGQHR WP_156117397.1
LT85_RS01635 مترجم عائلة LysE WP_038484493.1
LT85_RS01640 منظم نسخ عائلة LRP / AsnC WP_038484496.1
LT85_RS01645 بروتين عائلة المركبات العضوية المتطايرة WP_038484499.1
LT85_RS01650 منظم نسخ عائلة مار WP_038484502.1
LT85_RS01655 TCR / Tet عائلة MFS الناقل WP_052135471.1
LT85_RS01660 إفراز الجلوتاثيون أميداز WP_172656931.1
LT85_RS01665 البروتين افتراضية WP_156117398.1
LT85_RS01670 بروتين عائلة عديد السكاريد بيروفيل ترانسفيراز WP_038484508.1
LT85_RS01675 4'-phosphopantetheinyl transferase superfamily protein WP_052134537.1
LT85_RS01680 ثيويستريز WP_052134540.1
LT85_RS01685 الأحماض الدهنية المتعددة غير المشبعة / البروتين الحيوي بوليكيتيد WP_052134542.1
LT85_RS01690 البروتين افتراضية WP_038484511.1
LT85_RS01695 اكتب أنا بوليكيتيد سينثيز WP_038484514.1
LT85_RS01700 إنزيم الببتيد غير الريبوسومي WP_052134544.1
LT85_RS01715 مركب الببتيد الهجين غير الريبوسومي / النوع الأول سينثاز بولي كيتيد WP_081991927.1
LT85_RS01720 مركب الببتيد الهجين غير الريبوسومي / النوع الأول سينثاز بولي كيتيد WP_038484528.1
LT85_RS01725 منظم النسخ اللولبي بدوره اللولب WP_038484531.1
LT85_RS01730 أوكسيريدوكتاز عائلة حقوق السحب الخاصة WP_081991930.1
LT85_RS01735 منظم نسخ عائلة LysR WP_052134547.1
LT85_RS01740 ألفا / بيتا هيدرولاز WP_038484534.1
LT85_RS25150 بروتين عائلة بيرين WP_009049067.1
LT85_RS01750 بروتين عائلة NmrA / HSCARG WP_017604182.1
LT85_RS01755 فسفويستراز WP_052134552.1
LT85_RS01760 ج- نوع السيتوكروم WP_052135472.1
LT85_RS01765 سلسلة الأحماض الأمينية المتفرعة WP_038484543.1
LT85_RS01775 NAD (P) - نازعة هيدروجين الكحول المعتمد WP_038484549.1
LT85_RS01780 منظم نسخ عائلة AraC WP_038494762.1
LT85_RS01785 منظم نسخ عائلة LysR WP_038484552.1
LT85_RS01790 أوكسيريدوكتاز عائلة حقوق السحب الخاصة WP_038484555.1
LT85_RS01795 بروتين يحتوي على مجال يشبه SnoaL WP_038484558.1
LT85_RS01800 ميت / دياه بوكس ​​هيليكس WP_081991932.1
  • تم تمييز الجين (LT85_RS01670) بالخط العريض الذي حمل إدخال الترانسبوزون في 46A06. هذا الجين هو جزء من cplABCDEFGHIJK supraoperon (أين cpl لتقف على مكان إنتاج carenaemin ، LT85_RS01720 → LT85_RS01660) الذي تم تمييزه باللون الرمادي.

LT85_RS01670 هي التاسعة في supraoperon المتوقع من 11 جينًا (LT85_RS01720 → LT85_RS01660 الشكل 6A ، الجدول S1) ، والتي نشير إليها باسم cplABCDEFGHIJK (أين cpl تمثل جالساحة صإنتاج لocus). وفقًا لـ "قاعدة الخطية المشتركة" (Fischbach and Walsh ، 2006) ، فإن الجينات الخمسة الأولى لهذا supraoperon (cplABCDE) تم التنبؤ بها لتشفير إنتاج مستقلب ثانوي يتميز بسقالة أساسية من ثلاثة بقايا من الأحماض الأمينية ، مع الأحماض الأمينية الأولى والثانية مرتبطة من خلال رابطة الببتيد والثاني والثالث بواسطة a -CH2- شطر CHOH (الشكل 6 ب وج). من المتوقع أن يكون الحمض الأميني الأوسط عبارة عن سيرين ، بناءً على كل من NRPSPredictor2 وعلى تسلسل Stachelhaus (أي DVWHFSLVDK) لمجال الغد المقابل في cplB منتج الجينات. تسلسل Stachelhaus لمجالي الغدد الآخرين (DIWQFGLILK في cplA و DALFMGGVIK بتنسيق cplC) كانت أكثر تشابهًا (ولكن غير متطابقة) مع تلك التي تم الإبلاغ عنها بالنسبة للجلوتامين (DAWQFGLIDK) والليوسين (DALVMGAVMK) على التوالي (Rausch وآخرون، 2005). وجود مجال epimerization في المتوقع cplC اقترح المنتج أن الحمض الأميني الثالث موجود في التكوين D في الهيكل. وجود مجال ketosynthase / malonyltransferase ومجال aminotransferase في الطرف N من الطرف cplA المنتج الجيني يضع R متوقعة1-CNH2-CH2- مجموعة في أحد طرفي المستقلب الثانوي (الذي يولد حمض أميني جلايسين) ، مع توقع مجموعة -CO-R2 في الطرف الآخر ، بناءً على مجال ketosynthase / malonyltransferase في cplD. الصيغة الكيميائية للبنية الأساسية المتوقعة الموضحة في الشكل 6 ج ، لا تشمل R1 و ر2هو C21ح35ا8ن5، بكتلة متوقعة تبلغ 485.53 دا.

الجين LT85_RS01670 (أي أنا) التي حملت إدخال الترانسبوزون في 46A06 متحولة إلى رمز لبروتين عائلة البيروفيل ترانسفيراز متعدد السكاريد (رقم الانضمام WP_081991923). تحفز ترانسالات البيروفيل نقل جزء البيروفات إلى هدف السكاريد (هاجر وآخرون. ، 2019). تشمل البروتينات التي تنتمي إلى هذه العائلة الوظيفية CsaB (Fujinami and Ito ، 2018 Hager وآخرون. ، 2018) ، WcaK (ستيفنسون وآخرون. ، 1996) ، AmsJ (Wang وآخرون. ، 2012) و PssM (Ivashina وآخرون. ، 2010) ، والتي تشارك جميعها في إنتاج السكريات الخارجية (EPS) ، بما في ذلك بوليمرات جدار الخلية الثانوية في عصية الأنواع ، وحمض الكولانيك في الإشريكية القولونية، أميلوفوران في اروينيا و EPS في ريزوبيوم ليجومينوساروم على التوالى. المصب على الفور من أنا وجزء من نفس المشغل المتوقع مثل أنا نكون cplJ (LT85_RS01665) و cplK (LT85_RS01660) ، مشروح كبروتين افتراضي وجلوتاثيون أميداز على التوالي.

التوصيف الجيني 60C09

في متحولة 60C09 ، EZ-Tn5 تم العثور على ترانسبوسون في التسلسل 5’-GTATAAGCA-3 '، حيث TAA هو كود الإيقاف للجين LT85_RS04520 (الشكل S3D-F). من المتوقع أن تساهم جينات متعددة في المنطقة المجاورة مباشرة لـ LT85_RS04520 (الشكل 6 ب الجدول 2) في ما يسمى بالمسار المعتمد على Wzy لتخليق ودمج وحدات تكرار قليل السكاريد في عديدات السكاريد الدهنية على سطح الخلية (Kalynych. وآخرون، 2014). يتضمن هذا المسار النقل الأولي لجزء من السكر إلى ناقل دهني (ربما يتم تحفيزه بواسطة منتج LT85_RS04530) ، إضافة مجموعات السكر بواسطة غليكوزيل ترانسفيرازات (LT85_RS25805 ، LT85_RS04525) لتوليد وحدة تكرار قليل السكاريد. يتم نقل الوحدات الفردية إلى محيط البلازما بواسطة Wzx flippase (LT85_RS04500) ، حيث تخضع للبلمرة بواسطة بوليميريز Wzy (LT85_RS25800) لإنتاج عديد السكاريد الذي يمكن نقله بعد ذلك إلى سكاريد قليل السكاريد الداخلي من الليبيد A بواسطة WaaL ligase (LT85_RS046) وينتقل إلى سطح الخلية.

علامة موضع NCBI البروتين المتوقع معرف البروتين NCBI
LT85_RS04480 dTDP- الجلوكوز 4،6-ديهيدراتاز (RmlB) WP_038485799.1
LT85_RS04485 الجلوكوز -1 فوسفات ثيميديليلترانسفيراز (RmlA) WP_038485802.1
LT85_RS04490 dTDP-4-dehydrorhamnose 3،5-epimerase (RmlC) WP_038485806.1
LT85_RS04495 dTDP-4-dehydrorhamnose reductase (RmlD) WP_038485809.1
LT85_RS04500 flippase WP_081992030.1
LT85_RS25800 كرر قليل السكاريد البوليميريز WP_081992033.1
LT85_RS25805 dTDP-L-rhamnosyltransferase WP_081992035.1
LT85_RS04515 dtdp-L-rhamnose 4 epimerase (تل) WP_038495031.1
LT85_RS04520 سيرين أسيتيل ترانسفيراز WP_038485818.1
LT85_RS04525 dTDP-6-deoxy-L-talosyltransferase WP_038485820.1
LT85_RS04530 حامل الدهون: UDP-ن-اسيتيل جالاكتوزامينيل ترانسفيراز WP_038485823.1
LT85_RS04535 UDP-ن- أسيتيل جلوكوزامين 4،6-ديهيدراتاز WP_052134643.1
LT85_RS04540 بروتين عائلة هيستون H-NS WP_038485826.1
LT85_RS04545 فوسفومانوموتاز / فوسفوجلوكوموتاز WP_038485829.1
LT85_RS04550 ناقلة عديد السكاريد الدهنية 1 WP_038485833.1
LT85_RS25195 الصنف الأول من إنزيم ميثيل ترانسفيراز المعتمد على SAM WP_081992037.1
LT85_RS04560 البروتين افتراضية WP_038485836.1
LT85_RS04565 الصنف الأول من إنزيم ميثيل ترانسفيراز المعتمد على SAM WP_172656939.1
LT85_RS04570 جليكوزيل ترانسفيراز WP_052134650.1
LT85_RS04575 جليكوزيل ترانسفيراز WP_038485842.1
LT85_RS04580 البروتين افتراضية WP_038485845.1
LT85_RS04585 DUF2142 بروتين يحتوي على المجال WP_172656940.1
LT85_RS04595 عامل استطالة الترجمة الخاص بالسيلينوسيستين WP_038485851.1
LT85_RS04600 L-seryl-tRNA (ثانية) سيلينيوم ترانسفيراز WP_052134652.1
LT85_RS04605 فورمات بروتين نازعة الهيدروجين FdhE WP_038485854.1
LT85_RS04610 فورمات وحدة نازعة هيدروجين جاما WP_038485857.1
LT85_RS04615 فورمات نازعة الهيدروجين بيتا WP_038485861.1
LT85_RS04620 فورمات نازعة الهيدروجين- N الوحدة الفرعية ألفا WP_156117426.1
LT85_RS04625 بروتين ربط الركيزة الناقل للكبريتات ABC WP_038485868.1
LT85_RS04630 3-deoxy-D-manno-oct-2-ulosonic acid (Kdo) hydroxylase WP_038485871.1
LT85_RS04635 3-deoxy-D-manno-octulosonic acid transferase WP_038495045.1
LT85_RS04640 بروتين عائلة YdcF WP_038485874.1
LT85_RS04645 جليكوزيل ترانسفيراز WP_052134654.1
LT85_RS04650 البروتين المحتوي على المجال Ligase O- المستضد WP_038485877.1
LT85_RS04655 الوحدة الفرعية UDP-glucose 4-epimerase GalE WP_038485880.1
  • تم تمييز الجين (LT85_RS04520) بالخط العريض الذي حمل إدخال الترانسبوزون في 60C09. هذا الجين هو جزء من الأوبرا المتوقع (مظلل باللون الرمادي).

من المحتمل أن يكون أحد السكريات في وحدة تكرار oligosaccharide هو rhamnose ، مع ملاحظة أن (i) LT85_04485 و _04480 و _04490 و _04495 تشبه rmlABCD جينات لتحويل D-glucose-1-P إلى ثنائي فوسفات ديوكسي ثيميدين (dTDP) -L-rhamnose (King وآخرون. ، 2009) ، و (2) منتج الجين LT85_RS25805 يشبه إلى حد كبير RfbF ، وهو عبارة عن dTDP-rhamnosyl transferase الموجود في شيغيلا فلكسنري يولد ال ن-اسيتيل جلوكوزامين- Rha-Rha-Rha كرر رباعي السكاريد (مورونا وآخرون، 1995). قد يكون السكر الآخر في وحدة تكرار oligosaccharide 6-deoxytalose ، بالنظر إلى أنه من المتوقع أن يكون الجينان المرافقان LT85_RS04520 رمزًا لتحويل dTDP-L-rhamnose إلى dTDP-L-6-deoxytalose (LT85_04515) ولإضافة dTDP-L -6-deoxytalose إلى وحدة تكرار oligosaccharide المتنامية (LT85_04525) ، بناءً على التشابه مع تل و gtr29 الجينات ، على التوالي ، من راكدة بومانية (كينيون وآخرون. ، 2017). تم شرح المنتج LT85_RS04520 نفسه باعتباره ناقل أسيتيل سيرين. أظهر تجانسًا كبيرًا لـ WcaB من بكتريا قولونية الذي يحمل أيضًا توقيع سيرين أسيتيل ترانسفيراز ، ولكن ثبت أنه يحفز أستلة بقايا الجالاكتوزيل بعد دمجه كسكر رابع في وحدة تكرار سباعي السكاريد لحمض الكولانيك (سكوت وآخرون. ، 2019). يمكّن هذا الأسيتيل ناقل الجليكوزيل التالي من إضافة السكر الخامس إلى وحدة تكرار حمض الكولانيك (سكوت وآخرون., 2019 ).

توصيف النشاط المضاد الناتج عن كاليفورنياكال 35

لم ننجح في جهودنا لاستعادة النشاط المضاد للفطريات من طاف الثقافة كاليفورنياCal35 نمت في مرق. لذلك ابتكرنا اختبار انتشار أجار لاستخراج النشاط المضاد للفطريات منه كاليفورنياCal35 نمت على أجار بدلاً من ذلك. هذا الاختبار (الشكل S5) يستغل حقيقة أن هذا النشاط تم إنتاجه بواسطة كاليفورنياCal35 على أجار في حالة عدم وجود فطر وقابل للانتشار من خلال أجار. الموزعات التي تم جمعها بهذه الطريقة من النوع البري كاليفورنياتم اختبار Cal35 ومن المسوخ 46A06 و 60C09 في اختبار المواجهة المعدل باستخدام النيجر للكشف عن هذا النمو الخيطي لـ النيجر تم تقليله في وجود مواد منتشرة مستخرجة من كاليفورنياCal35 ، ولكن ليس مع تلك المستخرجة من المسوخ 46A06 و 60C09 (الشكل 7 أ). تم تحليل النشرات بواسطة كروماتوجرافيا سائلة - مطياف الكتلة ، وكشف عن قمتين بارزتين (تم تسميتهما بـ a و b في الشكل 7B) كانتا موجودة في Cal35 المنتشر ولكنها غائبة في المنتشر التي تم جمعها من المسوخ 46A06 (الشكل 7C) و 60 C09 (الشكل 7 د). تم التخلص من هاتين القمتين بأوقات استبقاء 13.3 و 13.7 دقيقة ، و م/ض قيمتا 835.493 و 849.509 Da ، على التوالي ، في كلا الوضعين السالب والموجب. الفرق في م/ض بين القمتين a و b يساوي 14.016 Da ، وهو ما يقارب (Patiny and Borel ، 2013) كتلة CH2 شاردة. علاوة على ذلك ، لاحظنا قمتين كانتا فريدة من نوعها للانتشار من متحولة 46A06 وغائبة عن تلك من النوع البري كاليفورنياCal35 والمتحول 60C09 (المسمى c و d في الشكل 7C). كان لهذه القمم أوقات استبقاء 12.3 و 12.8 دقيقة ، و م/ض كانت القيمتان 765.488 و 779.503 Da في كلا الوضعين السالب والموجب على التوالي. الفرق في م/ض بين القمتين c و d كان 14.015 ، أي نفس الفرق في م/ض بين القمتين a و b ، وبما يتفق مع CH2 شاردة. في الوضع الإيجابي ، فإن الاختلافات في م/ض بين القمتين a و c وبين القمتين b و d كانت 70.006 و 70.005 على التوالي ، وهو ما يتوافق مع C3ح2ا2 شاردة.


& ltp> يوفر هذا القسم أي معلومات مفيدة حول البروتين ، ومعظمها معلومات بيولوجية. & ltp> & lta href = '/ help / function_section' target = '_ top'> المزيد. & lt / a> & lt / p> الوظيفة i

يحفز فسفرة L-fuculose. يمكن أيضًا الفسفوريلات ، بكفاءة أقل ، D-ribulose ، D-xylulose و D- الفركتوز.

& # xd & ltp> معلومات تم التحقق منها يدويًا والتي تم إنشاؤها بواسطة نظام التعليقات التوضيحية التلقائي UniProtKB. & lt / p> & # xd & # xd & ltp> & lta href = "/ manual / Evidences # ECO: 0000255"> المزيد. & lt / a> & lt / p> & # xd التأكيد اليدوي وفقًا للقواعد i

& # xd & ltp> معلومات منظمة يدويًا والتي يوجد لها أدلة تجريبية منشورة. & lt / p> & # xd & # xd & ltp> & lta href = "/ manual / Evidences # ECO: 0000269"> المزيد. & lt / a> & lt / p> & # xd تأكيد يدوي استنادًا إلى التجربة في i


شاهد الفيديو: انواع وخواص الجينوم (قد 2022).


تعليقات:

  1. Vudokus

    عذرا مش في قسم واحد .....

  2. Mccoy

    ربما انا على خطأ.

  3. Ban

    أنا بالتأكيد ، آسف ، الاقتراح للذهاب بطريقة أخرى.

  4. Kosumi

    برافو ، سوف تكون عبورك مفيدة

  5. Leighton

    لديك مقالة مسلية وممتعة. على عكس معظم الأنواع المماثلة الأخرى ، يوجد حد أدنى من الماء!

  6. Sherwood

    في نظري انه أمر واضح. لن أبدأ في الكلام عن هذا الموضوع.



اكتب رسالة