معلومة

هل الإصلاح غير الحاد والخلف A ضروريان عندما يمكن تصنيع المحولات حسب الطلب؟

هل الإصلاح غير الحاد والخلف A ضروريان عندما يمكن تصنيع المحولات حسب الطلب؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أخطط لإنشاء مكتبة RADseq ، والتي تتضمن بشكل طبيعي هضم الحمض النووي الجيني بعد ربط محول P1. لقد قرأت بعض البروتوكولات التي تتطلب أي تعليق مفرط ناتج عن نشاط إنزيم التقييد (مثل MspI أو Nlaiii) بحاجة إلى الإصلاح (إصلاح غير حاد) متبوعًا بإضافة نوكليوتيد A واحد في النهاية لجعل الحمض النووي شظايا "لزجة". ولكن هل هذا حقا ضروري؟ ألن يكون من الأفضل تخصيص محولات P1 بحيث يكون لها 3 أو 4 نقاط أساس متراكبة خاصة بإنزيم التقييد المستخدم بدلاً من ذلك؟

ما أريد أن أسأله هو ما هي المزايا العملية لوجود نتوء نيوكليوتيد واحد مقابل 3 أو 4 نيوكليوتيدات؟

شكرا لك مقدما.


إعداد مكتبة مرنا

بشكل عام ، فإن الخطوة الأولى في إعداد مكتبة mRNA هي التجزئة. ثم يتم إضافة البادئات العشوائية السداسية وسوف يتم تهجينها لتسلسل الحمض النووي الريبي التكميلي. في ظل وجود النسخ العكسي و deoxynucleotide triphosphates (dNTPs) (A ، T ، G ، C) ، يصبح mRNA قالبًا لتركيب أول خيط تكميلي من الحمض النووي (أول تخليق حبلا). يتم تحويل الهجينة DNA-RNA التي تم تصنيعها خلال توليف cDNA الأول إلى cDNAs مزدوجة الشريطة كاملة الطول. يتم إنشاء البادئات لتركيب الخيط الثاني (كدنا) بواسطة RNase H ، والذي يدخل النكات في جزء RNA من الهجينة cDNA-RNA. بكتريا قولونية يمتد DNA Polymerase I (NEB # M0209) الذي تم إنشاؤه حديثًا 3 & Prime-hydroxyl termini ، باستخدام أول حبلا cDNA كقالب. بهذه الطريقة ، يتم استبدال الأجزاء المتبقية من الرنا المرسال في الهجين (كدنا - مرنا) بالحبل الثاني المركب حديثًا من الحمض النووي. ثم يتم إصلاح النكات المتبقية بواسطة بكتريا قولونية DNA ligase (NEB # M0205).

تتطلب مكتبات (كدنا) المركبة من mRNA المجزأة إصلاحًا نهائيًا للتأكد من أن كل جزيء خالٍ من التراكمات ويحتوي على 5 فوسفات و 3 وهيدروكسيل رئيسي. المكتبات التي سيتم استخدامها في ربط المحول غير الحاد ، بما في ذلك Ion Torrent & trade أو SOLiD & trade 4 ، يمكن استخدامها مباشرةً في خطوة الربط. بالنسبة لمكتبات Illumina & reg وبعض المكتبات المخصصة لـ 454 ومنصة التجارة ، من الضروري دمج deoxyadenosine 5 غير المصبوب والقالب أحادي الفوسفات (dAMP) في الطرف الثالث والأساسي لشظايا الحمض النووي المتضخم ، وهي عملية تُعرف باسم dA-tailing. تمنع ذيول dA تكوين concatamer أثناء خطوات ربط المصب ، وتمكن من ربط أجزاء الحمض النووي بالمحولات مع dT-overhangs التكميلية. يمكن تحديد حجم الحمض النووي المرتبط بالمحول المطلوب لمنصات Illumina و SOLiD و Ion Torrent عبر الرحلان الكهربائي للهلام قبل التضخيم بواسطة تفاعل البلمرة المتسلسل (PCR). توفر New England Biolabs الكواشف لإعداد مكتبة الحمض النووي لمنصات التسلسل الرائدة.


عينة الحمض النووي TOPMed / معرفات مثيل التسلسل

يتم إعطاء كل عينة DNA تمت معالجتها بواسطة TOPMed معرفًا فريدًا باسم "NWD" متبوعًا بستة أرقام (على سبيل المثال NWD123456). هذه المعرفات فريدة من نوعها في جميع دراسات TOPMed. يرتبط كل معرف NWD بمعرف موضوع الدراسة الفردي المستخدم في ملفات dbGaP الأخرى (مثل الأنماط الظاهرية والأنساب وملفات الموافقة). قد يرتبط معرف موضوع معين بمعرفات NWD متعددة إذا تم تسلسل العينات المكررة من نفس الفرد. يقوم محققو الدراسة بتعيين معرفات NWD للمواضيع. تقوم المستودعات الحيوية الخاصة بهم بتعيين عينات الحمض النووي ومعرفات NWD إلى آبار / أنابيب محددة مشفرة من قبل مركز التسلسل وتسجيل هذه المهام في بيان عينة ، إلى جانب البيانات الوصفية الأخرى (مثل الجنس وطريقة استخراج الحمض النووي). في كل مركز تسلسل ، يتم نشر معرف NWD عبر جميع مراحل خط الأنابيب وهو المعرف الأساسي في جميع ملفات النتائج. ينتج عن كل معرف NWD مثيل تسلسلي واحد ويرتبط بمعرف موضوع واحد في ملف تعيين موضوع العينة لكل مدخل. على عكس معرّفات NWD الواسعة في المشروع ، فإن معرّفات الموضوع خاصة بالدراسة وقد لا تكون فريدة في جميع عمليات الوصول إلى TOPMed.


الاستنتاجات

تمثل هذه الدراسة تحليلًا عالميًا للتاريخ التطوري الديناميكي للفطريات المكونة للفطر. قد يكون تنوع Agaricomycetes قد تم تشكيله من خلال كل من تحولات معدل التنويع على مستوى الفئة والأحداث الخاصة بالفرع المتفجر. حددنا إشعاعًا كبيرًا على مستوى الفئة من الفطريات Agaricomycetes في العصر الجوراسي ، والذي من المحتمل أن يتبع مناخًا دافئًا ورطبًا في هذه الفترة. تزامن ظهور هذا الإشعاع مع توسع كاسيات البذور والأنماط المتبعة من توسع الجمنازيوم ولاحقًا توسع كاسيات البذور خلال إشعاع الدهر الوسيط وحقبة الحياة 40. تقدم تحليلاتنا دليلًا على العديد من الإشعاعات التكيفية الخاصة بالكليد في الفصل ، وتقدم تفسيراً محتملاً لسبب احتواء بعض الأجناس على نوع واحد ، بينما يحتوي البعض الآخر على الآلاف. تعرض بياناتنا إشارة قوية لحدث الانقراض الجماعي الذي يتزامن مع زيادة معدلات الانقراض في حدود العصر الجوراسي / الطباشيري ، ومع ذلك ، لم يتم العثور على مثل هذا الدليل في Agaricomycetes لحدث الانقراض الجماعي الأكثر تأثيرًا بين العصر الطباشيري والثالث. قد يكون تطور أجسام الثمار المتشابهة ، أي التشكلات ذات الغطاء والخطوة ، محركًا رئيسيًا للإشعاعات التطورية ، مما يشير إلى أن التطور المتقارب لمورفولوجيا الفطر الكلاسيكي ساهم في تشكيل التنوع الموجود في Agaricomycetes. نتوقع أن المزيد من البيانات حول السمات والفرص البيئية التي ولدت التنوع المذهل للفطريات المكونة للفطر ستساعد في توضيح المبادئ العامة لتطور الفطر ودمج هذه المجموعة المهمة بيئيًا في سجل أحداث التنوع البيولوجي الرئيسية.


الشكل التكميلي 1

تسلسل المحولات والتضخيم وتسلسل الاشعال. تظهر تسلسلات المحول لمكتبة Illumina متعددة الإرسال العادية المفهرسة بمفردها (كما تم الحصول عليها باستخدام مجموعة إعداد عينة TruSeq DNA من Illumina ، القط رقم FC-121-2001 / 2002 ، أو وفقًا للبروتوكول الوارد في المرجع 21 من النص الرئيسي) على القمة. تختلف المكتبات المحضرة من DNA أحادي السلسلة بحذف 5 نقاط أساس في المحول P5. كلا نوعي المكتبات متوافقان مع التسلسل المزدوج (انظر المرجع 22 من النص الرئيسي للحصول على التفاصيل). يشار إلى تضخيم وتسلسل الاشعال بواسطة الأسهم. تم وصف المواد الأولية ذات البادئة "IS" في المرجع. 21 من النص الرئيسي. (PDF 364 كيلوبايت)

الشكل التكميلي 2

توصيف اثنين من مكتبات الحمض النووي تم إعدادهما باستخدام وبدون إزالة اليوراسيل من مستخلص الحمض النووي لإنسان نياندرتال (الألواح على اليمين واليسار ، على التوالي). أ) توزيعات طول الجزء للمكتبات المضخمة التي تم الحصول عليها من الرحلان الكهربائي للرقاقة باستخدام Bioanalyzer 2100. ب) توزيعات حجم الجزء التي تم الحصول عليها من التسلسل (يشار إلى جزء التسلسل المعين بخط منقط). ج) تواتر استبدالات C إلى T حول 5 و 3 نهايات من متواليات إنسان نياندرتال. د) متوسط ​​محتوى GC لتسلسلات إنسان نياندرتال كدالة لحجم القطعة. (PDF 397 كيلوبايت)

الشكل التكميلي 3

مراقبة الجودة لمحول قليل النوكليوتيد CL78 الذي تقطعت به السبل. من دفعتين تم توليفهما بشكل مستقل من قليل النوكليوتيد ، تم تحميل 10 ميكرولامول على هلام بولي أكريلاميد 10 ٪ تغيير طبيعة ، بجانب علامة الحجم (الممر 1 20/100 سلم). تم تشغيل الجل لمدة 35 دقيقة عند 200 فولت وملطخ بصبغة SybrGold. بينما لم يتم الكشف عن شوائب في الدفعة الأولى (الممر 2) ، فإن الدفعة الثانية (الممر 3) تهيمن عليها قطعة أثرية مزدوجة الطول ، مما يمثل مثالًا صارخًا على ضعف جودة تخليق قليل النوكليوتيد. (PDF 197 كيلوبايت)

الشكل التكميلي 4

تحديد رقم الدورة الأمثل لفهرسة PCR باستخدام مخططات التضخيم qPCR. تظهر مخططات التضخيم التي تم الحصول عليها من قياس المكتبات المعدة في التجربة الموضحة في "النتائج المتوقعة". تبدأ مرحلة التشبع لـ PCR بعد الدورة 18 (مكتبات العينات ، باللونين الأحمر والأزرق) والدورة 23 (مكتبة فارغة ، خضراء) ، على التوالي. بافتراض كفاءة التضخيم الكاملة (أي مضاعفة جزيئات المكتبة في كل دورة) ، يمكن تحديد رقم الدورة المثلى لفهرسة PCR على النحو التالي عن طريق تصحيح الاختلافات في أحجام التفاعل وكمية قالب DNA: (1) تم إجراء qPCR في 25 تفاعلات ميكرولتر ، بينما يتم إجراء فهرسة PCR بحجم 100 ميكرولتر. وبالتالي ، يجب إضافة دورتين للسماح بالمنتج النهائي 4 مرات أكثر. (2) تم استخدام ميكروليتر واحد من مخفف المكتبة 1:20 للقياس ، في حين يتم استخدام 24 ميكرولتر من المكتبة لفهرسة PCR (480 مرة). هذا يتوافق مع 8.9 (تقريب 9) دورات يجب خصمها. وبالتالي ، تم تقدير 11 و 16 ليكونا أرقام الدورة المثلى لفهرسة PCR. (PDF 278 كيلوبايت)

الجدول التكميلي 1

يوصى بإعدادات برنامج Cooling-ThermoMixer MKR13 لإعداد مكتبة أحادية السلسلة. يمكن أيضًا استخدام الجهاز لاستبدال الدوامة في خطوات إعادة تعليق الحبيبات (استخدم زر "المزيج القصير"). (PDF 255 كيلوبايت)

الجدول التكميلي 2

بادئات فهرسة P5 و P7. تم نشر مجموعة متطابقة من بادئات فهرسة P7 من قبل في المرجع. 21 من النص الرئيسي. (PDF 331 كيلوبايت)


الاستنتاجات

أظهر تسلسل الجيل التالي بوضوح فائدته في إنشاء مجموعات بيانات كبيرة وقوية لعلم الجينوم السكاني عند البشر. ومع ذلك ، فقد واجه ترحيل هذه الأساليب والمرافق إلى كائنات مرجعية أخرى صعوبة. كانت العقبة الرئيسية تقليديًا هي الجينومات المرجعية الضعيفة أو غير الموجودة جنبًا إلى جنب مع التكلفة العالية لتطوير مصفوفات الالتقاط الأوليغو المطلوبة لتسلسل الإكسوم ، وهي الطريقة الأكثر شيوعًا للتنميط الجيني لدى البشر. ومع ذلك ، فإن التسلسل منخفض التكلفة والقابل للتطوير يعد مطلبًا حاسمًا لعلم الجينوم السكاني على نطاق واسع في أي نوع. منذ إدخال تسلسل RAD قبل سبع سنوات ، تطورت الأساليب بشكل مطرد لتلبية هذه الحاجة. يمثل بروتوكول GBS المعدل الخاص بنا خطوة أخرى تعمل على تحسين السعة الموجودة مسبقًا بشكل كبير مع إضافة العديد من السعة الجديدة.

والأكثر أهمية من بين هذه التحسينات هي المحولات ذات التكلفة المنخفضة والبادئات والكواشف المطلوبة للتنفيذ. التوافق مع العديد من إنزيمات التقييد غير الحاد يسمح بمطابقة معلمات الإنزيم مع احتياجات تجربة معينة. علاوة على ذلك ، يؤدي التبديل إلى محولات Illumina Y إلى تقليل تكوين concatamer نظرًا لخطوة ذيل dA ، والتي بدورها تعمل على تحسين جودة بيانات تسلسل النهاية المزدوجة.

يحتوي البروتوكول الناتج على العديد من المزايا والعيوب مقارنة بالبروتوكول الأصلي الذي وصفه Elshire et al. الميزة الرئيسية هي القدرة على التبديل بين إنزيمات التقييد دون تغيير في البادئات أو المحولات المستخدمة. علاوة على ذلك ، فإن التوافق مع محولات Illumina Y ، المقترنة بخطوة dA tailing ، يمنع تكوين concatamer ، ويزيد من الجزء القابل للتسلسل من المكتبة ، ويسمح بالتسلسل المزدوج النهاية. أخيرًا ، يسمح استخدام محولات Illumina Y بتضمين PCR للرموز الشريطية المفهرسة المزدوجة أثناء تضخيم المكتبة ، مما يسهل تعدد الإرسال على نطاق واسع وغير مكلف.

ومع ذلك ، هناك العديد من العيوب مقارنة بـ Elshire et al. بروتوكول. أولاً ، يسمح استخدام المحولات المخصصة بتعديل طول الرمز الشريطي ، في حين أن هذا البروتوكول يتطلب & # x0201cspike-in & # x0201d من حوالي 20٪ من الحمض النووي العشوائي إلى حارة التسلسل لمنع ظهور مشاكل معايرة منظم التسلسل بسبب انخفاض تعقيد النيوكليوتيدات. يمكن تجنب ذلك عن طريق استخدام بادئات التسلسل المخصصة التي تخفي فكرة التقييد أو استخدام & # x0201cdark cycling & # x0201d ، وهو استمرار للجزء غير المصور من تفاعل PCR التسلسلي من خلال قواعد ثابتة. بالإضافة إلى ذلك ، فإن استخدام المحولات المخصصة الخاصة بتراكب الإنزيم يقلل من عدد قراءات التسلسل الناشئة عن شظايا الحمض النووي العشوائية المكسورة. تحدث هذه النهايات العشوائية المكسورة في أقل من 1٪ من قراءات التسلسل للإنزيمات مثل AluI ، ولكنها قد تحدث في أكثر من 10٪ من القراءات في HincII و StuI و EcoRV.

العوامل الرئيسية التي يجب أن تكون متوازنة في أي تجربة GBS هي تعدد الإرسال ، الدقة ، والتغطية. كثافة العلامة المثلى لرسم خرائط QTL وغيرها من الجينوميات السكانية تزداد مع العدد المتوقع لأحداث إعادة التركيب لكل عينة وحجم العينة. يمكن حساب هذا بشكل تجريبي إلى درجة [49]. يتأثر الثلاثة بشكل مباشر باختيار الإنزيم. سينتج إنزيم القطع المكون من أربعة أزواج أساسية ملفًا جانبيًا كثيفًا للموقع عبر الجينوم ولكن يلزم قدر كبير من التسلسل للحصول على تغطية في المواقع المتوقعة. سينتج إنزيم القطع المكون من ستة أزواج أساسية ملف تعريف موقع متفرق ، لكن التسلسل الأقل سيحقق تشبع التغطية. كما يتضح من B73 & # x000d7 CG F2 السكان ، حتى طريقة التضمين البسيطة حل هذه المشكلات عن طريق إزالة البيانات الغامضة. ومع ذلك ، لا يزال التضمين مجالًا حاسمًا للتحسين في GBS.

تم تصميم العديد من خوارزميات التضمين الشائعة خصيصًا للبيانات البشرية [50]. غالبًا ما تفترض هذه الطرق دقة عالية لكل علامة ، ونمط فرداني معقد ، وتوافر جينوم مرجعي. من ناحية أخرى ، قد تحتوي مجموعات بيانات GBS على كميات كبيرة من البيانات المفقودة أو غير الدقيقة. قد تكون الأنماط المفردة معقدة في بعض الحالات ، ولكن في العديد من التجارب ستكون بيانات الوالدين متاحة ويمكن تقسيم الأنماط الجينية على مراحل بطريقة مباشرة. غالبًا ما تكون الجينومات المرجعية غير متوفرة أو غير مكتملة. بينما يمكن تطبيق الطرق الشائعة مثل fastPhase على بيانات GBS [51 & # x0201353] ، يُنصح بالمعالجة المسبقة. يجب أن تختبر المعالجة المسبقة بحثًا عن الزيجوت المتماثل الكاذب الناتج عن التغطية المنخفضة وانهيار العلامات غير المستقلة في قيم مفردة. العلامات غير المستقلة هي تعدد الأشكال التي يتم استدعاؤها من مجموعة من القراءات المحاذاة لنفس الموقع ، وهو أمر نموذجي مع تجارب GBS. الأخطاء ، بما في ذلك اختلال المحاذاة وتماثل الزيجوت الخاطئ والتسلسل المتماثل ستكون شائعة لجميع العلامات التي تنشأ من هذه المجموعة من القراءات. إذا تم تفسيرها بشكل غير صحيح ، فقد تقدم تأكيدات متعددة ومستقلة على ما يبدو لنمط وراثي خاطئ قد ينتج عنه نتيجة غير صحيحة من التضمين. وبالتالي ، يوصى بمعاملة جميع العلامات من نفس مجموعة القراءات كحدث واحد بدلاً من التعامل معها بشكل مستقل.

في حالة مجموعات البيانات من الكائنات الحية ذات الجينوم المرجعي غير الموجود أو غير المكتمل ، أي تلك الموجودة على شكل contigs غير المربوط ، فإن الخوارزميات المصممة للبشر تفشل تمامًا. توجد طرق الاقتراض المناسبة لمجموعات البيانات هذه والتي يمكن أن توفر مستويات عالية من الدقة [54 ، 55]. في حين أن هذه الأساليب تختلف في التنفيذ ، إلا أنها تعتمد باستمرار على تحديد العلامات القريبة من خلال عدم توازن الارتباط. على هذا النحو ، يُنصح باستخدام مجموعة بيانات أولية مع عدد متواضع فقط من العلامات المفقودة عند استخدام هذه الطرق. بالإضافة إلى ذلك ، قد تكون البيانات ذات معدل الخطأ المرتفع غير مناسبة لهذه الخوارزميات.

يتم تنفيذ طرق الحصر المصممة لـ GBS لدمج البيانات الأبوية في مراحل ، وعند الضرورة ، تنسب الأنماط الوراثية الأبوية المفقودة من بيانات السكان. علاوة على ذلك ، فهم لا يفترضون توازن هاردي واينبرغ أو التزاوج العشوائي ، كما هو الحال مع العديد من المجموعات السكانية. ومع ذلك ، تم تصميم العديد منها للعمل مع NAMs أو مجموعات سكانية أخرى بدون تغاير الزيجوت [30 ، 31 ، 56 ، 57]. من بين طرق التضمين القادرة على GBS الموجودة بالفعل ، تم تصميم معظمها للخطوط الفطرية حيث يكون تغاير الزيجوت غائبًا إلى حد كبير. بالنسبة للسكان الذين لديهم كميات كبيرة متبقية من تغاير الزيجوت ، فإن هذه الطرق غير مناسبة. وبالتالي ، فإن المجال الحاسم التالي للتحسين في GBS من المرجح أن يكون خوارزمية احتساب أو حزمة من الخوارزميات التي يمكن أن تلبي متطلباتها الفريدة.

لذلك يعتمد اختيار الإنزيم بشكل كبير على موارد البيانات المتاحة. في مجموعة سكانية ذات جينوم مرجعي راسخ وقليل تغاير الزيجوت ، قد يوفق التضمين مجموعة بيانات بكميات كبيرة من العلامات المفقودة في خريطة جينية قوية. في كائن حي به جينوم مرجعي على مستوى متجاور أو غير موجود ، قد يكون من المرغوب فيه اختيار إنزيم ذي ملف تعريف متفرق بحيث يتم تغطية كل علامة في عدد كبير من العينات. ومع ذلك ، ستتطلب معظم طرق تصحيح الخطأ أن يكون للعلامة تغطية تسلسلية عبر عدد كافٍ من العينات.

لقد أثبت GBS بالفعل قابلية البقاء في رسم خرائط السمات ، وتحليل المزيج ، والارتباط الواسع للجينوم ، وعلم الجينوم السكاني ، وتوصيف التنوع في الكائنات المرجعية وغير المرجعية [58]. تزيد التعديلات الموصوفة هنا من إمكانية نقل GBS إلى المعامل الفردية المهتمة باعتمادها عن طريق تقليل التكلفة الأولية للقليل ، مما يسمح بإجراء تجارب تجريبية بسيطة ومنخفضة التكلفة ودمج إعداد المكتبة بشكل مباشر في خط أنابيب Illumina القياسي.


3´ نظام RACE للتضخيم السريع لنهايات cDNA

التضخيم السريع لنهايات (كدنا) (RACE) هو إجراء لتضخيم تسلسل الحمض النووي من قالب RNA الرسول بين موقع داخلي محدد وإما نهاية الرنا المرسال 3 أو 5 درجة (1). تم وصف منهجية التضخيم هذه بخصوصية من جانب واحد على أنها تفاعل البوليميراز المتسلسل "أحادي الجانب" (2) أو تفاعل البوليميراز المتسلسل "المرتكز" (3). يتطلب تفاعل البوليميراز المتسلسل (PCR) اثنين من البادئات الخاصة بالتسلسل والتي تحيط بالتسلسل لتضخيمه (4،5). ومع ذلك ، لتضخيم وتمييز مناطق التسلسل غير المعروف ، يفرض هذا المطلب قيدًا (3). يستفيد 3´ RACE من ذيل بولي الطبيعي (A) الموجود في mRNA كموقع فتيل عام لـ PCR. في هذا الإجراء ، يتم تحويل mRNAs إلى (كدنا) باستخدام النسخ العكسي (RT) ومحول أوليجو- dT. يتم بعد ذلك تضخيم (كدنا) محدد بواسطة تفاعل البوليميراز المتسلسل باستخدام جهاز تمهيدي خاص بالجينات (GSP) الذي يصلب إلى منطقة من تسلسلات exon المعروفة وبادئ محول يستهدف منطقة ذيل بولي (A). يسمح هذا بالتقاط متواليات 3´-mRNA غير المعروفة التي تقع بين exon وذيل poly (A). يستخدم RACE 5´ RACE تمهيديًا محددًا للجين المضاد لتوليف cDNA محدد عن طريق النسخ العكسي.

قبل PCR ، تقوم خطوة TdT-tailing بإرفاق تسلسل محول بالتسلسلات غير المعروفة 5´ من cDNA. يتم بعد ذلك تضخيم cDNA محدد بواسطة PCR باستخدام GSP الذي يصلب في منطقة من تسلسلات exon المعروفة ومحول أولي يستهدف الطرف 5´. تم استخدام RACE لتضخيم واستنساخ mRNAs النادرة (6) ويمكن تطبيقها على مكتبات cDNA الموجودة (7). بالإضافة إلى ذلك ، يمكن تسلسل منتجات RACE مباشرة دون أي خطوات استنساخ وسيطة (8،9) ، أو يمكن استخدام المنتجات لإعداد المجسات (10). يمكن دمج المنتجات التي تم إنشاؤها بواسطة إجراءات 3´ و 5´ RACE لتوليد cDNAs كاملة الطول (10 ، 11). أخيرًا ، يمكن استخدام إجراءات RACE جنبًا إلى جنب مع طرق الاصطياد الخارجي (12) لتمكين التضخيم والتوصيف اللاحق لتسلسلات التشفير غير المعروفة.

ملخص نظام 3´ RACE


يتم تلخيص إجراء 3´ RACE على النحو التالي. يبدأ أول تخليق حبلا (كدنا) في ذيل بولي (أ) من مرنا باستخدام التمهيدي المحول (AP). بعد تخليق أول جديلة (كدنا) ، يتم تدمير قالب الرنا المرسال الأصلي باستخدام RNase H ، وهو خاص بـ RNA: جزيئات الحمض النووي غير المتجانسة.يتم إجراء التضخيم ، دون الاستخراج العضوي الوسيط أو ترسبات الإيثانول ، باستخدام اثنين من البادئات: أحدهما عبارة عن GSP مصمم بواسطة المستخدم والذي يصلب إلى موقع موجود داخل جزيء cDNA ، والآخر عبارة عن جهاز تمهيدي عالمي للتضخيم يستهدف mRNA الخاص بـ cDNA التكميلي لـ 3´ نهاية مرنا. يتم توفير اثنين من بادئات التضخيم العالمية مع النظام. تم تصميم أساس التضخيم الشامل (UAP) للاستنساخ السريع والفعال لمنتجات RACE باستخدام طريقة استنساخ uracil DNA glycosylase (UDG) (13-16). التمهيدي العالمي المختصر (AUAP) متماثل مع تسلسل المحول المستخدم لتوليف أول حبلا (كدنا).

نظرًا لأن نظام 3-RACE يستخدم منطقة الذيل المتعددة (A) كموقع تمهيد أولي ، يمكن تصنيع منتجات تضخيم متعددة ، اعتمادًا على درجة الخصوصية التي يمنحها GSP. لإنشاء منتج تضخيم محدد ، قد يجد المستخدم أنه من المفيد تصميم GSP ثاني "متداخل" ، على النحو الموصى به من قبل Frohman et al. (10) و reamplify منتجات RACE تمت مناقشة هذا الإجراء بمزيد من التفصيل في نهاية هذا الفصل

أحد أهم العوامل التي تسبق تخليق (كدنا) كامل الطول إلى حد كبير هو عزل الحمض النووي الريبي السليم. تحدد جودة الحمض النووي الريبي أقصى قدر من معلومات التسلسل التي يمكن تحويلها إلى cDNA. وبالتالي ، من المهم تحسين عزل الحمض النووي الريبي من مصدر بيولوجي معين ومنع الإدخال العرضي لـ RNases (17) ومثبطات النسخ العكسي مثل أملاح الغوانيدينيوم و SDS و EDTA (18). يمكن عزل الحمض النووي الريبي باستخدام مجموعة متنوعة من الطرق. الطريقة الموصى بها لـ 3´ RACE هي طريقة guanidine isothiocyanate / acid-phenol الموصوفة في الأصل بواسطة Chomzynski و Sacchi (19). طريقة TRIzol Reagent هي تحسين للطريقة الأصلية ذات الخطوة الواحدة من Chomczynski و Sacchi (20) ويمكن استخدامها لإعداد RNA من أقل من 10 3 خلايا أو كميات ملليغرام من الأنسجة (21). إجمالي الحمض النووي الريبي المعزول باستخدام Invitrogen TRIzol Reagent غير متحلل وخالٍ من البروتين والتلوث بالحمض النووي. لعزل الحمض النووي الريبي من كميات صغيرة من العينة (& lt10 6 خلايا أو & lt10 ملغ نسيج) دون استخدام الفينول ، يوصى باستخدام نظام خرطوشة جلاس ماكس RNA Microisolation Spin (22).

قد يحتوي إجمالي الحمض النووي الريبي المعزول بهذه الطرق على كميات صغيرة من الحمض النووي الجيني الذي يمكن تضخيمه لاحقًا مع الحمض النووي الريبي الهدف. من غير المحتمل أن يسبب وجود هذا الحمض النووي مشاكل لأنه يفتقر إلى المنطقة المتعددة (A) الموجودة في تحليل الرنا المرسال. ومع ذلك ، كإجراء احترازي ، نوصي بإجراء تجربة تحكم بدون النسخ العكسي لتحديد ما إذا كان جزء معين من الحمض النووي الجيني أو من أصل cDNA. المنتجات التي تم إنشاؤها في غياب RT هي من أصل جينومي. إذا كان تطبيقك يتطلب إزالة جميع الحمض النووي الجيني من إعداد الحمض النووي الريبي ، فارجع إلى DNase I Digestion of RNA Preparation.

أول ستراند [كدنا] توليف من مجموع الحمض النووي الريبي

يتم تحفيز أول تفاعل تخليقي (كدنا) بواسطة Invitrogen SuperScript II RT. هذا الإنزيم عبارة عن طفرة من M-MLV RT تم تصميمها لتقليل نشاط RNase H ، مما يؤدي إلى إنتاجية أكبر والمزيد من التوليف الكامل الطول (23 ، 24 ، 25). يُظهر الإنزيم ثباتًا حراريًا متزايدًا ويمكن استخدامه في درجات حرارة تصل إلى 50 درجة مئوية. بالإضافة إلى ذلك ، لا يتم تثبيط SuperScript II RT بشكل كبير عن طريق الريبوسوم ونقل الحمض النووي الريبي ويمكن استخدامه لتجميع أول حبلا (كدنا) من إعداد الحمض النووي الريبي الكلي. تتم إزالة قالب RNA من (cDNA): جزيء هجين RNA عن طريق الهضم باستخدام RNase H بعد تخليق cDNA لزيادة حساسية PCR (26). تم تصميم AP الذي يعد أول توليف cDNA ، بحيث يحتوي على ثلاثة مواقع نوكلياز مقيدة ونصف موقع ليس أنا. قد يؤدي تضمين هذه التسلسلات في التمهيدي إلى تسهيل الاستنساخ بعد التضخيم باستخدام إما طريقة تعتمد على نوكلياز داخلي (27) أو طريقة تعتمد على بوليميريز الحمض النووي T4 (28). نظرًا لأن AP يبدأ تخليق cDNA في منطقة poly (A) من mRNA ، فإنه يختار بشكل فعال mRNAs متعدد الأدينيلات وبالتالي ، فإن اختيار oligo (dT) لـ poly (A) + RNA ليس ضروريًا عادةً على الرغم من أن دمج هذه الخطوة قد يسهل الكشف من نصوص mRNA النادرة.

تضخيم الهدف (كدنا)


تضخيم (كدنا) مستهدف يتطلب فتيلة مع اثنين قليل النوكليوتيدات و Taq DNA polymerase. أساس تضخيم الحس هو GSP الذي يوفره المستخدم ، وهو خاص بالجين المعين أو تسلسل الاهتمام ويمكن تصميمه ليشمل عناصر التسلسل التي تسهل خطوات الاستنساخ اللاحقة. يعد أساس التضخيم المضاد للتضخيم أحد اثنين من بادئات التضخيم الشاملة المتوفرة مع النظام. يحتوي AUAP على تسلسل موقع نوكلياز مقيد (منطقة المحول) متماثل مع منطقة المحول في AP. يتكون UAP من نفس منطقة المحول بالإضافة إلى تسلسل يحتوي على dUMP في نهاية 5´ من التمهيدي المطلوب للاستنساخ بوساطة UDG. لا ينبغي استخدام UAP لتوليف الحمض النووي مع أي بوليميراز جرثومي (على سبيل المثال ، Pyrococcus furiosus ، Pyrococcus woesei ، إلخ) أو أي خليط إنزيم PCR طويل (على سبيل المثال ، Elongase® Enzyme Mix) يحتوي على أحد هذه الإنزيمات بسبب التثبيط من نشاط البلمرة بواسطة DNA المحتوي على dUMP. سيعمل كل من AUAP و UAP في PCR عند درجات حرارة تصلب حتى 68 درجة مئوية

تصميم التمهيدي الخاص بالجينات

يعتمد تضخيم تفاعل البوليميراز المتسلسل (PCR) النوعي والفعال بشكل كبير على التصميم التمهيدي. هذا ينطبق بشكل خاص على تطبيقات RACE حيث يتم تنفيذ PCR باستخدام GSP واحد فقط. بشكل عام ، تشكل البادئات الفعالة أزواجًا مستقرة مع تسلسلها المستهدف ، وهي محددة للغاية لتسلسلاتها المستهدفة ، وخالية من البنية الثانوية مثل حلقات دبوس الشعر وثناياتها (29-31). بالإضافة إلى ذلك ، يجب التقليل من تكاملية التمهيدي 3´-termini نظرًا لأن القطع الأثرية للبطين التمهيدي قد تقلل بشكل كبير من كفاءة PCR. لذلك ، يجب تقليل تشكيل dimer مع AUAP أو UAP التمهيدي ، وكذلك نفسه. غالبًا ما تسهل خوارزميات الكمبيوتر التي تم تطويرها (32-35) والمتاحة تجاريًا هذا التحليل. يمكن العثور على مناقشة تصميم التمهيدي لتطبيقات RACE في Frohman (11) و Loh (6). وتجدر الإشارة إلى أنه في الحالات التي لا تتوفر فيها سوى معلومات محدودة عن تسلسل الببتيد ، يمكن إعداد نظام الأفضليات المعمم المتدهور. تم تصميم AUAP و UAP مع النظام ليعمل في درجات حرارة تصلب PCR تصل إلى 68 درجة مئوية ولتسهيل خطوة الاستنساخ. يجب أن تكون GSPs المعرفة من قبل المستخدم متوافقة مع طريقة الاستنساخ. أضف ما يلي إلى نهاية 5 'من GSP: لاستنساخ UDG: 5´ – CAU CAU CAU CAU – 3 (استخدم مع UAP) لاستنساخ T4 DNA polymerase: 5´ – CGA – 3´ (استخدم مع AUAP)

تم تصميم AP لتجميع أول حبلا (كدنا) من جميع الرنا المرسال متعدد الأدينيلات. لذلك فإن خصوصية التسلسل في تفاعل التضخيم مشتق فقط من نظام الأفضليات المعمم. في كثير من الأحيان ، يمكن استخدام GSP "المتداخلة" الثانية بالاقتران مع AUAP أو UAP في تفاعل تضخيم ثان لإعطاء إجراء 3´ RACE خصوصية التمهيدي الثاني (9). يمكن لـ GSP المتداخلة أن يصلب على الفور بجوار GSP الأول أو عند تسلسل داخل cDNA مزيد من المصب. يمكن إجراء تفاعل التضخيم المتداخل بشكل ملائم باستخدام سدادة من agarose من تحليل الهلام لتفاعل 3´ RACE الأولي (انظر التضخيم المتداخل من سدادة Agarose). في النهاية ، يجب أن ينتج إجراء 3-RACE شريطًا واحدًا بارزًا على هلام agarose. عند إجراء 3-RACE باستخدام جهاز تمهيدي متداخل ، يجب تصميم التسلسلات الخاصة بمعالجات الاستنساخ اللاحقة (انظر تصميم التمهيدي الخاص بالجينات) في GSP المتداخلة.

استنساخ منتجات التضخيم

يمكن أن تكون طرق الاستنساخ التقليدية التي تتضمن عادةً الاستنساخ النهائي والاستنساخ غير الحاد مشكلة بالنسبة للمنتجات المضخمة (36-38). البديل هو طريقة سريعة وفعالة تنطوي على استخدام UDG (13-16). تتطلب هذه الطريقة أن يقوم المستخدم بتصميم GSP يحتوي على تسلسل 5 '- (CAU) 4. يمكن أن يتم دمج DUMP في نظام الأفضليات المعمم على معظم المركِّبات الآلية أو باستخدام مواد Invitrogen Custom Primers (انظر تصميم التمهيدي الخاص بالجينات). يتم معالجة ناتج تفاعل 3-RACE المُجهز بـ UAP و GSP المحتوي على dUMP باستخدام UDG ، والذي يحول مخلفات DUMP إلى مواقع غير أساسية (39،40) ، لتوليد 3 درجات متراكمة. يمكن استغلال الطبيعة الاتجاهية لعملية استنساخ UDG لإضفاء مستوى إضافي من الخصوصية على إجراء RACE. منتج التضخيم الذي ينتج عن التحضير بواسطة كل من UAP و GSP المصمم بشكل مناسب هم ركائز فعالة لاستنساخ UDG. بديل آخر لطرق الاستنساخ التقليدية يستخدم 3´ إلى 5´ نشاط نوكلياز خارجي لـ T4 DNA polymerase كأساس للاستنساخ كما وصفه Stoker (28). في هذا الإجراء ، يتم استخدام AUAP في تفاعل التضخيم ، ويتم التعامل مع منتجات 3´ RACE باستخدام بوليميريز T4 DNA لتوليد ليس I 5 متراكمة. وبالمثل ، يجوز للمستخدم تصميم موقع في نظام الأفضليات المعمم (انظر تصميم التمهيدي الخاص بالجينات). هناك طريقة أخرى للاستنساخ وهي هضم منتج 3-RACE باستخدام أحد مواقع نوكلياز التقييد المصممة في AUAP. يجوز للمستخدم أيضًا تصميم مواقع تقييد فريدة في نظام الأفضليات المعمم ، واستغلال موقع موجود في تسلسل cDNA أو إصلاح منتج 3´ RACE قبل تقييد الهضم الداخلي للنوكلياز (37).


تفسير النتائج

تحليل نتائج 5 'RACE:

بعد تفاعل البوليميراز المتسلسل ، يمكن تحليل المنتجات بواسطة الرحلان الكهربائي لهلام الاغاروز (1٪ إلى 2٪) وتلطيخ بروميد الإيثيديوم. تعتمد كثافة النطاق وتوزيع حجم المنتجات الناتجة على خصوصية GSPs المستخدمة في تخليق cDNA و PCR ، والتعقيد والوفرة النسبية للـ cDNA المستهدف ، وظروف PCR المستخدمة. قد تختلف منتجات التضخيم من نطاق محدد واحد إلى منتجات منفصلة متعددة إلى لطاخة منتشرة واسعة. قد يساهم تخليق cDNA غير المكتمل ، والتهيئة الشاذة لـ GSPs أثناء توليف الشد الأول أو PCR ، والخطأ بواسطة برايمر المرساة ، وكذلك التمهيدي-dimer وغيرها من القطع الأثرية PCR في تعقيد المنتجات التي تم الحصول عليها بواسطة 5 'RACE. قد يكون تحديد نطاقات منتج معينة معقدًا بسبب وجود منتجات غير محددة تعتمد على كل من النسخ العكسي و dC-tailing (36). إذا كانت التسلسلات متاحة للاستخدام كمجسات داخلية ، يوصى بشدة باستخدام تحليل اللطخة الجنوبية لتحديد نطاقات منتجات معينة. يمكن أيضًا تحديد منتجات معينة باستخدام تقييد تشخيصي لهضم نوكلياز داخلي إذا كان تسلسل (كدنا) المضخم يحتوي على موقع تقييد معروف.

قد تسهل العديد من الضوابط تفسير النتائج. يمكن التعرف على المنتجات التي تنتج عن تضخيم الحمض النووي الجيني الملوث من خلال تفاعلات التحكم التي تحذف RT. نهج بديل هو تضمين تفاعلات التحكم التي تستخدم الحمض النووي الجينومي كهدف (6). يجب فحص خصوصية المرساة التمهيدي للذيل oligo-dC عن طريق إجراء تفاعلات التضخيم مع cDNA التي تتعرض لـ dC-tailing في وجود وغياب TdT. قد تكون عناصر التحكم الإضافية التي تضخم cDNA ذات الذيل dC باستخدام كل جهاز تمهيدي على حدة (إما تمهيدي Anchor Primer أو GSP2) مفيدة في تحديد المنتجات غير المحددة التي تنتج عن سوء فهم.

تضخيم متداخل:

5 'RACE من الرسائل النادرة قد تتطلب PCR إضافية باستخدام GSP متداخلة وإما UAP أو AUAP. بشكل عام ، يتم استخدام التخفيف من PCR الأصلي كهدف. يتكون التمهيدي المتداخل من متواليات تقع 3 'على التمهيدي الأصلي (GSP2). بالنسبة لـ 5 'RACE ، سيكون هذا بمثابة تمهيدي مضاد للدلالة يصلب أقرب إلى نهاية mRNA 5'. قد يؤدي تنقية منتج PCR الأصلي من مواد أولية ومنتجات ثنائية التمهيدي إلى تحسين خصوصية وكفاءة إجراءات التضخيم المتداخلة بشكل كبير. في النهاية ، يجب أن ينتج إجراء 5 'RACE شريطًا بارزًا واحدًا على هلام agarose. قد يتطلب هذا جولات إضافية من PCR باستخدام GSPs المتداخلة على التوالي. ستعتمد القرارات المتعلقة بتصميم التمهيدي المتداخل على كمية معلومات التسلسل المتاحة للهدف محل الاهتمام وعلى نتائج تفاعل التضخيم الأصلي. عند إجراء 5 'RACE باستخدام جهاز تمهيدي متداخل ، يجب تصميم التسلسلات الخاصة بمعالجات الاستنساخ النهائية في GSP المتداخلة.


تم الانتهاء من تسلسل الجينوم البشري في عام 2003 ، بعد 13 عامًا من التعاون الدولي واستثمار 3 مليارات دولار أمريكي. استخدم مشروع الجينوم البشري تسلسل سانجر (وإن كان محسنًا بشكل كبير) ، وهي الطريقة الرئيسية لتسلسل الحمض النووي منذ اختراعه في السبعينيات.

اليوم ، يتزايد الطلب على التسلسل بشكل كبير ، مع الحاجة إلى تحليل كميات كبيرة من الحمض النووي الجيني بسرعة وبتكلفة منخفضة ودقة. بفضل تقنيات التسلسل الجديدة المعروفة مجتمعة باسم تسلسل الجيل التالي ، أصبح من الممكن الآن تسلسل جينوم بشري كامل في غضون ساعات.

تسلسل سانجر وتسلسل الجيل التالي

يشبه المبدأ الكامن وراء تسلسل الجيل التالي (NGS) مبدأ تسلسل سانجر ، الذي يعتمد على الرحلان الكهربي الشعري. يتم تجزئة الخيط الجينومي ، ويتم تحديد القواعد الموجودة في كل جزء من خلال الإشارات المنبعثة عندما يتم ربط الأجزاء بقالب القالب.
تتطلب طريقة سانجر خطوات منفصلة للتسلسل والفصل (عن طريق الرحلان الكهربي) والكشف ، مما جعل من الصعب أتمتة تحضير العينة وكان محدودًا في الإنتاجية وقابلية التوسع والدقة. تستخدم طريقة NGS التسلسل المستند إلى المصفوفة والذي يجمع بين التقنيات المطورة في تسلسل Sanger لمعالجة ملايين التفاعلات بالتوازي ، مما ينتج عنه سرعة عالية للغاية وإنتاجية بتكلفة منخفضة. يمكن الآن إكمال مشاريع تسلسل الجينوم التي استغرقت عدة سنوات باستخدام طرق Sanger في غضون ساعات باستخدام NGS ، على الرغم من أطوال قراءة أقصر (عدد القواعد التي يتم تسلسلها في كل مرة) ودقة أقل.

تتضمن طرق الجيل التالي لتسلسل الحمض النووي ثلاث خطوات عامة:

  • إعداد المكتبة: يتم إنشاء المكتبات باستخدام التجزئة العشوائية للحمض النووي ، متبوعًا بالربط باستخدام الروابط المخصصة
  • التضخيم: يتم تضخيم المكتبة باستخدام طرق التضخيم النسيلي و PCR
  • التسلسل: يتم ترتيب تسلسل الحمض النووي باستخدام واحد من عدة طرق مختلفة

إعداد المكتبة

أولاً ، يتم تجزئة الحمض النووي إما إنزيميًا أو عن طريق الصوتنة (الإثارة باستخدام الموجات فوق الصوتية) لإنشاء خيوط أصغر. يتم بعد ذلك ربط المحولات (قطع قصيرة من الحمض النووي الاصطناعي مزدوج الشريطة) بهذه الأجزاء بمساعدة DNA ligase ، وهو إنزيم ينضم إلى خيوط الحمض النووي. تمكن المحولات التسلسل من الارتباط بنظير تكميلي.

يتم تصنيع المحولات بحيث يكون أحد طرفيها "لزجًا" بينما يكون الطرف الآخر "غير حاد" (غير متماسك) بهدف ربط النهاية الحادة بالحمض النووي غير الحاد. قد يؤدي هذا إلى المشكلة المحتملة المتمثلة في الاقتران الأساسي بين الجزيئات وبالتالي تكوين خافت. لمنع هذا ، يتم استخدام التركيب الكيميائي للحمض النووي ، حيث يحدث الربط بين نهايات 3 & Prime-OH و 5 & Prime-P. عن طريق إزالة الفوسفات من الطرف اللاصق للمحول وبالتالي إنشاء نهاية 5 & Prime-OH بدلاً من ذلك ، فإن DNA ligase غير قادر على تشكيل جسر بين الطرفين (الشكل 1).

الشكل 1 | إعداد مكتبة لتسلسل الجيل التالي

لكي يكون التسلسل ناجحًا ، يجب تجميع أجزاء المكتبة مكانيًا في مستعمرات PCR أو `` polonies '' كما هو معروف تقليديًا ، والتي تتكون من عدة نسخ من جزء مكتبة معين. نظرًا لأن هذه polonies متصلة بطريقة مستوية ، يمكن معالجة ميزات المصفوفة بشكل إنزيمي بالتوازي. هذه الطريقة في بناء المكتبة أسرع بكثير من الإجراء السابق كثيف العمالة لانتقاء المستعمرة واستنساخ الإشريكية القولونية المستخدمة لعزل وتضخيم الحمض النووي لتسلسل سانجر ، ومع ذلك ، هذا على حساب طول قراءة الأجزاء.

التضخيم

تضخيم المكتبة مطلوب حتى تكون الإشارة المستلمة من جهاز التسلسل قوية بما يكفي لاكتشافها بدقة. مع التضخيم الأنزيمي ، يمكن أن تحدث ظواهر مثل "التحيز" و "الازدواجية" مما يؤدي إلى تضخيم تفضيلي لأجزاء مكتبة معينة. بدلاً من ذلك ، هناك عدة أنواع من عمليات التضخيم التي تستخدم تفاعل البوليميراز المتسلسل (PCR) لإنشاء أعداد كبيرة من مجموعات الحمض النووي.

مستحلب PCR

يتم خلط زيت المستحلب والخرز ومزيج PCR والحمض النووي للمكتبة لتشكيل مستحلب يؤدي إلى تكوين آبار دقيقة (الشكل 2).

لكي تنجح عملية التسلسل ، يجب أن يحتوي كل بئر صغير على حبة واحدة مع خيط واحد من الحمض النووي (حوالي 15 ٪ من الآبار الدقيقة من هذا التكوين). ثم يغير PCR جزء المكتبة الذي يؤدي إلى خيطين منفصلين ، أحدهما (الخيط العكسي) يصلب إلى الخرزة. يتم تضخيم الحمض النووي الملدن بواسطة البوليميراز بدءًا من الحبة باتجاه موقع التمهيدي. ثم يغير الخيط العكسي الأصلي ويتم تحريره من الخرزة فقط لإعادة التلدين إلى الخرزة لإعطاء خيطين منفصلين. يتم تضخيم كلاهما لإعطاء اثنين من خيوط الحمض النووي متصلة بالخرز. تتكرر العملية بعد ذلك على مدى 30-60 دورة مؤدية إلى مجموعات من الحمض النووي. تم انتقاد هذه التقنية بسبب طبيعتها المستهلكة للوقت ، لأنها تتطلب العديد من الخطوات (تشكيل وكسر المستحلب ، تضخيم PCR ، التخصيب ، إلخ) على الرغم من استخدامها المكثف في العديد من منصات NGS. كما أنه غير فعال نسبيًا نظرًا لأن حوالي ثلثي المفاعلات الدقيقة للمستحلب فقط تحتوي في الواقع على حبة واحدة. لذلك يلزم اتخاذ خطوة إضافية لفصل الأنظمة الفارغة مما يؤدي إلى مزيد من عدم الدقة المحتملة.

جسر PCR

يتم تغطية سطح خلية التدفق بكثافة مع الاشعال التي تكون مكملة للبادئات المرفقة بأجزاء مكتبة الحمض النووي (الشكل 3). ثم يتم ربط الحمض النووي بسطح الخلية بشكل عشوائي حيث يتم تعريضه للكواشف من أجل التمديد القائم على البوليميراز. بالإضافة إلى النيوكليوتيدات والإنزيمات ، تلتصق الأطراف الحرة للخيوط المفردة للحمض النووي بسطح الخلية عبر مواد أولية تكميلية ، مما يؤدي إلى إنشاء هياكل مترابطة. تتفاعل الإنزيمات بعد ذلك مع الجسور لتجعلها مزدوجة الجديلة ، بحيث عندما يحدث التمسخ ، يتم ربط جزأين من الحمض النووي المفردين بالسطح على مسافة قريبة. يؤدي تكرار هذه العملية إلى مجموعات نسيليّة من خيوط متطابقة موضعية. من أجل تحسين كثافة الكتلة ، يجب مراقبة تركيزات الكواشف عن كثب لتجنب الازدحام.

التسلسل

تم تطوير العديد من الطرق المتنافسة لتسلسل الجيل التالي من قبل شركات مختلفة.

454 Pyrosequencing

يعتمد Pyrosequencing على مبدأ "التسلسل بالتوليف" ، حيث يتم تصنيع خيط تكميلي في وجود إنزيم البوليميراز (الشكل 4). على النقيض من استخدام ديديوكسينوكليوتيدات لإنهاء تضخيم السلسلة (كما في تسلسل سانجر) ، يكتشف التسلسل الحراري بدلاً من ذلك إطلاق بيروفوسفات عند إضافة النيوكليوتيدات إلى سلسلة الحمض النووي. يستخدم في البداية تقنية مستحلب PCR لبناء polonies المطلوبة للتسلسل وإزالة الخيط التكميلي. بعد ذلك ، يتم تهجين التمهيدي التسلسلي ssDNA إلى نهاية الشريط (منطقة ربط التمهيدي) ، ثم يتم بعد ذلك إجراء dNTPs الأربعة المختلفة بالتسلسل للتدفق داخل وخارج الآبار فوق polonies.عندما يتم دمج dNTP الصحيح إنزيميًا في الخيط ، فإنه يتسبب في إطلاق بيروفوسفات. في وجود سلفوريلاز ATP والأدينوزين ، يتم تحويل البيروفوسفات إلى ATP. يتم استخدام جزيء ATP هذا في تحويل لوسيفيراز المحفز من لوسيفيرين إلى أوكسيلوسيفيرين ، والذي ينتج ضوءًا يمكن اكتشافه بواسطة الكاميرا. تتناسب الكثافة النسبية للضوء مع كمية القاعدة المضافة (أي أن ذروة ضعف الشدة تشير إلى قاعدتين متطابقتين تمت إضافتهما على التوالي).

الشكل 4 | 454 Pyrosequencing

كانت Pyrosequencing ، التي طورتها 454 Life Sciences ، واحدة من النجاحات المبكرة لتسلسل الجيل التالي بالفعل ، أنتجت 454 Life Sciences أول جهاز تسلسل من الجيل التالي متوفر تجاريًا. ومع ذلك ، فقد طغت التقنيات الأخرى على هذه الطريقة ، وفي عام 2013 ، أعلن المالكون الجدد Roche عن إغلاق 454 Life Sciences وإيقاف منصة 454 pyrosequencing.

تسلسل أيون سيل لأشباه الموصلات

يستخدم تسلسل التورنت الأيوني نهج "التسلسل بالتوليف" ، حيث يتم تصنيع خيط DNA جديد ، مكمل للخيط المستهدف ، قاعدة واحدة في كل مرة. تكتشف شريحة أشباه الموصلات أيونات الهيدروجين المنتجة أثناء بلمرة الحمض النووي (الشكل 5).

بعد تكوين البولوني باستخدام مستحلب PCR ، يتم غمر جزء مكتبة الحمض النووي بالتتابع مع كل ثلاثي فوسفات النوكليوزيد (dNTP) ، كما هو الحال في التسلسل الحراري. ثم يتم دمج dNTP في الخيط الجديد إذا كان مكملًا للنيوكليوتيدات على الخيط المستهدف. في كل مرة يتم فيها إضافة نيوكليوتيد بنجاح ، يتم إطلاق أيون الهيدروجين ، ويتم اكتشافه بواسطة مستشعر الأس الهيدروجيني لجهاز التسلسل. كما هو الحال في طريقة التسلسل الحراري ، إذا تمت إضافة أكثر من نفس النيوكليوتيدات ، فإن التغيير في درجة الحموضة / شدة الإشارة يكون أكبر بالمقابل.

الشكل 5 | تسلسل أيون سيل لأشباه الموصلات

تسلسل التورنت الأيوني هو أول تقنية تجارية لا تستخدم الفلورة والمسح الضوئي بالكاميرا ، وبالتالي فهي أسرع وأرخص من العديد من الطرق الأخرى. لسوء الحظ ، قد يكون من الصعب تعداد عدد القواعد المتطابقة المضافة على التوالي. على سبيل المثال ، قد يكون من الصعب التفريق بين تغيير الأس الهيدروجيني لتكرار متجانس بطول 9 إلى واحد بطول 10 ، مما يجعل من الصعب فك تشفير المتواليات المتكررة.

التسلسل عن طريق الربط (SOLiD)

SOLiD هي طريقة إنزيمية للتسلسل تستخدم DNA ligase ، وهو إنزيم يستخدم على نطاق واسع في التكنولوجيا الحيوية لقدرته على ربط خيوط DNA مزدوجة الشريطة (الشكل 6). يستخدم مستحلب PCR لتجميد / تضخيم منطقة ربط ssDNA التمهيدي (المعروفة باسم المحول) والتي تم ربطها بالتسلسل المستهدف (أي التسلسل الذي سيتم تسلسله) على حبة. يتم بعد ذلك ترسيب هذه الحبيبات على سطح زجاجي - يمكن تحقيق كثافة عالية من الخرزات والتي بدورها تزيد من إنتاجية التقنية.

بمجرد حدوث ترسيب الخرزة ، يتم تهجين مادة أولية بطول N إلى المحول ، ثم يتم تعريض الخرزات لمكتبة من مجسات 8-mer التي لها صبغة فلورية مختلفة في نهاية 5 'ومجموعة هيدروكسيل في نهاية 3'. القواعد 1 و 2 مكملة للنيوكليوتيدات المراد تسلسلها بينما القواعد 3-5 متدهورة والقواعد 6-8 هي قواعد إينوزين. فقط المسبار التكميلي سوف يتهجين مع التسلسل المستهدف المجاور للطلاء التمهيدي. ثم يتم استخدام DNA ligase للانضمام إلى مسبار 8-mer في التمهيدي. يسمح الارتباط الفسفوري بين القاعدتين 5 و 6 بصبغ الفلورسنت من الجزء باستخدام أيونات الفضة. يسمح هذا الانقسام بقياس التألق (يتم استخدام أربعة أصباغ فلورية مختلفة ، وكل منها لها أطياف انبعاث مختلفة) وتولد أيضًا مجموعة 5-فوسفات يمكن أن تخضع لمزيد من الربط. بمجرد اكتمال الجولة الأولى من التسلسل ، يتم صهر منتج التمديد ثم يتم تعطير جولة ثانية من التسلسل باستخدام أساس تمهيدي بطول N 1. العديد من جولات التسلسل باستخدام بادئات أقصر في كل مرة (أي N 2 ، N − 3 إلخ) وقياس التألق يضمن تسلسل الهدف.

نظرًا لطريقة التسلسل المكون من قاعدتين (نظرًا لأن كل قاعدة يتم ترتيبها بشكل فعال مرتين) ، فإن تقنية SOLiD دقيقة للغاية (بنسبة 99.999٪ مع جهاز تمهيدي سادس ، وهي الأكثر دقة من منصات الجيل الثاني) وغير مكلفة أيضًا. يمكنه إكمال تشغيل واحد في 7 أيام وفي ذلك الوقت يمكنه إنتاج 30 جيجا بايت من البيانات. لسوء الحظ ، فإن عيبها الرئيسي هو أن أطوال القراءة قصيرة ، مما يجعلها غير مناسبة للعديد من التطبيقات.

الشكل 6 | التسلسل بالربط

تسلسل المنهي العكسي (Illumina)

يختلف تسلسل الإنهاء العكسي عن طريقة سانجر التقليدية في أنه بدلاً من إنهاء امتداد التمهيدي بشكل لا رجعة فيه باستخدام ديديوكسينوكليوتيد ، يتم استخدام النيوكليوتيدات المعدلة في إنهاء قابل للانعكاس. في حين أن العديد من التقنيات الأخرى تستخدم مستحلب PCR لتضخيم أجزاء مكتبة الحمض النووي ، فإن الإنهاء القابل للانعكاس يستخدم جسر PCR ، مما يحسن كفاءة هذه المرحلة من العملية.

يمكن تجميع أدوات الإنهاء العكسية في فئتين: 3 & إنهاءات عكسية محجوبة من نوع Prime-O و 3 & إنهاءات عكسية غير محظورة رئيسية.

3 & Prime-O-blockable terminators

تستخدم الآلية تسلسلًا من خلال نهج التوليف ، مما يؤدي إلى إطالة التمهيدي بطريقة تدريجية. أولاً ، يتم تثبيت الاشعال المتسلسل والقوالب على دعم قوي. يتعرض الدعم لكل من قواعد الحمض النووي الأربعة ، والتي لها فلوروفور مختلف متصل (بالقاعدة النيتروجينية) بالإضافة إلى مجموعة 3’-O-azidomethyl (الشكل 7).

الشكل 7 | هيكل azidomethyl dNTP المسمى الفلورسنت المستخدم في تسلسل Illumina

فقط الأساس الصحيح يصلب إلى الهدف ويتم ربطه لاحقًا بالبادئة. يتم بعد ذلك تصوير الدعامة الصلبة ويتم غسل النيوكليوتيدات التي لم يتم دمجها ويتم شق الفرع الفلوري باستخدام TCEP (تريس (2-كاربوكسي إيثيل) فوسفين). تزيل TCEP أيضًا مجموعة 3’-O-azidomethyl ، وتجديد 3’-OH ، ويمكن تكرار الدورة (الشكل 8).

الشكل 8 | تسلسل فاصل عكسي

3 & إنهاء عكسي رئيس الوزراء

ترتبط مجموعة الإنهاءات القابلة للانعكاس المكونة من 3 & Prime-free-unlocked terminators بكل من القاعدة ومجموعة التألق ، والتي تعمل الآن كجزء من مجموعة الإنهاء بالإضافة إلى مراسل. تختلف هذه الطريقة عن طريقة الإنهاء العكسية 3 & Prime-O المحظورة بثلاث طرق: أولاً ، لم يتم حظر الموضع 3'- (أي أن القاعدة تحتوي على 3'-OH) ، الفلوروفور هو نفسه لجميع القواعد الأربعة وكل منها معدّل تتدفق القاعدة بشكل تسلسلي وليس في نفس الوقت.

يكمن العيب الرئيسي لهذه الأساليب في ضعف طول القراءة ، والذي يمكن أن يكون ناتجًا عن إحدى ظاهرتين. من أجل منع دمج اثنين من النيوكليوتيدات في خطوة واحدة ، يتم وضع كتلة ، ولكن في حالة عدم وجود إضافة كتلة بسبب التوليف السيئ ، يمكن أن تصبح الخيوط خارج الطور مما يؤدي إلى حدوث ضوضاء تحد من طول القراءة. يمكن أيضًا حدوث ضوضاء إذا لم ينجح توصيل الفلوروفور أو إزالته. تنتشر هذه المشكلات في طرق التسلسل الأخرى وهي العوامل الرئيسية المحددة لطول القراءة.

ابتكرت شركة Illumina هذه التقنية ، مع منصات HiSeq و MiSeq. HiSeq هي أرخص أجهزة التسلسل من الجيل الثاني بتكلفة 0.02 لكل مليون قاعدة. كما أن لديها مخرجات بيانات عالية تبلغ 600 جيجا بايت لكل تشغيل والتي تستغرق حوالي 8 أيام لإكمالها.

تسلسل الجيل الثالث

تم تطوير مجموعة جديدة من التقنيات منذ ذلك الحين باستخدام تسلسل جزيء واحد وتسلسل في الوقت الفعلي الفردي ، مما يلغي الحاجة إلى تضخيم نسيلي. هذا يقلل من الأخطاء التي تسببها PCR ، ويبسط إعداد المكتبة ، والأهم من ذلك ، يعطي طول قراءة أعلى بكثير باستخدام منصات إنتاجية أعلى. تشمل الأمثلة منصة Pacific Biosciences التي تستخدم تسلسل SMRT (الوقت الحقيقي لجزيء واحد) لإعطاء أطوال قراءة تبلغ حوالي ألف قاعدة و Helicos Biosciences التي تستخدم تسلسل جزيء واحد وبالتالي لا تتطلب التضخيم قبل التسلسل. تقوم Oxford Nanopore Technologies حاليًا بتطوير مسام نانوية قائمة على السيليكون والتي تخضع لتيار يتغير مع مرور الحمض النووي عبر المسام. من المتوقع أن يكون هذا أسلوبًا سريعًا عالي الإنتاجية لتسلسل الحمض النووي ، على الرغم من أنه يجب أولاً معالجة مشاكل مثل إبطاء النقل عبر المسام.

تسلسل التعديلات اللاجينية

تمامًا كما أتاح تسلسل الجيل التالي التسلسل الجيني على نطاق واسع ، فقد أصبح من الواضح مؤخرًا أن الشفرة الجينية لا تحتوي على جميع المعلومات التي تحتاجها الكائنات الحية. كما أن التعديلات الجينية لقواعد الحمض النووي ، ولا سيما 5-ميثيل سيتوزين ، تنقل أيضًا معلومات مهمة.

تعتمد جميع منصات التسلسل من الجيل الثاني ، مثل تسلسل Sanger ، على PCR وبالتالي لا يمكنها تسلسل قواعد الحمض النووي المعدلة. في الواقع ، يتم التعامل مع كل من 5-methylcytosine و 5-hydroxymethylcytosine بواسطة الإنزيمات المشاركة في PCR ، وبالتالي ، يتم فقدان المعلومات اللاجينية أثناء التسلسل.

تسلسل بيسلفيت

يستغل تسلسل بيسلفيت الاختلاف في تفاعل السيتوزين و 5-ميثيل سيتوزين فيما يتعلق بيسلفيت: يتم نزع أمين السيتوزين بواسطة بيسلفيت لتشكيل اليوراسيل (الذي يقرأ على أنه T عند التسلسل) ، في حين أن 5-ميثيل سيتوزين غير متفاعل (أي يقرأ كـ C). إذا تم إجراء تشغيلين متسلسلين بالتوازي ، أحدهما بمعالجة بيسلفيت والآخر بدون ، فإن الاختلافات بين مخرجات العمليتين تشير إلى السيتوزينات الميثيلية في التسلسل الأصلي. يمكن أيضًا استخدام هذه التقنية مع dsDNA ، لأنه بعد العلاج باستخدام ثنائي كبريتيت ، لم تعد الخيوط مكملة ويمكن معالجتها على أنها ssDNA.

يتفاعل 5-Hydroxymethylcytosine ، وهو تعديل جيني مهم آخر ، مع بيسلفيت لتكوين السيتوزين -5-ميثيل سلفونات (والذي يُقرأ كـ C عند التسلسل). هذا يعقد الأمور إلى حد ما ، ويعني أن تسلسل بيسلفيت لا يمكن استخدامه كمؤشر حقيقي للمثيلة في حد ذاته.

تسلسل ثاني كبريتيت التأكسد

يضيف تسلسل بيسلفيت المؤكسد خطوة أكسدة كيميائية ، والتي تحول 5-هيدروكسي ميثيل سيتوزين إلى 5-فورميل سيتوزين باستخدام بيروثينات البوتاسيوم ، KRuO4 ، قبل معالجة بيسلفيت. 5-Formylcytosine هو تشوه و نزع الأمين لتشكيل اليوراسيل عن طريق العلاج بيسلفيت. الآن ، من الضروري إجراء ثلاثة عمليات تسلسل منفصلة للتمييز بين السيتوزين و 5-ميثيل سيتوزين و 5-هيدروكسي ميثيل سيتوزين (انظر الشكل 9).

الشكل 9 | تسلسل التعديلات اللاجينية باستخدام بيسلفيت

تطبيقات الجيل القادم من التسلسل

أتاح تسلسل الجيل التالي للباحثين جمع كميات هائلة من بيانات التسلسل الجيني. تحتوي هذه التقنية على عدد كبير من التطبيقات ، مثل: تشخيص وفهم الأمراض المعقدة ، تحليل تسلسل الجينوم الكامل للتعديلات اللاجينية ، تسلسل نسخة الميتوكوندريا - فهم كيفية تأثير التعبير المتغير للمتغيرات الجينية على الكائن الحي وتسلسل الإكسوم - يُعتقد أن الطفرات في الإكسوم تحتوي على ما يصل إلى 90٪ من الطفرات في الجينوم البشري ، مما يؤدي إلى المرض. تم استخدام تقنيات الحمض النووي لتحديد وعزل الجينات المسؤولة عن أمراض معينة ، وتوفير النسخة الصحيحة من الجين المعيب المعروف باسم "العلاج الجيني".

مجال التركيز الكبير في العلاج الجيني هو علاج السرطان - تتمثل إحدى الطرق المحتملة في إدخال الحمض النووي الريبي المضاد (الذي يمنع على وجه التحديد تخليق البروتين المستهدف) إلى الجين الورمي ، والذي يتم تشغيله لتشكيل الخلايا السرطانية. طريقة أخرى تسمى "العلاج الجيني الانتحاري" الذي يقدم الجينات لقتل الخلايا السرطانية بشكل انتقائي. العديد من الرموز الجينية للبروتينات والإنزيمات السامة معروفة ، وإدخال هذه الجينات في الخلايا السرطانية من شأنه أن يؤدي إلى موت الخلايا. تكمن الصعوبة في هذه الطريقة في ضمان نظام توصيل دقيق للغاية لمنع قتل الخلايا السليمة.
أصبحت هذه الطرق ممكنة من خلال التسلسل لتحليل جينومات الورم ، مما يسمح للخبراء الطبيين بتخصيص العلاج الكيميائي وعلاجات السرطان الأخرى بشكل أكثر فعالية للتركيب الجيني الفريد لمرضاهم ، مما أحدث ثورة في مراحل التشخيص للطب الشخصي.

مع انخفاض تكلفة تسلسل الحمض النووي ، ستصبح أكثر انتشارًا ، مما يؤدي إلى عدد من المشكلات. ينتج عن التسلسل كميات هائلة من البيانات ، وهناك العديد من التحديات الحسابية المرتبطة بمعالجة البيانات وتخزينها. هناك أيضًا قضايا أخلاقية ، مثل ملكية الحمض النووي للفرد عند تسلسل الحمض النووي. يجب تخزين بيانات تسلسل الحمض النووي بشكل آمن ، نظرًا لوجود مخاوف من أن مجموعات التأمين ووسطاء الرهن العقاري وأرباب العمل قد يستخدمون هذه البيانات لتعديل عروض أسعار التأمين أو التمييز بين المرشحين. قد يساعد التسلسل أيضًا في معرفة ما إذا كان الفرد معرضًا لخطر متزايد للإصابة بمرض معين ، ولكن ما إذا كان المريض قد تم إبلاغه أو إذا كان هناك علاج للمرض ، فهذه مشكلة أخرى تمامًا.

مراجع

أحمديان ، أ. سفان ، هـ بشكل كبير بالتوازي. تسلسل الأنظمة الأساسية باستخدام Lab on a Chip Technologies. مختبر تشيب ، 11 ، 2653-2655 (2011).

Balasubramanian، S. فك الجينوم بسرعة عالية: الآثار المترتبة على العلم والطب. انجيو. كيم إنت. إد. 50 ، 12406-12410 (2011).

Balasubramanian، S. تسلسل الأحماض النووية: من الكيمياء إلى الطب. تشيم. كومون. 47 ، 7281 - 7286 (2011).

Chen، F. Dong، M. Ge، M. Zhu، L.Ren، L. Liu، G. Mu، R. تاريخ وتطورات الإنهاءات العكسية المستخدمة في الأجيال الجديدة من تكنولوجيا التسلسل. الجنرال برو. السيرة الذاتية. 11 ، 34-40 (2013).

مارديس ، إي. أساليب تسلسل الحمض النووي من الجيل التالي. Annu. القس الجينوميات همهمة. جينيه. 9 ، 387-402 (2008).

Mardis، E. منصات تسلسل الحمض النووي من الجيل التالي. Annu. القس الشرج. تشيم. 6 ، 287-303 (2013).

Shendure ، J. Ji ، H. تسلسل الحمض النووي من الجيل التالي. نات. التكنولوجيا الحيوية. 26 ، 10 1135-1144 (2008).

أنظر أيضا

يحتوي كتاب الأحماض النووية المجاني على الإنترنت على معلومات حول جميع جوانب كيمياء الأحماض النووية وعلم الأحياء.

كتبنا الكتاب. اقرأ كتاب الأحماض النووية ، وهو دليل حصري عبر الإنترنت لكيمياء وبيولوجيا الأحماض النووية.

أخبرنا عن مشكلتك ، وسنستخدم كل ما لدينا من معلومات عن كيمياء الأحماض النووية لمساعدتك على حلها.


نتائج

تحليل تكلفة / فائدة معلمة التسلسل

لضمان إجراء مقارنات لاحقة لبروتوكولات إعداد المكتبة باستخدام معلمات تسلسل فعالة من حيث التكلفة ، أجرينا تقييمًا أوليًا لنتائج التجميع بالنظر إلى جهد التسلسل المطابق للتكلفة على أدوات التسلسل المختلفة. قمنا بحساب تكلفة التسلسل لكل جيجاباز باستخدام خلايا تدفق Rapid Run على أجهزة Illumina HiSeq2500 و HiSeq4000 عند أطوال قراءة ثنائية النهاية (PE) تبلغ 150 نقطة أساس و 250 نقطة أساس. بشكل عام ، كان التسلسل أكثر فعالية من حيث التكلفة باستخدام أداة HiSeq4000 بحجم إدراج 150 نقطة أساس (ملف إضافي 1: الجدول S1).

ومع ذلك ، قد يستمر عمل عمق تسلسل معين بشكل مختلف للتجميع اعتمادًا على حجم الإدخال وطول القراءة والأداة المستخدمة. وبالتالي ، قمنا بمقارنة أداء التجميع بأحجام إدراج مختلفة بالنظر إلى جهود التسلسل المتطابقة من حيث التكلفة لأجهزة التسلسل HiSeq2500 و HiSeq4000 ، باستخدام ثمانية ميتاجينوم برازية بشرية تم تحضيرها باستخدام مجموعة TruSeqNano (ملف إضافي 1: الجدول S2). بالنظر إلى التقديرات الموجودة في الملف الإضافي 1: الجدول S1 ، تبلغ تكلفة قراءة مليون قراءة لـ HiSeq2500 PE250 تقريبًا نفس تكلفة 2.4 مليون قراءة لـ HiSeq4000 PE150. لذلك قمنا بتجميع عينات هذه المكتبات إلى الحد الأقصى لعدد القراءات المتاحة عبر مجموعات المعلمات ، مطابقة التكلفة لأنواع أجهزة التسلسل المختلفة (4.5 مليون و 10.9 مليون قراءة لـ HiSeq2500 و HiSeq4000 ، على التوالي).

بشكل عام ، أسفرت أحجام الإدخال الأقصر عن تجميعات فائقة في أداة HiSeq4000 ، بينما كان أداء أحجام الإدخال الأطول أفضل في HiSeq2500 ، بما يتوافق مع توصيات نطاق حجم الإدخال الأضيق من Illumina. استحوذت السقالات التي يبلغ حجمها 3 كيلو بايت أو أكثر على متوسط ​​يبلغ حوالي 110 ميغا قاعدة إجمالية لكل من مكتبات HiSeq4000 PE150 باستخدام إدراجات 400-bp ومكتبات HiSeq2500 PE250 باستخدام إدراجات 1000-bp (ملف إضافي 1: الشكل S1). كان تجميع السقالات الطويلة جدًا (≥ 50 كيلو بايت) أقل نجاحًا هامشيًا لمكتبات HiSeq2500 PE250 بأحجام الإدراج هذه ، بطول إجمالي أعلى من حجم السقالة هذا عند حوالي 92 ٪ مقارنة بمكتبات HiSeq4000 PE150 في العينات المتطابقة (الشكل 1).

رسم توضيحي لسير عمل قياس الأداء باستخدام النموذج 1 باعتباره "أساسي". يتم تمثيل منتجات البيانات بواسطة علامات الحذف البيضاء وطرق المعالجة بواسطة مستطيلات مستديرة الرمادية. يتكون سير العمل من جزأين. في الجزء الأول (إنشاء مرجع TSLR) ، يتم إنشاء بيانات TSLR وتجميعها للعينة الأولية 1. تُستخدم معلومات التغطية من عينات إضافية لإيداع contigs TSLR في صناديق الجينوم المرجعية. في الجزء الثاني (تقييم التجميع) ، يتم ترتيب العينة الأولية 1 باستخدام طرق تسلسل قراءة قصيرة متنوعة. ثم تتم مقارنة التجميعات من هذه الطرق البديلة بالمرجع الداخلي لقياس الأداء

أخيرًا ، لقد حققنا باستمرار أفضل تواصُل للتجميع باستخدام تسلسل HiSeq4000 PE150 بأحجام إدراج تتمحور حول 400 نقطة أساس ، وقد تم استخدام هذه المعلمات لبقية التحليلات.

إنشاء صناديق الجينوم المرجعية الداخلية

استخدمنا تقنية تسلسل القراءة الطويلة TruSeq لتوليد قراءات اصطناعية بعيدة المدى من ثماني عينات ميكروبيوم برازية بشرية ، وتجميعها بشكل أكبر في كونتيجس أطول لكل عينة (انظر قسم "الطرق"). حددنا حاويات الجينوم المرجعية من مجموعات جينوم TSLR باستخدام معلومات التغطية التفاضلية عبر العينات باستخدام خوارزمية CONCOCT binning [2] كما هو مطبق في خط أنابيب Anvi'o metagenomics [33] ، يتم تنقيح تعيينات السلة يدويًا باستخدام Anvi'o لتنقية السلة التفاعلية أداة (الشكل 1) (لاحظ أن CONCOCT ثبت لاحقًا أنها أقل أداءً من أدوات binning الأخرى المتاحة [20]). ثم تم تسجيل هذه الصناديق المكررة باستخدام مقياس يتضمن كلا من تقديرات اكتمال الجينوم والنقاء ومتوسط ​​عمق التغطية في العينة الأصلية (انظر قسم "الطرق"). لكل من العينات الثمانية ، استخرجنا خمس صناديق ذات أعلى الدرجات لاستخدامها كجينومات مرجعية داخلية والتي عملت أيضًا على قياس استراتيجيات تسلسل القراءة القصيرة المختلفة. يتم تلخيص المعلومات الناتجة عن المراجع الداخلية في ملف إضافي 1: الجدول S2.

تقييم جودة التجميع باستخدام صناديق الجينوم المرجعية

استخدمنا صناديق الجينوم التي تم إنشاؤها أعلاه كمراجع داخلية لتقييم طرق إعداد المكتبة البديلة فيما يتعلق بتسلسل لوحة الصدارة لميتاجينوم البراز البشري. بالنسبة لجميع العينات الثمانية التي أنشأنا لها مراجع TSLR ، أنشأنا مكتبات باستخدام مجموعات إعداد TruSeqNano و NexteraXT وقمنا بالتسلسل باستخدام جهاز التسلسل HiSeq4000 وتسلسل PE150 بأحجام إدراج 400 نقطة أساس. بالنسبة لأربعة من هذه العينات ، أنشأنا أيضًا مكتبات باستخدام مجموعة إعداد KAPA HyperPlus. تم تجميع مجموعة عشوائية مكونة من عشرة ملايين زوج قراءة من كل من هذه المكتبات (الحد الأقصى المتاح عبر المكتبات) باستخدام metaSPAdes [30] ومقارنتها بسلالات الجينوم المرجعية باستخدام metaQuast [32].

بشكل عام ، كان أداء المكتبات المُعدَّة باستخدام تقنية TruSeqNano هو الأفضل فيما يتعلق بجزء الجينوم المُجمَّع ، حيث استعادت ما يقرب من 100٪ من الصناديق المرجعية الخمسة من كل عينة من العينات الثمانية في التجميعات (الشكل 2). بالنسبة لمكتبات NexteraXT ، تم استرداد 26 من إجمالي 40 جينومًا مرجعيًا عند اكتمال 80٪ (تم استرداد حاوية واحدة على الأقل بنسبة اكتمال تزيد عن 95٪ في 7 عينات من أصل 8).كان أداء مكتبات KAPA HyperPlus بشكل عام أفضل من NexteraXT ، مع أجزاء تجميع مشابهة لمكتبات TruSeqNano لـ 11 من أصل 20 مرجعًا في 4 عينات كانت البيانات متاحة (الفرق & lt 1٪). فيما يتعلق بجزء الجينوم المُجمع لكل مرجع (الطول المُجمع في contigs 500 نقطة أساس) ، كانت تجميعات TruSeqNano أفضل بشكل صارم تقريبًا من تجميعات HyperPlus ، والتي كانت بدورها أفضل بشكل صارم من تجميعات NexteraXT.

أح تم استرداد جزء الجينوم من الصناديق المرجعية الداخلية في تجميعات الاختبار. تصور كل لوحة أداء أعلى خمس صناديق مرجعية من عينة منفصلة. يتم ترتيب الصناديق المرجعية من أعلى إلى أدنى متوسط ​​لكسر الجينوم المسترد عبر طرق إعداد المكتبة التي تم اختبارها لتلك العينة (x- فئات المحور غير قابلة للمقارنة بين اللوحات)

كانت إحصائيات خطأ النوكليوتيدات (عدم التطابق بين التجميع والتسلسل المرجعي لـ TSLR) متشابهة بين طرق إعداد المكتبة المختلفة. قد يعكس هذا أخطاء في مراجع TSLR الأساسية ، أو اختلافات منهجية في التغطية بين صناديق الجينوم المرجعية ذات الصلة ، مع وجود جينومات منخفضة الوفرة لها نسب أكبر من تعيين مجموعة القراءة القصيرة إلى مناطق التغطية المنخفضة لمرجع TSLR مع سعة محدودة للداخلية. تصحيح الخطأ (ملف إضافي 1: الشكل S2). على الرغم من أن TSLRs تتميز بمعدل خطأ أقل (أقل من 0.1٪ في المتوسط) من قراءة Illumina القياسية [24] ، إلا أنها ليست دقيقة مثل contigs المُجمَّع الذي غالبًا ما يكون له معدل خطأ صغير جدًا 0.001٪. ملف إضافي 1: يوضح الشكل S2 أن معدلات عدم التطابق لمعظم المراجع كانت متوافقة مع معدلات عدم التطابق المقدرة في TSLRs 35/40 و 27/40 و 17/20 كانت معدلات عدم التطابق أقل من 0.1٪ (1 عدم تطابق لكل 1000 bp) لتجميعات TruSeqNano و NexteraXT و HyperPlus ، على التوالي. بشكل عام ، كانت المراجع ذات الكسور الجينومية المجمعة ذات معدلات عدم تطابق أقل. في المقابل ، كانت معدلات indel مختلفة بشكل أكثر منهجية بين طرق إعداد المكتبات ، حيث تتمتع مكتبات NexteraXT بمعدل indel المقدر أعلى بكثير من مكتبات TruSeqNano أو HyperPlus (ملف إضافي 1: الشكل S3).

كانت الاختلافات المنهجية بين طرق إعداد المكتبة واضحة تمامًا أيضًا في إحصائيات طول التجميع ، حيث تحتوي مكتبات TruSeqNano دائمًا تقريبًا على أطول كونتيج شامل (ملف إضافي 1: الشكل S4) وأكبر جزء من التجميع في contigs أكبر من 10 كيلو بايت (ملف إضافي) 1: الشكل S5). نادراً ما أسفرت مكتبات NexteraXT عن أي contigs أكبر من 50 كيلو بايت في الطول وعادة ما يكون بها أجزاء منخفضة جدًا من الجينوم المرجعي مجمعة في ≥ 10 كيلو بايت في contigs. تم إجراء مكتبات HyperPlus بينهما على كلا المقياسين.

نظرًا لأننا بحثنا فقط في تقنية واحدة طويلة القراءة كمرجع ، لا يمكننا استبعاد احتمال أن الاختلافات في الأداء ترجع جزئيًا إلى أوجه التشابه بين كيمياء TSLR والكيمياء قصيرة القراءة ، بدلاً من الاختلافات في أداء التجميع الكلي. ومع ذلك ، فإن الاختلافات التي لاحظناها في إحصائيات التجميع المرجعية الاختلافات التي لاحظناها في الإحصاءات غير المستندة إلى المرجع - على سبيل المثال ، لم تكن التجميعات أكثر تقارباً فقط بالمقارنة مع المراجع التركيبية ، ولكن أيضًا باستخدام مقاييس de novo للعينات غير ذات الصلة (انظر أدناه) - مما يشير إلى أن أوجه التشابه بين كيمياء المكتبة طويلة القراءة وقصيرة القراءة ليست هي التفسير الوحيد.

إعداد مكتبة مصغرة فائقة الإنتاجية للوحة المتصدرين metagenomics

بينما أسفرت مكتبات TruSeqNano واسعة النطاق عن التجميعات الأكثر اكتمالاً وفقًا لمراجع TSLR التركيبية ، فإن خطوة التجزئة الأولية كثيفة العمالة والعينة تجعل من الصعب نسبيًا تنفيذها على نطاق واسع. تعتبر الطرق التي تستخدم التجزئة الأنزيمية ، بما في ذلك NexteraXT ، أكثر قابلية للقياس والتصغير [34]. بالنظر إلى أن تقييمنا أظهر أن كيمياء HyperPlus (التي تستخدم أيضًا التجزئة الإنزيمية) أدت إلى تحسين التجميعات عبر NexteraXT على نطاق واسع ، قمنا بتنفيذ إصدار مصغر وعالي الإنتاجية من بروتوكول مكتبة HyperPlus (ملف إضافي 1: الشكل S6). قارنا أدائها بكل من المكتبات الكاملة باستخدام المراجع التركيبية وتنفيذ بروتوكول NexteraXT المصغر باستخدام لوحة من العينات الحقيقية.

يستخدم بروتوكول HyperPlus المصغر معالجات تلقائية للسائل الصوتي ، مما يسمح بتخفيض أحجام الكاشف بمقدار 10 أضعاف بالإضافة إلى تقليل كبير في أطراف الماصة القابلة للاستهلاك. كما أنه يطبق كيمياء محول iTru [35] ، والذي يسمح بالاقتران مع معالج السائل الصوتي بإجراء معالجة برمجية للآبار الفردية وبالتالي تشفير شريطي اندماجي مرن باستخدام 384 مؤشرًا فريدًا لتصحيح الأخطاء 5 و 3. أدى تنفيذنا للبروتوكول إلى تكلفة قابلة للاستهلاك تبلغ حوالي 7 دولارات لكل عينة ، باستخدام أسعار كتالوج الشركات المصنعة ، عند إعداد 384 مكتبة في المرة الواحدة. ستكون التكاليف الإجمالية الكاملة ، بما في ذلك النفقات الرأسمالية والتشغيلية لمناولي السوائل ، أعلى.

باستخدام المراجع التركيبية TSLR للمقارنة ، أسفر بروتوكول HyperPlus المصغر عن تجميعات metagenome التي كانت قابلة للمقارنة مع مكتبات HyperPlus واسعة النطاق ومتفوقة على مكتبات NexteraXT كاملة النطاق. على وجه الخصوص ، لاحظنا تحسينات في تجميع الأجزاء ذات التغطية المنخفضة من الميتاجينوم. لتصور أداء التجميع كدالة لوفرة الجينوم المقدرة في العينة الأصلية ، استخدمنا contigs الفردية (بدلاً من الصناديق) من مجموعات TSLR كمراجع ، باستخدام متوسط ​​عمق القراءة من قراءة الخرائط لمكتبات TruSeqNano الأصلية كوكيل للجينوم وفرة. في اثنتين من العينات المرجعية ، أظهرت مكتبات NexteraXT انخفاضًا في اكتمال التجميع عند مستويات تغطية تقديرية أعلى من الكيميائيات الأخرى (الشكل 3). قد يكون هذا بسبب المناطق المحلية ذات التغطية المنخفضة والتجمعات المجزأة. بالمقارنة ، أسفر بروتوكول HyperPlus المصغر عن تجميعات مماثلة لـ TruSeqNano وبروتوكولات HyperPlus واسعة النطاق عبر وفرة اتصال تقديرية مختلفة.

أداء التجميع كدالة لوفرة الجينوم المقدرة. تمثل النقاط الجزء الإجمالي من CONTIG مرجع TSLR الذي تم تجميعه كدالة لمتوسط ​​عمق القراءة لهذا contig ، لكل منهجية إعداد مكتبة. عينات هح تتوافق مع العينات هح في الشكل 2

اكتشفنا بعد ذلك حساسية البروتوكول للاختلاف في أرقام دورة PCR وتركيز المحول وإدخال الحمض النووي. عند مقارنة مكتبات نفس الكتلة الحيوية المدخلة ، فإن زيادة دورة PCR من 15 إلى 19 دورة لم يغير العدد الإجمالي لتكرارات PCR (تقليم مسبق للملف الإضافي 1: الشكل S7a) ولا العدد الإجمالي للقراءات (ملف إضافي بعد التشذيب 1: الشكل S7b). ومع ذلك ، فإن كمية إدخال الحمض النووي (الكتلة الإجمالية) كانت مرتبطة سلبًا بأعداد تكرار PCR ، خاصةً عندما تحتوي العينات على أقل من 100 بيكوغرام. علاوة على ذلك ، ارتبط إجمالي عدد مرات القراءة بشكل إيجابي بكمية إدخال الحمض النووي (ملف إضافي 1: الشكل S7). بناءً على هذه النتائج ، اخترنا كمية قياسية من الحمض النووي للإدخال تبلغ 5 نانوغرام و 15 دورة تفاعل البوليميراز المتسلسل. في نفس التجربة ، تم أيضًا اختبار تراكيز محول 2 (360 nl 15 ميكرومتر مقابل 36 nl 15 ميكرومتر). عندما تمت إضافة محول أقل (36 nl 15 μM) ، كانت تكرارات PCR أقل بشكل ملحوظ عبر جميع كميات إدخال الحمض النووي الأربعة (ملف إضافي 1: الشكل S8a ، Mann-Whitney). تم ربط بداية كتلة DNA بشكل عام بشكل سلبي بتكرارات PCR ، مع إدخال 1 نانوغرام (36 نانومتر عند 15 ميكرومتر) بمتوسط ​​1.87 ٪ بينما 1 نانوغرام (360 نانليتر عند 15 ميكرومتر) كان متوسطه 15.1 ٪. علاوة على ذلك ، كان إجمالي عدد مرات القراءة أعلى للعينات التي تمت معالجتها بكميات محول أقل (ملف إضافي 1: الشكل S8b). بالنسبة لمقياس الإنتاج النهائي ، نخفف البادئات إلى 1.5 ميكرومتر ونضيف 360 nl. في التجربة الثانية ، قمنا بالتحقق من صحة بروتوكولنا النهائي من خلال تسلسل 2 من عناصر التحكم الميكروبية عبر 7 أوامر من حجم كمية المدخلات ، والتي تتراوح من 140000 إلى 0.14 معادلات الجينوم المقدرة. أنتج سير العمل المصغر لدينا مكتبات ذات تلوث ضئيل عبر 4 أوامر بحجم مادة بدء الحمض النووي (140.000-140 جينوم 500 جزء من المليون إلى 500 زهرم ملف إضافي 1: الشكل S9). كان الحد الأدنى لاكتشاف هذا الاختبار حوالي 500 زغ من الحمض النووي الميكروبي أو ما يقرب من 140 من مكافئ الجينوم.

بعد ذلك ، أجرينا مقارنة مباشرة للبروتوكولات المصغرة عالية الإنتاجية باستخدام مجموعة من العينات ، بما في ذلك 89 ميكروبيومًا برازيًا من مشروع الأمعاء الأمريكية [36] ، و 84 عينة من سلسلة زمنية من الميكروبات البشرية من مواقع مختلفة من الجسم [8] ، و 184 عزلة بكتيرية. بالإضافة إلى بروتوكول HyperPlus المصغر ، قمنا بإعداد مكتبات لجميع العينات باستخدام تطبيق مصغر لـ NexteraXT [37]. قمنا بمقارنة أداء التجميع في الأعماق الضحلة الأكثر شيوعًا لإعادة تسلسل العزل (384 عينة ، بما في ذلك عناصر التحكم بدون قالب ، لكل حارة HiSeq4000 حوالي 0.3 جيجابت في الثانية لكل عينة) وللميتاجينوم ، على أعماق أكثر اعتدالًا (96 عينة لكل حارة حوالي 1.2 جيجابت في الثانية لكل ممر). عينة).

تفوقت مكتبات HyperPlus المصغرة بشكل عام على مكتبات NexteraXT المصغرة ، خاصة في أعماق التسلسل الأكثر صعوبة. أظهرت معظم العزلات إحصائيات تجميع مماثلة لكل مكتبة ، مما يشير إلى أن هذه التجميعات كانت على الأرجح محدودة ببنية الجينوم وطول القراءة بدلاً من جودة المكتبة ، على الرغم من أن جزءًا كبيرًا من هذه العينات بدا أنه فشل تمامًا باستخدام كيمياء NexteraXT (الشكل 4). بالنسبة إلى metagenomes ، كانت التجميعات من مكتبات HyperPlus المصغرة أكبر بشكل ثابت تقريبًا وأكثر تماسًا. كانت هذه الاختلافات أقل وضوحًا بالنسبة للمقاييس مثل الطول الإجمالي (ملف إضافي 1: الشكل S10) والأكثر وضوحًا بالنسبة للمقاييس التي تؤكد على التواصل ، مثل الطول الإجمالي المُجمَّع في contigs الذي يتجاوز 50 كيلو بايت ، حيث أسفرت مكتبات HyperPlus عادةً عن قواعد ضخمة للتجميع و NexteraXT أبدًا تقريبًا أسفرت عن أي (ملف إضافي 1: الشكل S11).

تم إعداد مقاييس التجميع للمكتبات المصغرة من ثلاث مجموعات عينات مختلفة. أ قيم N50 للعينات (النقاط) المجمعة من مكتبات HyperPlus المصغرة (المحور الأفقي) ومن مكتبات NexteraXT المصغرة (المحور الرأسي). يشار إلى نقطة المساواة بخط منقط ، ويتم تقديم القيم للتجميعات على عمق 96 عينة لكل حارة (اللوحة اليسرى) وفي 384 عينة لكل حارة (اللوحة اليمنى). ب الطول الإجمالي للتجميعات في contigs يتجاوز 5 kbp في الطول

ليدربورد ميتاجينوميكس يعزز استعادة صناديق الجينوم

أشارت مقاييس التجميع لمجموعات بيانات الاختبار الخاصة بنا إلى أنه ، باستخدام بروتوكول مكتبة HyperPlus المصغر ، يمكن استرداد المعلومات القيمة من تجميعات الميتاجينوم حتى في أعماق التسلسل أقل بكثير مما يتم إجراؤه عادةً للعينات المعقدة. نظرًا للتكلفة النموذجية لإعداد المكتبة بالنسبة إلى التسلسل ، فإن تسلسل الميتاجينوم منخفض التغطية لأعداد العينات الكبيرة غالبًا ما يكون غير فعال من حيث التكلفة. ومع ذلك ، قد يؤدي انخفاض التكاليف والإنتاجية الأعلى التي يوفرها البروتوكول المصغر إلى تغيير هذا التقييم لبعض المشاريع.

لتقييم تأثير زيادة عدد العينات حتى في أعماق أقل من التغطية لكل عينة ، قمنا بإعداد مكتبات تسلسل HyperPlus مصغرة لمجموعة من عينات البراز الأب / الأبناء بالماوس الطولي. تم فهرسة العينات بشكل فردي وتسلسلها على عمق 384 عينة لكل حارة HiSeq4000. تم بعد ذلك تجميع العينات بشكل مشترك لكل فرد (أمهات) أو القمامة (ذرية) ورميها باستخدام إما التغطية التفاضلية لكل عينة ومعلومات التكوين أو باستخدام التغطية المجمعة ومعلومات التكوين لكل فرد لتقريب الإنتاجية المنخفضة ولكن استراتيجية التسلسل عالية العمق . أدى دمج معلومات التغطية لكل نقطة زمنية إلى تحسين اكتمال الحاوية وتقليل التلوث بالنسبة إلى النقاط الزمنية المجمعة (الشكل 5). تم استرداد ما مجموعه 312 حاوية تجاوزت 70٪ من الإنجاز وأقل من 10٪ من التلوث ، منها 248 تجاوزت 90٪ / 5٪ عتبات الاكتمال / التلوث ليتم اعتبارها "مسودة عالية الجودة" جينومات مجمعة للميتاجينوم [38]. لتقييم إجمالي التنوع الجينومي غير الزائد الذي تم استرداده باستخدام كل طريقة ، قمنا بإلغاء تكرار المجموعة الإجمالية لخزانات الجينوم باستخدام خط أنابيب dRep [14]. من بين 186 حاوية جينوم عالية الجودة تم استردادها باستخدام تجميع المكونات فقط و 248 حاوية عالية الجودة تم استردادها باستخدام معلومات تغطية النقطة لكل وقت ، حصلنا على 50 حاوية جينوم فريدة. من بين هذه الجينومات التي تمت إزالتها ، تم استرداد الصندوق عالي الجودة من بروتوكول نقطة الوقت في 32 حالة (ملف إضافي 1: الشكل S12).

إحصائيات الاكتمال والتلوث للصناديق المستردة من التجميع والتراكم لميتاجينوم الفأر الضحلة المتسلسلة. تم تجميع عينات طولية لكل أم (أم) أو لكل فرشة (ذرية). تم حساب الصناديق "التركيبية فقط" باستخدام القراءات المجمعة من كل عينة طولية لكل فرد ، ومحاكاة التسلسل منخفض العمق والنيتروجين. تم حساب حاويات "التركيب والمحاذاة" باستخدام بيانات التغطية التفاضلية التي تم الحصول عليها عن طريق تعيين كل عينة طولية بشكل مستقل إلى التجميع المشترك الفردي


مناقشة

تسلط هذه الدراسة الضوء على كل من الفرص والتحديات التي تواجه الحصول على البيانات الجينومية من عينات المتاحف الثابتة بالفورمالين. على سبيل المثال ، نظهر أنه يمكن إنشاء تسلسلات DNA غنية بالمعلومات نسبيًا من مثل هذه العينات. على الرغم من ازدواج تفاعل البوليميراز المتسلسل وتلف الحمض النووي ، أدى نهجنا المحافظ إلى الحصول على بيانات تسلسل جينومي بجودة محاذاة عالية لشخص يبلغ من العمر 30 عامًا أنوليس كارولينينسيس عينة المتحف (MVZ 214979). في المقابل ، فشلت جهودنا في التسلسل مع 100 عام من العمر أنوليس كارولينينسيس عينة (MVZ 43405) ، والتي نوضحها بمزيد من التفصيل أدناه. بالنسبة لـ MVZ 214979 ، حصلنا عليها

0.5X عمق التسلسل عبر الجينوم النووي باستخدام نصف حارة واحدة على منصة تسلسل Illumina Hi-Seq. كانت البيانات النووية منخفضة التغطية غير كافية لاستدعاء SNP أو النمط الجيني أو لإعادة بناء علامات التسلسل ، خاصة بالنظر إلى معدلات الخطأ المرتفعة ، ولكن هذا يمكن معالجته بجهد تسلسلي أكبر (أي استخدام ممرات تسلسل إضافية). علاوة على ذلك ، بالاقتران مع بروتوكولات الاستخراج الخاصة بنا (ملفات S1 و S2) ، كان تسلسل Illumina قادرًا على استعادة جينوم الميتوكوندريا بالكامل بدقة MVZ 214979 بتغطية متوسطة 57X حتى مع جهد التسلسل المتواضع نسبيًا المستخدم هنا.

يؤدي تثبيت الفورمالين قبل استخلاص الحمض النووي إلى تلف كبير في الحمض النووي بالإضافة إلى انخفاض إنتاجية الحمض النووي ، ومن المحتمل أن تتطلب التسلسلات المشتقة من عينات الفورمالين الثابتة معالجة خاصة لمراعاة كلتا هاتين المشكلتين. على سبيل المثال ، تتطلب قراءاتنا الأولية تقليمًا صعبًا لإزالة التلاعب الأساسي الشامل في نهايات القراءات. بالإضافة إلى ذلك ، تم تجاهل نسبة كبيرة من قراءاتنا بسبب المستويات العالية من تكرار PCR. من المحتمل أن يكون المستوى العالي من تكرار تفاعل البوليميراز المتسلسل يرجع إلى انخفاض كمية الحمض النووي المتاحة لإعداد المكتبة ، مما أدى بعد ذلك إلى انخفاض تنوع أجزاء الحمض النووي للتسلسل. للحصول على مواد مكتبة كافية للتسلسل ، اتبعنا توصية بروتوكول Illumina لزيادة عدد دورات PCR ، مما أدى على الأرجح إلى تسلسل عميق لعدد صغير نسبيًا من الأجزاء الفريدة التي كانت موجودة في المكتبة مقارنة بما هو متوقع مع عينة الأنسجة الطازجة. لتجنب هذه المشكلة باستخدام بروتوكولات إعداد المكتبة القياسية ، نقترح استخدام كمية أكبر من مواد البدء ، وإجراء عمليات استخلاص متعددة لأنسجة متعددة بهدف تقليل عدد دورات PCR اللازمة أثناء إعداد المكتبة ، وبالتالي الحد من مستوى التكرار في المكتبات النهائية. على الرغم من الحاجة إلى معالجة مكثفة كما هو موضح أعلاه ، كانت نتائج التسلسل لـ MVZ 214979 قابلة للمقارنة مع تلك الخاصة بدراسات الحمض النووي التاريخية القديمة والمتاحفة الأخرى لنسبة القراءات المعينة ، ومعدل الخطأ ، والتلوث في المائة (جدول S2). عمق التغطية المتغير للغاية لكل من الجينوم النووي والميتوكوندريا (الشكلان 2 و 3 ، على التوالي) المرئي في بياناتنا مشابه لتلك التي تم الحصول عليها في دراسات أخرى لـ aDNA / hDNA التي استخدمت HTS غير المستهدفة [24 ، 32]. لهذا السبب ، نشك في أن هذا التفاوت الملحوظ في التغطية ناتج عن تفاعل البوليميراز المتسلسل و / أو التسلسل وليس عوامل أخرى مثل تكوين أنوليس الجينوم أو تعرض الحمض النووي للفورمالين.

منذ إجراء هذه التجربة ، تم تطوير العديد من إجراءات إعداد المكتبة الجديدة التي قد تكون أكثر ملاءمة للحمض النووي التالف أو المفرد الذي تقطعت به السبل من تلك المنفذة هنا ، وقد تزيد هذه البروتوكولات من صلاحية العينات الهامشية بخلاف ذلك مثل MVZ 43405. على سبيل المثال ، تحذف بروتوكولات [39] و [40] خطوة الإصلاح غير الحادة المستخدمة في هذه التجربة ، وبالتالي الحفاظ على سلامة تسلسل الحمض النووي في نهايات الأجزاء. قد يؤدي استخدام إحدى هذه الطرق البديلة لإعداد المكتبة واستخدام بوليميراز منخفض الدقة (من أجل تجنب تحيز تفاعل البوليميراز المتسلسل [40،41]) إلى تحسين جودة المكتبات المصنوعة من الحمض النووي المتضرر بالفورمالين. أيضًا ، يختلف نمط تلف الحمض النووي الذي لاحظناه في عيناتنا الثابتة بالفورمالين في نواحٍ مهمة عن الأنماط الموثقة في دراسات الحمض النووي القديمة والتاريخية السابقة التي تتضمن عينات غير ثابتة من الفورمالين ، مما يشير إلى أن الأساليب المحسّنة لنمذجة تلف الفورمالين للحمض النووي يمكن أن يكون كبيرًا. تحسين نجاح التسلسل. مع العينات الثابتة غير الفورمالين ، تحدث معدلات مرتفعة من الاستبدالات المختلطة من C إلى T عند الأطراف الخمسة لخيوط DNS ، في حين ترتفع انتقالات G إلى T عند الأطراف الثلاثة [28 ، 32]. في المقابل ، لاحظنا زيادة حادة في ترددات عدم التطابق لجميع الأنواع تقريبًا في كلا الطرفين ، ولا سيما في نهايات القراءات الثلاثة. من المحتمل أن تؤدي الأساليب البايزية التقريبية الجديدة لنمذجة تلف الحمض النووي القديم والتاريخي ، مثل التي تم تنفيذها في خريطة البرنامج ، إلى تقليل فقدان البيانات ، خاصة إذا يمكن استخدام التسلسل المستهدف لتحقيق تغطية كافية لمناطق الاهتمام. توفر هذه التحسينات المحتملة لبروتوكولنا إمكانية تقليل مقدار فقدان البيانات الناتج عن التشذيب الصعب ويجب مراعاتها في الدراسات المستقبلية.

كجزء من هذه الدراسة ، قمنا بمقارنة بروتوكولين أساسيين لاستخراج ثلاثة أنواع من الأنسجة لتحديد ما ، إن وجد ، مجموعة من البروتوكولات وأنواع الأنسجة ستؤدي إلى كميات كافية من الحمض النووي مزدوج الشريطة لنجاح HTS. عند اختيار اختبار الكبد والعضلات وطرف الذيل ، كان توقعنا أن ينتج عن طرف الذيل أكثر الحمض النووي مزدوج الشريطة لأن الدراسات السابقة لعينات المتحف المحفوظة بالسوائل [18 ، 23] وجدت أن أنسجة العظام من المرجح أن تحمي الحمض النووي من القوى التنكسية ، ويمكن العثور على الحمض النووي بكميات أكبر في العناصر الهيكلية. اختبرنا أيضًا أنسجة العضلات لأن استئصال العضلات أقل تدميرًا للعينة من أخذ طرف الذيل أو الأصابع أو الأسنان. من بين جميع أنواع الأنسجة التي تم النظر فيها هنا ، كان الكبد هو الوحيد الذي ينتج كمية كافية من الحمض النووي مزدوج الشريطة. هذه النتيجة مشجعة لأنه ، بالإضافة إلى كونها مصدرًا سهلًا ووفيرًا للأنسجة لأخذ عينات فرعية ، فإن أخذ الكبد هو الحد الأدنى من التدمير للعينات المحفوظة بالسوائل.

لم ينتج عن MVZ 43405 ، الذي تم جمعه في عام 1917 ، كمية كافية من الحمض النووي عالي الجودة لضمان الاستمرار في إعداد المكتبة وتسلسلها في ظل ظروف نموذجية.ومع ذلك ، حاولنا (دون جدوى) الحصول على بيانات التسلسل الجيني من هذه العينة. لماذا فشل تسلسل MVZ 43405 ليس واضحًا تمامًا. أحد الاحتمالات هو أن محاولتنا لاختبار بروتوكولات الاستخراج البديلة بشكل منهجي للعينتين كانت العامل الحاسم. كما هو مذكور أعلاه ، عادت عينات الكبد فقط إلى تركيزات قابلة للقياس من الحمض النووي المزدوج الشريطة. لكل عينة ، قمنا بتقسيم الكبد إلى عينتين فرعيتين للاستخراج ، واحدة باستخدام بروتوكول Qiagen والأخرى باستخدام بروتوكول استخراج الفينول كلوروفورم (PC) المعدل الأكثر فعالية. بالنسبة لـ MVZ 214979 (الذي تم تسلسله بنجاح) ، تم استخراج قطعة الكبد الأكبر (0.46 جم) باستخدام الكمبيوتر ، بينما تم استخراج عينة كبد أصغر بكثير (0.04 جم) باستخدام بروتوكول Qiagen. تم عكس هذه العلاقة بالنسبة لـ MVZ 43405 ، مع عينة الكبد الأكبر (0.33 جم) المستخرجة باستخدام بروتوكول Qiagen الأقل فعالية وعينة كبد أصغر بكثير (0.017 جم) مستخرجة باستخدام الفينول كلوروفورم. والجدير بالذكر أن استخراج جهاز الكمبيوتر لعينة الكبد الأصغر بكثير المأخوذة من MVZ 43405 أسفر عن كمية أكبر من الحمض النووي مزدوج الشريطة مقارنةً باستخراج Qiagen لعينة

20 مرة أكبر (جدول S1). لو علمنا في البداية أن استخراج الكمبيوتر الشخصي سيكون أكثر فعالية وقمنا بتطبيق بروتوكول الاستخراج هذا على عينة الكبد الأكبر من العينة القديمة ، فربما نجح جهدنا في التسلسل. التفسير المحتمل الآخر لفشل التسلسل هو حالة الفورمالين المستخدم لإصلاح العينات في البداية. من المعروف أن عينات الزواحف MVZ من أوائل القرن العشرين تم إصلاحها في الفورمالين غير المخفف (David B. Wake، pers. comm.). تغير هذا في حوالي عام 1970 ، عندما أصبح التخزين المؤقت للفورمالين ممارسة معتادة للحفاظ على الأنسجة بشكل أفضل للدراسات النسيجية. نظرًا لأننا لا نعرف ما إذا كانت عيّنات MVZ قد تم إصلاحها باستخدام الفورمالين المخزن أو غير المخزن ، لا يمكننا تقييم أهمية هذا المتغير بدقة هنا. ومع ذلك ، يمكننا أن نلاحظ أن البيانات التي تم الحصول عليها في محاولتنا الفاشلة عمومًا لتسلسل MVZ 43405 تتوافق مع توقعات تلف الحمض النووي الناتج عن التعرض للفورمالين غير المحشو. أظهرت بيانات التسلسل التي حصلنا عليها توزيعًا غير متساوٍ للغاية للترددات غير المتطابقة التي يمكن أن تكون نتيجة لمعدلات عالية من سوء التضمين الأساسي عبر طول جميع القراءات. زوجان وآخرون. (2013) [43] مقارنة منتظمة بين إنتاجية الحمض النووي للأنسجة المثبتة إما في الفورمالين المخزن أو غير المخزن لفترات زمنية معروفة ، ووجد أن إنتاج الحمض النووي من الأنسجة المثبتة في الفورمالين غير المخزن كان أقل بكثير من تلك المثبتة في الفورمالين المخزن بعد عامين ، يعزى إلى تسارع انحطاط الحمض النووي بسبب ارتفاع كمية الفورمالين لكل وحدة من المثبت وانخفاض الرقم الهيدروجيني للفورمالين غير المخفف [43]. في حين أن حجم العينة الصغير لدراستنا يمنعنا من اختبار تأثير الفورمالين المخزن مقابل الفورمالين غير المخزن ، بالإضافة إلى العديد من المتغيرات المحتملة الأخرى (مثل درجة الحرارة ، والتعرض لأشعة الشمس ، وظروف التخزين على المدى الطويل) ، على hDNA من عينات المتحف ، هذه هي اعتبارات مهمة وتستحق المزيد من التحقيق. يجب أن تسعى الدراسات المستقبلية إلى إنشاء استدلالات على محتوى الحمض النووي الداخلي للكبد المثبت بالفورمالين وفقًا لعمر العينة وظروف حفظها.

بالنسبة للتطبيقات الجينية السكانية ، التي تتطلب استدعاءًا دقيقًا للنمط الجيني / SNP ، قد يكون من الممكن استخدام طريقتين باستخدام قراءات متسلسلة قصيرة مشتقة من عينات ثابتة من الفورمالين. الأول ، نهج بندقية الجينوم الكامل كما هو مستخدم في هذه الدراسة ، يمكن أن يكون كافياً لتحقيق محاذاة جيدة مع وجود جينوم مرجعي موجود مسبقًا (جدول S2) ، على الرغم من أن التطبيق الناجح لبيانات الجينوم النووي يتطلب جهدًا أكبر في التسلسل لكل عينة. مما تحقق هنا. بسبب نقص الموارد الجينية ، يمكن استخدام مجموعات جينوم de novo من العينات الحديثة للأنواع وثيقة الصلة بالمحاذاة نظرًا لعمق التسلسل الكافي. لسوء الحظ ، في الحالات التي تكون فيها العينات الثابتة بالفورمالين هي المادة الجينية الوحيدة المتاحة لمشروع ما ، فإن توليد مجموعة دي نوفو سليمة يبدو غير محتمل بدون بذل قدر باهظ من جهد التسلسل. لا يمثل عمق التسلسل الضروري للاتصال الأساسي الدقيق تحديًا فحسب ، بل يؤدي تثبيت الفورمالين في النهاية إلى تفتيت الحمض النووي بشدة. قد لا تؤدي زيادة إنتاجية البيانات إلى تحسين جودة التجميع بشكل كافٍ بسبب نقص مكتبات الجينوم طويلة الإدخال المتاحة لسقالات الجينوم. بالنسبة للدراسات الجينية السكانية التي تُستخدم فيها نُهج التمثيل المنخفض ، قد يتم التحايل على العقبات التي تعترض الاتصال الأساسي الدقيق التي يقدمها خطأ التضمين الأساسي الناجم عن الفورمالين من خلال الاستيلاء المستهدف على مناطق جينومية معينة. إذا كانت الموارد الجينومية متاحة لتطوير الواسمات ، فإننا نشك في أن exon-capture [12] أو طرق مماثلة ستكون قادرة على تحقيق عمق التغطية اللازم لهذه التطبيقات.

على الرغم من أننا كنا قادرين على إعادة بناء الجينوم الكامل للميتوكوندريا من خلال إعادة رسم الخرائط إلى الجينوم المرجعي ، فإن نتائج هذه الدراسة التجريبية توضح صعوبة إنشاء مجموعات عالية الجودة من الجينوم النووي. كان هذا بسبب الطبيعة المجزأة بطبيعتها للحمض النووي ، والتنوع المنخفض لبيانات التسلسل الأولي. مع الاعتراف بأن تسلسل الجينوم الكامل ليس ضروريًا لدراسات علم الوراثة ، تشير نتائجنا إلى أن مناهج التخصيب المستهدفة مثل التقاط exon - الناجحة في دراسات hDNA المتحفية الأخرى للعينات المحفوظة غير السوائل [12] - يمكن أن تكون فعالة لاستهداف مناطق الجينوم النووي من أجل عينات المتحف الثابتة الفورمالين. تم اعتبار محاولة التخصيب المستهدف خارج نطاق هذه الدراسة الاستكشافية ، ولكن من الواضح أنها ستكون وسيلة ممتازة للعمل في المستقبل. في هذا السياق ، يتطلب التقاط exon مرجعًا جينيًا لتصميم تحقيقات للمناطق المستهدفة ، وسيتعين على الدراسات التي تفتقر إلى الموارد الجينية الحديثة أن تتعامل مع الصعوبة التي يمثلها التجميع الجديد لـ hDNA الثابت بالفورمالين ، كما تم تناوله أعلاه. في هذه الحالات ، قد يكون تسلسل de novo للنسخة والجينوم الكامل للعينات الحديثة من نفس الأنواع أو الأنواع ذات الصلة الوثيقة بديلاً فعالاً. ومع ذلك ، فإن طبيعة تلف الحمض النووي الناجم عن الفورمالين الذي لاحظناه ، نوصي بعدم استخدام مناهج مكتبة التمثيل المنخفض القائمة على إنزيم التقييد مثل RADSeq (على سبيل المثال ، [44،45]). قد يتسبب احتمال التدهور الشديد وتعديل القاعدة في مواقع التعرف في الحمض النووي الثابت بالفورمالين في فقد البيانات على نطاق واسع عبر العينات.

في حين أن هذه الطريقة ستوفر العديد من العينات الثابتة من الفورمالين للدراسة الجينية ، فإننا نؤكد أن هناك اختلافين رئيسيين بين بروتوكول الاستخراج والتسلسل هذا وتلك المستخدمة لتوليد البيانات من العينات الحديثة. الأول هو أن كمية المواد الأولية اللازمة لاستخراج كميات كافية من الحمض النووي مزدوج الشريطة لإعداد المكتبة من المرجح أن تكون أكبر بكثير في المتوسط ​​للعينات الثابتة بالفورمالين. ومع ذلك ، من غير المحتمل أن تكون نسبة مادة البداية إلى إنتاج الحمض النووي متسقة بين العينات بسبب متغيرات مثل عمر العينة والتركيز ونوع الفورمالين المستخدم في التحضير ومدة التعرض للفورمالين. في المقابل ، ستكون هذه الطريقة هي الأنسب للعينات التي لا يتوفر لها أنسجة جديدة ، مثل العينات من النوع الأقدم أو تلك التي تمثل الأنواع التي تم استئصالها في البرية أو غير المتاحة لإعادة أخذ العينات. نحن نشجع الباحثين ليس فقط على الحصول على عينات الأنسجة الطازجة عند تحضير العينات (المجمدة أو المحفوظة في وسط مناسب ، مثل RNALater أو 95٪ من الإيثانول) ، ولكن أيضًا لتسجيل البروتوكول المستخدم للحفظ واستخدام الفورمالين المخزن عند تثبيت العينات. الاختلاف الرئيسي الثاني هو أن نهج التشذيب المستنير ضروري عند العمل مع البيانات الناتجة عن العينات الثابتة بالفورمالين. من غير المحتمل أن تكون مراقبة جودة HTS القياسية المستخدمة في العينات الحديثة (الأنسجة الطازجة) كافية للمواد الثابتة بالفورمالين.

بينما لا تزال هناك عقبات فيما يتعلق بالتطبيق الواسع النطاق لجمع بيانات HTS على عينات ثابتة من الفورمالين ، تشير دراسة إثبات المفهوم هذه إلى أن مثل هذه العينات يمكن أن تحتفظ ببيانات التسلسل الجيني القابلة للاستخراج والاستخدام ، وأنه يمكن استخراج هذه البيانات باستخدام قصير متاح قراءة منصات التسلسل مثل Illumina. في الواقع ، حتى بدون تطبيق نهج التمثيل المنخفض أو التسلسل المستهدف ، فقد أظهرنا أنه يمكن استخدام التسلسل المباشر للعينات الثابتة للفورمالين منخفضة الجودة لتوليد بيانات تسلسل نووي كبيرة وجينوم ميتوكوندريا كامل عالي التغطية. بالنظر إلى العدد الكبير من الأنواع التي يتم تمثيلها فقط بواسطة عينات متحف مثبتة بالفورمالين بدون أنسجة مقابلة - بما في ذلك الأنواع المعروفة من عينة واحدة أو بضع عينات ، أو المعروف أنها انقرضت - فإن القدرة على توليد بيانات ميتوكوندريا كاملة وحدها تعتبر تحويلية. لا تزال الأسئلة الرئيسية بحاجة إلى الإجابة ، بالطبع ، بما في ذلك (1) الخصائص التي تحدد جودة العينات التاريخية لجمع بيانات HTS (تشمل الاحتمالات العمر ، وما إذا كانت العينة مثبتة في الفورمالين غير المحشو ، ومدة تعرض العينة للفورمالين مسبقًا للانتقال إلى الإيثانول ، وما إلى ذلك) ، و (2) ما إذا كانت أساليب التسلسل المستهدفة ستعيد بيانات مقياس الجينوم عالية الجودة للعينات الثابتة بالفورمالين بقدر الإمكان للعينات المعدة كجلود دراسة. على الرغم من العمل الذي لا يزال يتعين القيام به للإجابة على هذه الأسئلة وتبسيط التسلسل الجيني لعينات المتاحف الثابتة بالفورمالين ، فإن التقدم المحرز هنا يشكل خطوة مهمة إلى الأمام. التسلسل عالي الإنتاجية لديه القدرة على فتح كنز دفين من المعلومات الجينية والجينومية لملايين عينات المتاحف ، وجلب جزء كبير من العديد من مجموعات المتاحف إلى عصر علم الجينوم.


شاهد الفيديو: المحولات الكهربائية (قد 2022).


تعليقات:

  1. Walton

    برافو ، أعتقد أن هذه فكرة رائعة

  2. Carlyle

    شكرا ، اقرأها في نفس واحد

  3. Teddy

    لا أستطيع المشاركة الآن في المناقشة - إنه مشغول للغاية. سأعود - سأعبر بالضرورة عن الرأي.

  4. Kile

    مبروك ، فكرة رائعة وفي الوقت المناسب

  5. Ty

    من الصعب معرفة ذلك.

  6. Jarmann

    في رأيي أنك مخطئ. يمكنني الدفاع عن موقفي.



اكتب رسالة