معلومة

تسلسل ثنائي كبريتيت خاص بأليل

تسلسل ثنائي كبريتيت خاص بأليل


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

عند تقييم حالة المثيلة في مواقع CpG المختلفة بعد التسلسل ، ما مقدار الاهتمام الذي يجب أن يعطيه المرء لعمليات الإدراج والحذف العشوائية لزوج القاعدة الفردي. لنفترض أن هناك ثنائي النوكليوتيد CA ؛ هل يمكننا أن نفترض أن المرجع المصدق أصلي في التسلسل أو ينتج عن حذف G خاصة عندما يكون الأخير مشكوكًا فيه بمجرد مقارنته بالتسلسلات الأخرى. هل هناك بالفعل تسلسل معياري محدد لمقارنته؟


أتفق مع فانس ، فنحن بحاجة إلى مزيد من التفاصيل للإجابة على سؤالك بشكل أفضل. مما يمكنني قوله ، أنت تسأل عما إذا كان تعدد أشكال النوكليوتيدات الفردي (SNP) الذي ينتج عنه إضافة قاعدة سيتوزين إلى التسلسل الخاص بك يثير القلق عند فحص توقيع المثيلة لهذا التسلسل.

أود أولاً تحديد ما إذا كان تعدد الأشكال شائعًا في السكان باستخدام NCBI. كلما كان تعدد الأشكال أكثر شيوعًا ، قل احتمال أن يكون له تأثير خطير. ومع ذلك ، هذا لا يعني أنه ليس لها أي تأثير.

سأفحص بعد ذلك مدى اختلاف مثيلة ذلك الموقع الواحد مقارنة بالعينات التي لا تحتوي على قاعدة السيتوزين الإضافية.

أخيرًا سأحدد أهمية موقع SNP. هل يقع في جزيرة CpG؟ أم أنها تقع على الشواطئ أو على الرفوف أو "البحر المفتوح"؟ (انظر عمل Sandoval et al.)

بدون معرفة كل ما سبق ، من الصعب إجراء مكالمة حول مدى أهمية / عدم أهمية SNP في تحليل المثيلة الخاص بك.


يكشف تحليل النسخ والميثيلوم النوعي لأليل الميراث المستقر و رابطة الدول المستقلة- تنظيم مثيلة الحمض النووي في ناسونيا

الانتماءات قسم البيولوجيا الجزيئية وعلم الوراثة ، جامعة كورنيل ، إيثاكا ، نيويورك ، الولايات المتحدة الأمريكية ، مركز كورنيل للمقارنة والجينوميات السكانية ، جامعة كورنيل ، إيثاكا ، نيويورك ، الولايات المتحدة الأمريكية

قسم الانتساب في علم الأحياء ، جامعة روتشستر ، روتشستر ، نيويورك ، الولايات المتحدة الأمريكية

الانتماءات قسم البيولوجيا الجزيئية وعلم الوراثة ، جامعة كورنيل ، إيثاكا ، نيويورك ، الولايات المتحدة الأمريكية ، مركز كورنيل للمقارنة والجينوميات السكانية ، جامعة كورنيل ، إيثاكا ، نيويورك ، الولايات المتحدة الأمريكية


توليد Epireads

تنسيق epiread الأصلي (الذي اقترحه فريق methpipe) ، يتضمن فقط المعلومات المتعلقة بـ CpGs. يقوم BISCUIT بتوسيع هذا التنسيق ليشمل أيضًا معلومات SNP. تشير الأعمدة في تنسيق BISCUIT epiread إلى:

  1. اسم الكروموسوم
  2. اقرأ الاسم
  3. قراءة الموقف في التسلسل المزدوج نهاية
  4. حبلا بيسلفيت (بيسلفيت واتسون (+) أو بيسلفيت كريك (-))
  5. موضع السيتوزين في أول CpG (0-based)
  6. نمط الاحتفاظ ("C" للاحتفاظ أو "T" للتحويل) لجميع CpGs المشمولة
  7. موضع SNP الأول ، إذا تم توفير ملف موقع SNP
  8. تغطية النداء الأساسي لجميع SNPs

مثال على تنسيق epiread هو:

لإنتاج ملف بتنسيق epiread ، تحتاج إلى تشغيل الأمر الفرعي epiread مع ملف BAM ، وملف FASTA للجينوم المرجعي ، واختياريًا ، ملف BED لـ SNPs.

يمكن الحصول على ملف SNP BED عن طريق تشغيل البسكويت vcf2bed -t snp my_pilefup.vcf.gz. إذا لم يتم توفير ملف SNP ، فلن يتضمن الإخراج الأعمدة الإضافية المتعلقة بـ SNPs. لاستعادة تنسيق epiread الأصلي ، قم بتشغيل cut -f 1،5،6 في ملف epiread الناتج.

لاختبار جميع أزواج SNP-CpG ، قم بتضمين علامة -P في موجه الأوامر. ملاحظة ، إذا كنت تبحث عن مثيلة خاصة بالأليل ، فستحتاج إلى التشغيل باستخدام علامة -P وتضمين ملف SNP BED. لمزيد من المساعدة بشأن الأعلام المتاحة ، قم بتشغيل biscuit epiread في المحطة.


بيانات مثيلة أليل محددة شبه مقلدة

أجرينا عمليات محاكاة لتقييم كيفية ارتباط أداء نموذجنا بالعديد من المعلمات الهامة لمجموعة البيانات الأساسية. لعكس خصائص الأداء على مجموعات البيانات الحقيقية ، استخدمنا استراتيجية تسمى البيانات "شبه المحاكاة". تم أخذ مواقع القراءات المعينة من البيانات الحقيقية ، وكذلك مواقع CpGs داخل القراءات والجينوم المرجعي الأساسي. تم تحديد حالات المثيلة داخل تلك القراءات وفقًا لملفات تعريف مثيلة خاصة بالأليل أو أحادية الأليل تم إنشاؤها عشوائيًا. باختصار ، داخل منطقة محددة على أنها AMR ، قمنا بشكل عشوائي بإنشاء ملفي مثيلة بشكل عشوائي عن طريق أخذ عينات لمستويات مثيلة CpG الفردية حيث تميل المتغيرات eta نحو 0 أو 1. ثم قمنا بتعيين كل قراءة باحتمالية متساوية لأحد الأليلين ، وحالات المثيلة تم أخذ عينات من CpGs ضمن القراءة وفقًا للاحتمالات التي قدمها ملف تعريف المثيلة المقابل لذلك الأليل. يتم توفير وصف كامل لهذا الإجراء في نص SI.

مع الميثيلوم الحالي من BS-seq ، توقعنا أن يكون التباين في التغطية على طول الكروموسومات عاملاً حاسمًا في أداء نموذجنا. بالإضافة إلى ذلك ، قد يمنع التباين في المسافة بين CpG طريقتنا من التقاط ASM في المناطق ذات كثافة CpG المنخفضة لطول قراءة ثابت. لقد درسنا مدى قدرة طريقتنا على تحديد ASM في فترة جينومية معينة من خلال معالجة ثلاثة متغيرات مستقلة:

كان متوسط ​​التغطيات <5 × ، 10 × ، 15 ×> ، المقابلة للميثيلوميات الحالية من BS-seq.

كانت أطوال القراءة <50 ، 100 ، 150> قواعد تتوافق تقريبًا مع تقنيات تسلسل القراءة القصيرة الحالية.

أخذت توزيعات كثافة CpG ثلاثة إعدادات مختلفة: جزر CpG (CGIs) المعرفة كما في المرجع. تم تعريف المروجين غير التابعين لـ CGI على أنه 1 كيلو بايت من موقع بدء النسخ (TSS) في تسلسل مرجعي للمركز الوطني لمعلومات التكنولوجيا الحيوية ولكن ليس CGI ، وخلفية جينومية تم أخذ عينات منها عشوائيًا بكثافة CpG (ملحوظة / متوقع) بين 0.2 و 0.4.

يمكن العثور على التفاصيل المتعلقة بعدد مجموعات البيانات المحاكاة لكل مجموعة معلمة في ملف نص SI.

كانت الخصوصية عالية جدًا بشكل عام (حوالي 99 ٪) لجميع مجموعات معلمات المحاكاة ، مما يعكس معيار اختيار النموذج المحافظ (Eqs. 4 و 5). في المقابل ، أظهرت الحساسية اعتمادًا أكبر على خصائص مجموعات البيانات. كانت الحساسية أعلى للمناطق ذات كثافة CpG الأعلى ، كما هو متوقع لأن نموذجنا يعتمد على العلاقات بين حالات CpG داخل القراءة. كما هو مبين في الشكل 1 ، وصلت الحساسية داخل CGIs إلى ما يزيد عن 95٪ لجميع أطوال القراءة عندما كان متوسط ​​التغطية أعلى من 10 ×. وصلت الحساسية إلى ما يقرب من 70٪ للمناطق الجينية ولكنها تطلبت تغطية 10 × وطول قراءة 100 ، مما يعوض النقص في كثافة CpG. كما هو متوقع ، أدت التغطية الأكبر وطول القراءة إلى تحسين الدقة ، كما أن تأثير طول القراءة يعادل تأثير كثافة CpG. تشير هذه النتائج إلى أن الميثيلومات ذات أطوال قراءة حوالي 100 نقطة أساس وتغطية متوسطة أعلى من 10 × تبدو كافية لنموذجنا لتحديد ASM بدقة. يتم استيفاء هذه المعايير من قبل معظم الميثيلومات الموجودة من تجارب BS-seq.

حساسية تحديد مقاومة مضادات الميكروبات على أساس البيانات شبه المحاكاة. تم استخدام تغطية 5 و 10 و 15 × وأطوال قراءة 50 و 100 و 150 نقطة أساس. تم التحكم في كثافات CpG عن طريق محاكاة داخل (أ) CGIs ، (ب) المناطق غير المروجة CGI ، و (ج) المناطق غير الجينية غير CGI.


تحدث الميثيل الخاص بالأليل في المتغيرات الجينية المرتبطة بمرض معقد

نحن نفترض أن ظاهرة مثيلة محددة الأليل (ASM) قد تكمن وراء التأثيرات المظهرية للمتغيرات المتعددة التي حددتها دراسات رابطة الجينوم على نطاق واسع (GWAS). نقوم بتقييم ASM في البشر ووثق أنماطه على مستوى الجينوم في شاشة أولية في ما يصل إلى 380678 موقعًا داخل الجينوم ، أو ما يصل إلى 5 ٪ من إجمالي CpGs الجينومي. لقد أظهرنا أنه على الرغم من وجود تباين كبير بين الأفراد ، فإن 5٪ من المواقع التي تم تقييمها تظهر دليلاً على تعدين الذهب الحرفي والصغير الحجم في ست عينات على الأقل ، فإن غالبية هذه الأحداث (81٪) تخضع للتأثير الجيني. العديد من هذه المتغيرات ASM المنظمة من قبل رابطة الدول المستقلة هي أيضًا eQTLs في خلايا الدم وحيدة النواة ووحيدات الدم المحيطي و / أو في حالة اختلال توازن عالٍ مع متغيرات مرتبطة بمرض معقد. أخيرًا ، مع التركيز على الأنماط الظاهرية للمناعة الذاتية ، نقوم بتوسيع هذه الشاشة الأولية لتأكيد ارتباط ASM المنظم من قبل رابطة الدول المستقلة مع المتغيرات المعقدة المرتبطة بالأمراض في مجموعة سكانية مستقلة باستخدام تسلسل الجيل التالي من بيسلفيت. هذه المتغيرات الأربعة متورطة في الأنماط الظاهرية المعقدة مثل التهاب القولون التقرحي ومرض تقدم الإيدز (rs10491434) ، ومرض الاضطرابات الهضمية (rs2762051) ، ومرض كرون ، واعتلال الكلية بالجلوبيولين المناعي (IgA) ومرض الأمعاء الالتهابي المبكر (rs713875) والارتفاع (rs6569648). تشير نتائجنا إلى أن ASM الخاضع للتنظيم من قبل رابطة الدول المستقلة قد يوفر رابطًا ميكانيكيًا بين التغيرات الجينية غير المشفرة والاختلاف الظاهري الذي لوحظ في هذه الأمراض وتقترح أيضًا طريقًا لدمج حالة مثيلة الحمض النووي مع نتائج GWAS.

بيان تضارب المصالح

المصالح المتنافسة: لدينا المصالح التالية. تم تمويل هذه الدراسة جزئيًا من قبل معهد ماساتشوستس ليونز لأبحاث العيون ، Inc. Research to Prevent Blindness، Inc. و New England Eye Center. لا توجد براءات اختراع أو منتجات قيد التطوير أو منتجات مسوقة للإعلان عنها. هذا لا يغير التزامنا بجميع سياسات PLOS ONE الخاصة بمشاركة البيانات والمواد ، كما هو مفصل على الإنترنت في دليل المؤلفين.

الأرقام

الشكل 1. الكشف المستند إلى المصفوفة الدقيقة عن الأليل المحدد ...

الشكل 1. الكشف على أساس ميكروأري من مثيلة محددة الأليل.

الشكل 2. أنواع مرشحات مثيلة محددة الأليل.

الشكل 2. أنواع مرشحات مثيلة محددة الأليل.

تعرض المؤامرات عددًا من فئات مختلفة من الحرفي والصغير الحجم ...

الشكل 3. تأكيد مثيلة الأليل المحدد من رابطة الدول المستقلة في ...

الشكل 3. تأكيد مثيلة محددة الأليل منظم رابطة الدول المستقلة في مجموعة سكانية مستقلة.

تعرض الخرائط الحرارية حالة مثيلة النسبة المئوية ...

الشكل 4. السياق الجيني للأليل الخاضع لرقابة رابطة الدول المستقلة ...

الشكل 4. السياق الجينومي لأحداث مثيلة محددة الأليل التي ينظمها رابطة الدول المستقلة.


تجمع NanoNOMe بين Nanopore و NOMe-seq لتعدين Epigenome الخاص بأليل

التماثيل هي مخلوقات سحرية صغيرة تنقب عن الكنوز ، لذلك قد تتساءل عما إذا كان nanoNOMe هو كائن أصغر. حسنًا ، إنها تقنية جزيئية جديدة ، لكن تطبيقاتها ليست أقل من السحر. تم تطوير عدة طرق لاستكشاف مثيلة الحمض النووي وعوامل النسخ وحالة الكروماتين في وقت واحد. يعتمد الكثير على مبدأ NOMe-seq ، الذي يستخدم GpC methyltransferase لتسمية الكروماتين المفتوح ، مما يسمح لتسلسل بيسلفيت بتحديد كل من هذه المواقع ومثيل الحمض النووي في مواقع CpG. تتمثل المزايا الرئيسية لهذه الأساليب في إخراج البيانات أحادي الجزيء ، مما يعني أن بيانات مثيلة الحمض النووي وبيانات شغل النواة تأتي من نفس حبلا الحمض النووي. كان التحدي الذي واجهته هذه الأساليب هو أن معظم تقنيات التسلسل لها قراءات قصيرة ، مما يعني أن هذه المعلومات القيمة أحادية السلسلة محدودة للغاية من حيث الحجم.

أراد مختبر Winston Timp في جامعة Johns Hopkins توسيع طول قراءة هذه الطرق التوافقية. للقيام بذلك ، استخدموا التسلسل النانوي. يعتبر Nanopore فريدًا بين تقنيات التسلسل لقراءاته الطويلة جدًا (& gt10kb) للحمض النووي غير المضخم. في العمل السابق ، أظهر مختبر الدكتور تيمب أن تسلسل الثقوب النانوية يمكنه استدعاء مثيلة الحمض النووي بدقة باستخدام برنامج هناك نانو بوليش. يعد هذا تحديًا واضحًا عند مقارنته بتسلسل bisfulfite ، لأنه في هذه الحالة يكون الحمض النووي غير مضخم ، وبالتالي يكتشف متسلسل الثقوب النانوية مباشرة نيوكليوتيد 5mC نفسه. في هذه الدراسة الجديدة ، قاموا بدمج تسلسل النانو مع مثيلة GpC في طريقة يسمونها التسلسل النانوي لشغل النواة والميثيلوم (nanoNOMe). طبقوا هذا النهج في أربعة خطوط خلايا بشرية. هذا ما وجدوه في رحلة التعدين الخاصة بهم:

  • تسمح القراءات الطويلة باستجواب العناصر المتكررة ، وهو أمر صعب مع الأساليب الأخرى
    • من بين جميع العناصر المتكررة ، تظهر فقط عناصر Alu زيادة في الميثيل ، ويتم تقليل إمكانية الوصول إلى الكروماتين في جميع العناصر المتكررة ، خاصة في منطقتي LINE و LTR
    • يمكن أيضًا استخدام هذا النهج لاستكشاف التأثيرات اللاجينية على الأليلات الطافرة مقابل الأنواع البرية

    في جوهرها ، يضيف nanoNOMe طبقة خارجية من المعلومات إلى الحمض النووي نفسه ، والتي يمكن استخدامها لتخزين المعلومات حول الإشغال النووي في الخلية وتوليد إبيجينوم بشري كامل المراحل. ثم يتم قراءة هذا على طول جزيئات مفردة طويلة باستخدام تسلسل نانوبور. يمكننا تخيل العديد من الاستخدامات لهذا النهج عبر نماذج العلوم والأمراض الأساسية. لذا ، إذا كنت تقوم بالتنقيب في epigeNome بحثًا عن كنوزك الخاصة ، ففكر في الذهاب في رحلة استكشافية nanoNOme.


    نتائج

    أنماط الذكاء الاصطناعي عبر العلامات اللاجينومية

    لاستكشاف آثار التباين الجيني على الإيبيجينوم ، مشروع خارطة طريق المعاهد الوطنية للصحة (NIH) لعلم الوراثة اللاجينية (17) أكمل الآن تسلسل الجينوم الكامل (WGS) على جينومات 13 متبرعًا ونشر إيجينومات مرجعية لخريطة طريق المعاهد الوطنية للصحة من 71 عينة مجمعة تمثل مجتمعة 27 نوعًا مختلفًا من الأنسجة وتسعة أنواع من الخلايا (الشكل S1). لتحديد دقيق للمواقع الجينية غير المتجانسة ، قمنا بتسلسل جينومات المتبرع (18). تم تضمين ثمانية فحوصات في معظم العينات واستخدمت للكشف عن الذكاء الاصطناعي: WGBS ، وتسلسل الحمض النووي الريبي (RNA-seq) ، وتسلسل الكروماتين المناعي (ChIP-seq) لست علامات هيستون مختلفة (H3K4me3 ، H3K4me1 ، H3K36me3 ، H3K27me3 ، H3K9me3 ، و H3K27ac) (الشكل S1). أجرينا تحليل مثيلة خاص بالأليل (ASM) في تعدد الأشكال أحادية النوكليوتيدات (SNP) المتغايرة الزيجوت داخل ميثيلومات WGBS 49 باستخدام عتبة فرق مثيلة مطلق بنسبة & gt30٪ بين الأليلات وعن طريق تقدير الأهمية عن طريق اختبار فيشر الدقيق للتهم من السيتوزينات الميثيلية وغير الميثيلية التي لوحظت على نفس التسلسل قراءة مع كل من أليلين SNP (الشكل S2A) (18). أجرينا تحديد AIs لعلامات هيستون والنسخ باستخدام خط أنابيب AlleleSeq (الشكل S2B) (18, 19).

    بالنظر إلى الذكاء الاصطناعي في جميع العلامات ، كانت الاختلالات في مثيلة الحمض النووي هي الأكثر وفرة إلى حد بعيد (الجدول S1 والشكل S3) ، ويرجع ذلك إلى حد كبير إلى التوزيع الجينومي لمثيلة الحمض النووي ، على عكس التوزيع الجينومي غير المتكافئ للعلامات الأخرى . من بين علامات هيستون ، كان لدى H3K27ac مكالمات عدم توازن أكثر من غيرها (الجدول S1) ، ويرجع ذلك جزئيًا إلى تغطية ChIP-seq الأعمق لـ H3K27ac (الجدول S1 والشكل S3). في المروجين ، كانت علامات H3K27ac و H3K4me3 أكثر وفرة على الأليل مع مثيلة أقل للحمض النووي (الشكل 1 أ). بالمقابل ، كانت إشارة H3K9me3 أكثر وفرة على الأليل مع مزيد من المثيلة في المروجين (الشكل 1 أ). في المعززات ، تميل H3K27ac إلى الحدوث في كثير من الأحيان على الأليل مع مثيلة أقل للحمض النووي (الشكل 1 أ). اكتشفنا أيضًا ، بدقة عالية ، إثراء الذكاء الاصطناعي في المثيلة والتغييرات المنسقة في النسخ وعلامات الهيستون ضمن غالبية تلك المواقع المطبوعة التي تضمنت SNP متغاير الزيجوت (الشكلان S4 و S5) (18).

    (أ) عدد AIs في علامات هيستون والنسخ ، تداخل مواضع ASM ، فوق فئات العناصر الجينومية. (ب إلى ه) نسب مواقع SD-ASM على إجمالي مواضع متغايرة الزيجوت في صناديق سعة 200 نقطة أساس بالقرب من المروجين وجزر CpG والمعززات.

    قمنا بعد ذلك بتقييم مدى الإبلاغ عن SD-ASM. بما يتفق مع الآثار الجينية في بلدان رابطة الدول المستقلة (6, 2022) ، كان التواجد المشترك لـ ASM في نفس المكان المتغاير الزيجوت عبر عينات مختلفة أعلى مما كان متوقعًا بالصدفة في ظل نموذج فارغ قائم على التقليب (الشكل S6A). تميل درجة التواجد المشترك لـ ASM إلى أن تكون أعلى بالنسبة لأزواج العينات عبر أنسجة نفس الفرد منها بين أزواج من نفس الأنسجة عبر أفراد مختلفين ، والتي كانت أعلى من العينات التي لا تطابق الأنسجة أو الفرد (الشكل S6B). قد يكون التوافق المنخفض في مكالمات ASM بين الأفراد بسبب سياق النمط الفرداني المحلي ، أو الانجراف اللاجيني ، أو عوامل غير جينية أخرى (3, 4, 6, 20, 22, 23). نمذجة خليط غاوسي (18) أظهر أن الاختلافات الأليلية في المثيلة (أعلى من عتبة 30٪) عند تعدد الأشكال المتغايرة الزيجوت كان لها ميل إلى الحدوث في نفس الاتجاه (نفس الأليل الذي يظهر مثيلة أعلى من الآخر) عبر أزواج من العينات (الشكل S6 ، C إلى E) .

    من أجل زيادة القدرة على اكتشاف SD-ASM بحساسية عالية ، قمنا بتجميع القراءات عبر جميع الميثيلومات البالغ عددها 49 وطبقنا نفس طريقة الكشف بالنسبة للعينات الفردية (الشكل S7A) (18). زادت التغطية العميقة للمجموعة المدمجة (تغطية إجمالية تبلغ 1691 ضعفًا في قراءة تسلسل بيسلفيت في المجموعة المدمجة المكونة من 49 ميثيلومًا) من قدرتنا على اكتشاف أنظمة الذكاء الاصطناعي المرتبطة بالتسلسل والتي يمكن اكتشافها عبر الأنسجة والجهات المانحة المختلفة (الشكل S7 ، B إلى D) ، في حين تم تقليل قدرتنا على اكتشاف SD-ASM المعتمد على الأنسجة والمعتمد على المتبرعين (الشكل S8 و A و B). ارتفع عدد المواقع غير المتجانسة التي يمكن الوصول إليها (تلك التي تحتوي على ستة أعداد على الأقل لكل أليل) ، لتحديد SD-ASM ، بعد التجميع إلى 4913361 ، مما أدى إلى زيادة دقة رسم الخرائط SD-ASM - التي تم قياسها كمتوسط ​​مسافة بين "مؤشر hets" - إلى 600 أزواج القاعدة (بي بي). عند الحد الافتراضي البالغ 30٪ لفرق المثيلة ، تم اكتشاف الذكاء الاصطناعي عند 5٪ من مؤشرات المؤشر مما أدى إلى خفض الحد إلى 20٪ ، أي ما مجموعه

    تختلف حساسية الميثيلوم للتنوع الجيني باختلاف فئات العناصر الجينومية

    اكتشفنا بعد ذلك ما إذا كان SD-ASM يميل إلى الحدوث داخل أي نوع معين من العناصر الجينومية. باستخدام القراءات المجمعة عبر 49 methylomes ، لاحظنا استنفاد SD-ASM داخل المروجين التي تحتوي على جزر CpG (الشكل 1 ب) ، وكذلك داخل جزر CpG بشكل عام (الشكل 1C) ، وهو ما يتوافق مع الملاحظات التي تفيد بأن ASM مستنفد في جزر سي بي جي (4, 21) وأن mQTLs يتم استنفادها داخل مروجي الجينات داخل جزر CpG (24, 25) ويتم إثراء هذا التعبير عن الصفات الكمية المثيلة داخل شواطئ جزر CpG وليس في جزر CpG نفسها (26). على النقيض من ذلك ، وعكس أنماط mQTL السابقة (25) ، أظهر مروجو الجينات غير الموجودة في جزر CpG مستويات عالية من SD-ASM (الشكل 1 د). لاحظنا أيضًا إثراء SD-ASM في اتجاه مجرى النهر من المروج إلى جسم الجين (الشكل 1 و B و D) والارتباط الإيجابي بين التعبير الخاص بالأليل (ASE) و ASM على exons (الشكل 1 أ) ، وهو ما يتوافق مع مع مثيلة أعلى للمناطق المكتوبة بنشاط ، بما في ذلك تلك الموجودة على الكروموسوم X (27) ومع إثراء mQTLs في المناطق المحيطة بموقع بدء النسخ (TSS) (23, 28). قد يكون أحد العوامل المساهمة في ASM ، خاصة بالقرب من مواقع بدء النسخ (الشكل 1 د) ، هو وجود إشارات تنظيمية للنسخ (29).

    كما تم إثراء SD-ASM بشكل كبير داخل المعززات (الشكل 1E) ، وهو ما يتوافق مع التقارير السابقة (24, 28). تشير وفرة مواقع ربط TF داخل المعززات إلى أن SD-ASM قد ينتج عن تعطيل ارتباط TF (23). في ظل هذا الافتراض ، تشير بياناتنا إلى أن ربط TF في جزر CpG والمروجين الغنية بـ CpG يتم تخزينه ضد الاضطرابات الوراثية ، في حين أن ارتباط TF بالمروجون والمعززات غير CpG يكون أكثر حساسية. لاحظنا أيضًا استنفادًا خفيفًا محيرًا إلى حد ما لـ SD-ASM في المناطق المحيطة بالمُعزِّزات (الشكل 1E) ، مما يشير أيضًا إلى التخزين المؤقت في تلك المناطق.

    يُعزى SD-ASM إلى الاختلافات بين أطياف تردد epiallele الخاصة بالأليل

    سألنا بعد ذلك عما إذا كان الافتقار إلى التخزين المؤقت في مواقع SD-ASM قد يؤدي إلى زيادة العشوائية وقابلية الاستقرار ، والتي يتم تحديدها من خلال وجود أكثر من حالة مستقرة ، كل حالة مستقرة تقابل epiallele (نمط مثيلة أحادي الكروموسوم). للإجابة على هذا السؤال ، استخدمنا تغطية قراءة WGBS العميقة المجمعة عبر 49 methylomes (الجدول S2) وأن كل قراءة تتعلق بمتغير واحد إلى epiallele واحد. قمنا بتقييم epialleles من خلال تسجيل حالة المثيلة لأربعة مواقع CpG متماثلة اللواقح (4 2 = 16 epialleles ممكن) التي كانت الأقرب إلى كل فهرس في قراءات WGBS الفردية (13, 14) (الشكل 2 أ). [استخدامنا لمصطلح "epiallele" يتبع أحدث استخدام (12, 13) ولا يتوافق مع التعريف الأصلي (30) ، مما يعني الميراث بين الأجيال. يتوافق استخدامنا لمصطلح "قابلية الاستقرار" مع استخدامه في نظرية الأنظمة الديناميكية ولا يعني وراثة epiallele أثناء انقسام الخلية.]

    (أ) مثال على طيف تردد epiallele (أسفل) مشتق من epialleles المرصودة في WGBS يقرأ (أعلى). (ب) رسوم بيانية لعنتروبيا شانون ، بالبتات ، لأطياف تردد epiallele للارتفاع الذي يظهر SD-ASM (أحمر) وأقرب هيتات (تحكم) بدون SD-ASM (أسود). (ج) معظم المواضع غير المتجانسة مع ظاهرتين متكررتين تظهر SD-ASM ولديها إنتروبيا أكبر من 1.7 بت (الجزء الأحمر من الشريط) ، حيث يكون القطعتان اللاصقتان ثنائية الطور (مميثلتان بالكامل أو غير ميثلين بالكامل) 71.7٪ من الوقت. توفر وسيلة الشرح الموجودة على اليمين مثالاً على Ht حيث يشرح الفرق بين أطياف التردد epiallele للأليل 1 (A ، البرتقالي) والأليل 2 (G ، الأزرق) SD-ASM. (د) رسم بياني لمعاملات القيد لمواقع SD-ASM مع ظاهرتين متكررتين. توضح وسائل الشرح مثالًا het (T / C ، وسيلة شرح أعلى يمينًا) مع معامل تقييد منخفض ، وآخر (G / C ، وسيلة شرح يمين أسفل) مع معامل تقييد مرتفع. (ه) رسم توضيحي للتخزين المؤقت على النقيض من نقائل ergodic / الدورية والفسيفساء.

    لتحديد مقدار العشوائية في الفهرس الموضعي ، استخدمنا إنتروبيا شانون (18). تراوحت قيم الانتروبيا من 0 إلى 4: التوزيع المتساوي للترددات عبر 16 نمطًا ممكنًا من epiallele ينتج عنه درجة قصوى من الانتروبيا تبلغ 4 بتات ، في حين أن الغياب الكامل للعشوائية بسبب "التخزين المؤقت" الأقصى يعني أن epiallele واحد بتردد غير صفري و a درجة الكون من 0 بت. للتقييم الكمي لأي اختلافات في التخزين المؤقت (نقص الحساسية للتنوع الجيني) بين SD-ASM ومواقع التحكم ، حددنا مواقع SD-ASM التي لديها تغطية كافية ومؤشر قريب بدون ASM ومقارنة الانتروبيا. استوفى إجمالي 6619 (2.7٪) من 241،360 موقعًا مع SD-ASM المعيارين (18). لاحظنا اختلافًا مذهلاً في الانتروبيا ، مما وفر تقييمًا كميًا للعشوائية الأعلى في SD-ASM مقابل مواقع التحكم (الشكل 2 ب).

    قمنا بعد ذلك بفحص التخصيب من أجل تعدد الأشكال اللاجينية في مواقع SD-ASM. لقد قدرنا عدد epialleles المتكررة لكل موضع عن طريق فرز epialleles من الأكثر إلى الأقل تكرارًا وحددنا الحد الأدنى من الحجم لـ epialleles التي تمثل 60 ٪ على الأقل من جميع القراءات مع epialleles المؤكدة. على النقيض من مواضع التحكم ، التي تحتوي عادةً على epiallele واحد عالي التردد في "القائمة العليا" وبالتالي لم تكن متعددة الأشكال جينيًا ، أظهر موقع SD-ASM العديد من الخلايا الظهارية المتكررة - في معظم الحالات ، اثنان فقط (الشكل 2C) . من خلال فحص الأزواج العلوية من epialleles ، وجدنا أن 71.7٪ من الأزواج تتكون من واحد تمت ميثليته تمامًا والآخر غير ميثيل تمامًا (الشكل 2C). يتوافق هذا مع التقارير السابقة للتوزيعات ثنائية الطور (الميثيل بالكامل وغير الميثيل تمامًا) للميثلة في الأمبليكون مع تباين مثيل مرتفع بين الأفراد وفي استنساخ تفاعل البوليميراز المتسلسل مع أنماط مثيلة ثنائية النسق (3, 31). يمكن تتبع أنظمة الذكاء الاصطناعي في مواضع SD-ASM للتحولات في أطياف التردد epiallele بين الأليلات ، وعادةً ما تكون التحولات في الترددات النسبية لل epialleles الميثيل بالكامل وغير الميثيل بالكامل (الشكل 2C). لقد تحققنا من صحة الزيادة الملحوظة في العشوائية وإثراء النمط ثنائي الطور في SD-ASM loci باستخدام مجموعة بيانات WGBS مستقلة من موسوعة عناصر DNA (ENCODE) (الشكل S9 ، A إلى C) (18).

    قمنا بعد ذلك بقياس العلاقة بين الاختلاف الجيني و epialleles العشوائية. في كل موضع ، قدرنا احتمالات الظهارة لكل أليل (يشار إلى الاحتمالات الأعلى بواسطة أسهم أكثر سمكًا في الشكل 2 و C و D). قمنا بعد ذلك بتحديد الدرجة التي تحدد بها الأليلات الجينية ترددات epiallele باستخدام معامل القيد (18) ، وهو مقياس نظري للمعلومات هو تعميم لـ ص 2 معامل التحديد الذي يشيع استخدامه في علم الوراثة وهو أكثر ملاءمة لتقدير التحديد الجيني للأنماط الظاهرية العشوائية. تشير القيمة الأكبر لمعامل قيمة القيد إلى أن الاختلاف اللاجيني أكثر تقييدًا ويحدده التباين الجيني في رابطة الدول المستقلة. حدسيًا ، يشير معامل القيد الأكبر إلى اختلاف أكبر في أطياف التردد الظهارية المقابلة للأليلين ، مما يعني درجة أعلى من تحديد أطياف تردد epiallele بواسطة الأليلات الجينية (الشكل 2D).

    هناك نموذجان ميكانيكيان عامان يمكن أن يفسرا تأثير اختلاف التسلسل في رابطة الدول المستقلة على أطياف تردد epiallele. ينص النموذج الارجودي / الدوري على التبديل المستمر بين الحالات المستقرة ، حيث تكون التحولات عشوائية مع عنصر محتمل للدورية ، مثل التذبذبات اليومية. إذا حدث عدد كافٍ من التحولات العشوائية من epiallele إلى آخر ، فإن طيف تردد epiallele يعتمد إلى حد كبير على الشكل المعتمد على التسلسل لمشهد الطاقة الحالي (احتمالات انتقال الحالة) وليس على الذاكرة اللاجينية للأحداث الماضية (الشكل 2E) . على النقيض من ذلك ، ينص نموذج الفسيفساء على أن الخلايا الظهارية تنتقل بثبات بمرور الوقت وحتى أثناء انقسام الخلية ، حيث يتم "تجميدها" بعد فترة من الانبثاث الأولي في إحدى الحالات المستقرة. يستلزم كلا النموذجين فترة من النقائل ، سواء كانت في الماضي (الفسيفساء) أو الحالية (نموذج ergodic / الدوري).

    تعرض مواضع ربط CTCF التبديل والتكرار العشوائي المعتمد على التسلسل

    نظرًا لارتباطه بميثيل الحمض النووي في عدد كبير من مواقع الربط ، قمنا بعد ذلك بفحص دور عامل ربط CCCTC (CTCF) في إنشاء الحالات غير المستقرة التي تتوافق مع الخلايا الظهارية. من المعروف أن قابلية الاستقرار يتم إنشاؤها عن طريق حلقات التغذية الراجعة الإيجابية (بما في ذلك السلبية المزدوجة) (32) أنه في حالتنا أيضًا تشمل التفاعلات في رابطة الدول المستقلة ، مثل الحماية من مثيلة الحمض النووي عن طريق ربط CTCF والتفضيل المتبادل لـ CTCF للحمض النووي غير الميثيل (33). جاء أول إشارة إلى دور ارتباط CTCF في قابلية الاستقرار من ملاحظة أن الزيجوت المتغاير مع معامل القيد الأكبر (G / C het) أظهر أيضًا اختلافات أكبر في تقارب ربط CTCF المتوقع بين الأليلين أكثر من الآخر (T / C). het) (الشكل 2D). بالنظر إلى أن معامل القيد يتناسب مع الاختلافات في أطياف تردد epiallele للأليلين (أطياف تردد epiallele المتطابقة مما أدى إلى معامل قيمة القيد 0) ، اقترحت هذه الملاحظة ارتباطًا إيجابيًا بين معامل القيد والاختلافات في CTCF ألفة ملزمة للأليلات الجينية ، والتي لوحظت بالفعل (الشكل 3 أ). فيما يتعلق بتشويه المناظر الطبيعية اللاجينية بسبب التباين الجيني ، نرى أن متغيرات التسلسل التي تظهر اختلافات أكبر في تقارب ربط CTCF تُظهر أيضًا اختلافات أكبر في المناظر الطبيعية اللاجينية (الطاقة) ، كما ينعكس في التحولات الأكثر بروزًا بين الأليلات في إشغالها الحالات غير المستقرة (كما تم قياسها بالقيم الأعلى لمعامل القيد) (الشكل 3 أ ، أعلى). نظرًا لأن ارتباط CTCF وإزالة الميثيل من موقع الربط الخاص به يعززان بعضهما البعض (يشكلان حلقة ردود فعل إيجابية وحالة غير مستقرة) ، يتنبأ النموذج أيضًا بأن المتغيرات المرتبطة بارتباطات ربط CTCF الأعلى ستظهر مثيلة أقل ، وهذا هو الحال بالفعل (الشكل . 3A ، أسفل) كما لوحظ سابقًا (23, 24). مجتمعة ، تشير هذه النتائج إلى التبديل فوق الجيني العشوائي المعتمد على التسلسل بين الحالات غير المستقرة التي يتوسطها ارتباط CTCF.

    (أ) (أعلى) الارتباط بين اختلافات تقارب ربط CTCF المطلقة ، بناءً على درجات مصفوفة وزن الموضع (PWMs) ، ومعامل القيد لمواقع ربط CTCF المتوقعة مع SD-ASM ، واثنين من epialleles متكررين ، ونمط مثيلة ثنائي الطور. (أسفل) الارتباط بين تقارب ربط CTCF ومثيلة الحمض النووي في مواقع ربط CTCF المتوقعة. (ب) SD-ASM هو أكثر تنبؤًا بالحلقة الأليلية (28 إيجابيًا حقيقيًا من 44 تنبؤًا) من درجات اضطراب الحافز (1 إيجابي حقيقي من 44 تنبؤًا). للتحكم في الخصوصية ، تم اختيار العتبات بحيث تنبأت كلتا الطريقتين بنفس عدد hets (44) لإظهار الحلقات الأليلية. (ج) SD-ASM في مواقع ربط 377 TFs محددة بطريقة SELEX. يشير المخطط الدائري (على اليسار) والجدول (على اليمين) إلى اتجاهات الإثراء والاتجاه باستخدام رمز لون مشترك. (د) (أعلى) الارتباط بين اختلافات تقارب ربط ELK3 المطلقة ومعامل القيد لمواقع الربط المتوقعة مع SD-ASM واثنين من epialleles متكررة ونمط مثيلة ثنائي الطور. (أسفل) الارتباط بين تقارب ربط ELK3 ومثيلة الحمض النووي في مواقع ربط ELK3 المتوقعة. (ه) نموذج ميكانيكي لمنظر طبيعي للطاقة يعتمد على التسلسل مع حالتين غير مستقرتين: أليل 1 (الصف العلوي) ، يتوافق مع منظر طبيعي حيث تتوافق حالة الانبثاث الأكثر احتلالًا مع epiallele غير الميثيل تمامًا ، والأليل 2 (الصف السفلي) ، المقابل إلى منظر طبيعي حيث تتوافق حالة الانبثاث الأكثر احتلالًا مع epiallele الميثلي تمامًا. يشار إلى حلقات التغذية المرتدة الإيجابية المفترضة التي تتضمن تفاعلات بين ميثلة موقع الربط وملزمة TF لـ CTCF. يشار إلى نموذج بديل يتضمن ارتباطًا تنافسيًا بين اثنين من الصناديق على اليمين. تم اختبار أهمية الارتباطات باستخدام Student's ر اختبار.

    لأن CTCF TF ينشئ حلقات كروماتين (34) ، سألنا ما إذا كانت الحالة الأليلية للمثيلة تتزامن أيضًا مع حلقات الأليلات. لتحقيق هذا الهدف ، استخدمنا دراسة (35) التي تُبلغ عن مواقع SNP متغايرة الزيجوت التي تربط كل من ربط CTCF الأليلي وحلقات الكروماتين الأليلي ، كما هو محدد عن طريق تحليل تفاعل الكروماتين عن طريق تسلسل علامة النهاية المزدوجة (ChIA-PET). في الواقع ، كان إجمالي 44 موقعًا من مواقع SNP هذه موجودة أيضًا في مجموعة البيانات الخاصة بنا. اقترحت مقارنة إشاراتنا لحالة المثيلة لمواقع ربط CTCF بدرجات اضطراب عزر CTCF المتوقعة أن SD-ASM هو مؤشر أكثر دقة لربط وحلقة CTCF الأليلي من درجة اضطراب الحافز (الشكل 3 ب) (18).

    تُظهر مواقع ربط TF تحولات تعتمد على التسلسل في أطياف تردد epiallele و AIs

    كشفت تحليلات ASM في العناصر التنظيمية و eQTLs عن ارتباطات بين ASM وعلامات هيستون الخاصة بالأليل مع النسخ الخاص بأليل المصب (الشكل S10 ، A إلى F) (18). استكملت هذه النتائج الدراسات السابقة (22, 23) واقترح مشاركة ارتباط TF الخاص بأليل والعوامل المساعدة في ASM. لفحص دور ارتباط TF الخاص بالأليل ، ركزنا على مجموعة 377 TFs التي تم تقييمها لتقارب الربط باستخدام التطور المنهجي عالي الإنتاجية للروابط بواسطة طريقة الإثراء الأسي (SELEX) (36). بالنسبة إلى CTCF ، حددنا المجموعة الفرعية من مواضع نموذج الربط في حالة متغايرة الزيجوت مع ظاهرتين متكررتين وفحصنا الارتباط بين معامل القيد والاختلاف في تقاربات الربط الأليلية المتوقعة عبر هذه المواقع لكل TF (الجدول S3). بسبب العدد الصغير نسبيًا لهذه المواقع لكل TF ، أظهر 13 فقط فردًا مهمًا ص القيم (Student’s ر اختبار، ص & lt 0.05) ، مع تصحيح Bonferroni فقط CTCF (لاختبار 377 TFs) (الجدول S3). However, a majority (11 of 13) of the TFs that showed individually significant correlation also showed positive correlation (ص = 0.01, binomial test), which is consistent with the pattern observed for CTCF where larger differences in TF binding affinities correspond to larger distortions in the configuration of metastable states within the landscape (table S3).

    Likewise, we next examined for all 377 TFs whether disruptions of their predicted binding sites associated with methylation imbalances. A majority (241) showed SD-ASM enrichment within their binding motifs compared with flanking loci (500 bp on each side) (Fig. 3C and table S4), suggesting that TF binding associates with allelic DNA methylation. The SD-ASM outside of the examined motifs may be attributable to sequence variation within undiscovered binding loci, within motifs of noncoding RNAs, or within loci in physical proximity or contact with regions of perturbed TF activity.

    We then examined the relation between allelic differences in motif strengths and methylation levels at SD-ASM loci (18). We observed that for more than half of the TFs tested (207), there was an association between motif strength and level of methylation (Fig. 3C). Most TFs (159) showed gain in methylation on the allele with the disrupted motif, which is consistent with the TF binding either protecting a region from passive methylation (37) or causing active demethylation (Fig. 3C) (38). By contrast, a smaller number of TFs (48), including members of TF families that recruit methyltransferases such as the ETS-domain TF family members (39, 40), showed loss of methylation on the allele with the disrupted motif (Fig. 3, C and D). About a quarter of TFs that show enrichment for SD-ASM show no bias in directionality (table S4), the lack of bias being explainable by contextual behavior at different binding loci, such as for nuclear factor of activated T cells 1 (41) or because of competing TFs at overlapping motifs. Our results support that TF motif sequences are predictive of proximal CpG methylation levels (23, 42, 43).

    We sought to validate the downstream functional consequences of SD-ASM variants, with predicted allelic differences in TF binding, using a luciferase assay. We prioritized cis-overlapping motifs (CisOMs), including those of c-MYC proto-oncogene (cMYC) and tumor suppressor p53 (TP53) that show competitive binding at many loci (44), because CisOMs provide one of the mechanisms of metastability (Fig. 3E), and also those that may have consequences for human disease (table S5). All four SNP validations showed allelic effects on luciferase expression, including two SNPs within CisOMs for cMYC and TP53 and some falling within disease-associated loci (fig. S11) (18), which suggests that SD-ASM helps identify those disease-associated variants that also have functional consequences.

    SD-ASM is enriched near disease-associated loci

    We observed that heterozygous variants with SD-ASM were enriched in the neighborhood of variants previously reported as significant in genome-wide association studies (GWASs) of common disease (Fig. 4A) (22, 23, 45). The enrichment was stronger around GWAS variants that have been replicated in multiple studies versus those that have not. To explore more specifically the role of enhancers, we performed a similar enrichment analysis focusing only on GWAS and SD-ASM variants overlapping enhancer elements. Enhancers that contain replicated GWAS variants were significantly (ص < 0.0001, χ 2 test) more likely to also contain a variant with SD-ASM than enhancers that did not contain replicated GWAS variants (Fig. 4B). Taken together, these results indicate that AIs provide information about the role of specific loci in common diseases, pointing to the loci that are sensitive to the effects of genetic variation and have functional effects. The enrichment of both GWAS loci and AIs at enhancers, and sensitivity of TF binding to genetic variation discussed in previous sections, provide a mechanistic link between AIs and GWAS associations.

    (أ و ب) Enrichment of ASM in the proximity of GWAS loci. ASM hets within 1 kb of GWAS loci are compared with colocalized hets without ASM. (ج إلى F) Evidence of purifying selection acting on rare variants with ASM. [(C) and (D)] Proportion of variants associated with ASM compared with those without ASM among the rare (DAF < 1%) variants across individual methylomes. [(E) and (F)] Proportion of loci with ASM over total heterozygous loci over windows of increasing DAF in the combined set of methylomes. (F) This bar chart summary of the data in (E) shows the excess of SD-ASM variants among those with DAF < 1%. χ 2 tests were used for significance of enrichments.

    Variants showing SD-ASM are under purifying selection

    Because the variants with large effects are under purifying selection, they tend to be rare, with frequencies below the detection threshold of association studies such as GWAS, mQTL, and eQTL. By contrast, AIs may provide evidence for functional effects even for rare variants that may be detected in only one individual. On the basis of previous studies that have used signatures of purifying selection such as shifts toward smaller derived allele frequency (DAF) to identify functional variants (46, 47), we would expect that ASM variants would also tend to have a lower DAF than those without ASM. Therefore, we obtained DAF estimates from the 1000 Genomes Project (48), ignoring variants that overlapped regions with low accessibility to variant calling. We observed that in nearly every sample in our dataset, heterozygous variants with ASM were significantly (ص < 0.05, χ 2 test) more likely to have DAF smaller than 1% than were those without ASM (methylation difference between alleles < 5%) (Fig. 4C). Overall, this analysis found

    130 (median) more rare (DAF < 1%) variants than expected among those with ASM per individual methylome, providing a lower bound on the number of those under purifying selection per individual. When we repeated the analysis for enhancer regions, strong signal was again observed (Fig. 4D), suggesting a median excess of at least 26 enhancer variants under purifying selection per individual.

    The lower bounds from individual samples may underestimate the extent of purifying selection because of underdetection of SD-ASM. We therefore investigated whether an enrichment for rare variants could also be seen for those variants associated with SD-ASM from the combined dataset, using neighboring variants as controls (18). We observed that the chance of a locus having SD-ASM decreased as the derived allele frequency increased (Fig. 4E there were very few variants with DAF > 50%, causing high variance and large confidence intervals). We further tested whether there was a significant enrichment for variants with DAF < 1% among those with SD-ASM and found that such enrichment was indeed significant (odds ratio 1.18 ص < 0.0001, χ 2 ) (Fig. 4F). That enrichment represents an excess of 2184 rare variants among those with SD-ASM compared with controls. Considering that this observed excess represents a set of 11 genomes (nine individuals and two cell lines), we estimate at least

    200 variants with SD-ASM under purifying selection per individual donor.


    Allele specific cloning efficiency after bisulfite treatment - (Sep/20/2005 )


    I hope my question is appropriate for this bioforum. I performed a bisulfite treatment on genomic DNA (EZ methylation kit, Zymo) and performed nested-PCR on that genomic DNA to amplify specific imprinted genes.

    I sent the PCR product to sequence and I could see on the Chroma file that some T/C peaks were juxtaposing each other. involving that I amplified both alleles in the PCR reaction (as was previously discussed here).

    I cloned the PCR product in P-Drive and sent 10 clones to sequence. and the results seems weird to me. far from the 50/50 I was expecting. I have to mention that I had a lot of trouble getting 10 clones to sequence. bacteria would not grow easily and the yield of my minipreps were very low (for some samples I had to do 20 minipeps to get 10 to sequence. but miniprep issuesare not the point here. )

    The point is: Is it possible that cloning efficiency depends on the allele inserted in the cloning vector? Can some "cloning bias" be introduced such that one bisulfite-treated allele is more easily cloned than the other?

    Anyone has an idea about that? Or got stuff that looks like mine??

    I am curious what differences are there between the two alleles, different methylation, polymorphism?

    When we deal with imprinted genes, we may expect different methylation patterns between the two alleles depending on the maternal/paternal origin of the allele. one allele may be hypermethylated and the other hypomethylated.

    Chroma files showed that I'm amplifying both alleles in my PCR. (if you refer to my first posted message)

    So is it possible that cloning efficiency is not the same for both alleles after bisulfite treatment?

    I don't know if there is a clone bias for methylated allele. It may be possible. But, the under-representation of unmethylated allele in your sequencing clones may due to sampling error because you hardly got 10 colonies in total. I usually don't have any problem obtaining more than hundreds of colonies for sampling. You may want to try Topo cloning kit. I found that result from clone sequencing is consistent to that from direct sequencing.

    Yeah I thought it might be some cloning issues. but I also thought it would not harm to investigate about other possibilities. I'll look for that Topo cloning. thanks pcrman!


    Published online:

    Figure 1 (A) Dlk1-Gtl2 imprinting cluster, including transcriptional start sites (arrows) and transcription units (hatched boxes). (B) Portion of IG-DMR analyzed in this study. The 458 bp region analyzed by bisulfite mutagenesis and DNA sequencing corresponds to positions 110,766,298-110,766,755, NC_000078.5 (black box). Polymorphisms (*) between C57BL/6J and Mus musculus castaneus are as follows: (B6/CAST): 110,766,439 (A/G), 110,776,579 (G/A), 110,766,774 (G/A), 110,766,902-110,766,904 (TTT/TT), 110,767,052 (A/G). (C) Schematic of the Gtl2-DMR, including the Gtl2 transcriptional start site (arrow) and exon 1 (hatched box) +1 corresponds to position 110,779,206. Regions analyzed correspond to positions 110,778,378-110,778,966 and 110,779,331-110,780,052. Polymorphisms are as follows: 110,779,741 (G/A), 110,779,881 (A/G), 110,780,030-110,780,031 (AA/GC).

    Figure 1 (A) Dlk1-Gtl2 imprinting cluster, including transcriptional start sites (arrows) and transcription units (hatched boxes). (B) Portion of IG-DMR analyzed in this study. The 458 bp region analyzed by bisulfite mutagenesis and DNA sequencing corresponds to positions 110,766,298-110,766,755, NC_000078.5 (black box). Polymorphisms (*) between C57BL/6J and Mus musculus castaneus are as follows: (B6/CAST): 110,766,439 (A/G), 110,776,579 (G/A), 110,766,774 (G/A), 110,766,902-110,766,904 (TTT/TT), 110,767,052 (A/G). (C) Schematic of the Gtl2-DMR, including the Gtl2 transcriptional start site (arrow) and exon 1 (hatched box) +1 corresponds to position 110,779,206. Regions analyzed correspond to positions 110,778,378-110,778,966 and 110,779,331-110,780,052. Polymorphisms are as follows: 110,779,741 (G/A), 110,779,881 (A/G), 110,780,030-110,780,031 (AA/GC).

    Published online:

    Figure 2 Paternal allele-specific methylation of the IG-DMR is inherited from sperm. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST and CAST × B6 F1 hybrid liver and B6 × CAST F1 hybrid spermatozoa. Each circle represents one of 32 potentially methylated CpG dinucleotides, the first one located at position 110,766,345 (NC_000078.5). Each row of circles represents an individual strand sequenced. Filled circles represent methylated cytosines, open circles represent unmethylated cytosines, absent circles represent positions at which methylation data was not obtained.

    Figure 2 Paternal allele-specific methylation of the IG-DMR is inherited from sperm. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST and CAST × B6 F1 hybrid liver and B6 × CAST F1 hybrid spermatozoa. Each circle represents one of 32 potentially methylated CpG dinucleotides, the first one located at position 110,766,345 (NC_000078.5). Each row of circles represents an individual strand sequenced. Filled circles represent methylated cytosines, open circles represent unmethylated cytosines, absent circles represent positions at which methylation data was not obtained.

    Published online:

    Figure 3 Methylation of the paternal IG-DMR is maintained during pre- and post-implantation development. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST F1 hybrid embryos. Details as described in الشكل 2.

    Figure 3 Methylation of the paternal IG-DMR is maintained during pre- and post-implantation development. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST F1 hybrid embryos. Details as described in الشكل 2.

    Published online:

    Figure 4 Paternal allele-specific methylation of the Gtl2-DMR is not inherited from sperm. Each circle represents one of 29 potentially methylated CpG dinucleotides, the first one located at position 110,779,349 (NC_000078.5). Details as described in الشكل 2.

    Figure 4 Paternal allele-specific methylation of the Gtl2-DMR is not inherited from sperm. Each circle represents one of 29 potentially methylated CpG dinucleotides, the first one located at position 110,779,349 (NC_000078.5). Details as described in الشكل 2.


    These authors contributed equally: Qiyang Li, Zhongju Wang, Lu Zong, Linyan Ye

    الانتماءات

    Department of Medical Genetics, School of Basic Medical Sciences, and Guangdong Technology and Engineering Research Center for Molecular Diagnostics of Human Genetic Diseases, Southern Medical University, Guangzhou, Guangdong, China

    Qiyang Li, Zhongju Wang, Lu Zong, Linyan Ye, Junping Ye, Haiyan Ou, Bo Guo, Wenquan Liang, Jian Zhang, Yong Long, Yu Hou, Lin Zhou, Shufen Li & Cunyou Zhao

    Key Laboratory of Mental Health of the Ministry of Education, Guangdong-Hong Kong-Macao Greater Bay Area Center for Brain Science and Brain-Inspired Intelligence, and Guangdong Province Key Laboratory of Psychiatric Disorders, Southern Medical University, Guangzhou, Guangdong, China

    Qiyang Li, Zhongju Wang, Linyan Ye, Junping Ye, Bo Guo, Wenquan Liang, Shufen Li & Cunyou Zhao

    Reproductive and Genetic Hospital, The First Affiliated Hospital of USTC, Division of Life Sciences and Medicine, University of Science and Technology of China, Hefei, China

    The Third People’s Hospital of Zhongshan, Zhongshan, Guangdong, China

    Department of Psychiatry, the Affiliated Brain Hospital of Guangzhou Medical University (Guangzhou Huiai Hospital), Guangzhou, Guangdong, China

    Qiong Yang, Fengchun Wu & Xingbing Huang

    Guangdong General Hospital, Guangdong Academy of Medical Science and Guangdong Mental Health Center, Guangzhou, China


    شاهد الفيديو: Diana Karazon - Farhetna El Lieleh. ديانا كرزون - فرحتنا الليلة (يونيو 2022).


تعليقات:

  1. Goltit

    أنا أشاطرها وجهة نظرها بالكامل. أعتقد أنها فكرة جيدة. أنا أتفق معك.

  2. Protesilaus

    شيء مضحك جدا

  3. Rowan

    أنا لا أفهم حقًا ماذا يعني ذلك؟

  4. Rolfe

    الجواب الذي لا يضاهى

  5. Voodooll

    أي موضوع ممتاز



اكتب رسالة