معلومة

قاعدة بيانات تحليل بيانات تسلسل رقاقة

قاعدة بيانات تحليل بيانات تسلسل رقاقة


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أين يمكنني العثور على بيانات ChIP-Seq التي تم تحليلها بالفعل؟ هل هناك أي قاعدة بيانات أو أي أداة ويب تأخذ البيانات الأولية لـ ChIP-seq وتحللها تلقائيًا؟ أو هل هناك أي قاعدة بيانات توفر بعض واجهة برمجة التطبيقات لتحليل البيانات الأولية التي توفرها. أنا جديد في تحليل بيانات ChIP-seq وأحتاج حقًا إلى هذه لإنشاء منصة قائمة على الويب لرسم خرائط لبيانات ChIP-seq. شكرا لك مقدما. لقد وجدت بعض البيانات المثيرة للاهتمام في genome.edu. هل توجد قاعدة بيانات أخرى؟


أكبر قاعدة بيانات لبيانات ChIP-seq المنسقة حاليًا هي الترميز وهي تدعم واجهة برمجة التطبيقات. يمكنك استخدام JSON للحصول على جميع المسارات.

ستحتوي هذه الصفحة على رابط للشروع في العمل والذي من المفترض أن يساعدك على المضي قدمًا. يمكنك تصور البيانات الأولية والبيانات المعيارية ومسارات البيانات المعالجة في متصفحات الجينوم التي يتم تحميلها في بيانات الترميز. متصفح الجينوم المفضل لدي هو:

متصفح WashU Epigenome


قاعدة بيانات تحليل بيانات تسلسل رقاقة رقاقة - علم الأحياء

الدرس 2: تحليل بيانات ChIP-Seq

1.1 تحميل قاعدة بيانات الجينوم

لتحليل بيانات ChIP-seq الخاصة بك ، يجب أن يكون لديك معلومات الجينوم الضرورية المخزنة على جهاز الكمبيوتر المحلي الخاص بك. يمكن الحصول على هذه المعلومات عن طريق تنزيل قواعد بيانات الجينوم المختلفة من صفحة التنزيل الخاصة بنا. على سبيل المثال ، إذا كنت تدرس الماوس ، فيمكنك تنزيل قاعدة بيانات جينوم الماوس (على سبيل المثال ، mm8). تحتوي قاعدة البيانات المُجمَّعة مسبقًا هذه على جميع المعلومات الضرورية المطلوبة لدعم تحليل ChIP-seq بما في ذلك كل من اكتشاف الذروة المنبع بالإضافة إلى التصور النهائي ، واسترجاع التعليقات التوضيحية والتسلسل ، ورسم خرائط نموذج ربط عامل النسخ ، إلخ.

لتنزيل قاعدة بيانات الجينوم ، ما عليك سوى النقر فوق تلك التي تريد استخدامها ، وحفظها في أي مجلد تختاره. تحتوي قاعدة البيانات عادةً على & # 8220.gz & # 8221، & # 8220.zip & # 8221 أو & # 8220.exe & # 8221 لاحقة. في الحالتين الأوليين ، بعد التنزيل ، تحتاج إلى فك ضغط قاعدة البيانات باستخدام برنامج مثل gzip ، و unzip ، و WinZip ، و WinRAR إلخ. تحميل لتثبيت قاعدة البيانات. سيستغرق إجراء التنزيل بعض الوقت. أثناء انتظارك ، دع & # 8217s يواصل إعداد بياناتنا.

1.2 تحضير ملفات المحاذاة

كمدخل لـ CisGenome ، لكل عينة قمت بترتيبها & # 8217ve ، تحتاج إلى إعداد ملف نصي لتوفير معلومات محاذاة القراءة إلى الجينوم. يجب أن يكون الملف محددًا بعلامات جدولة وأن يكون بالتنسيق التالي:

العمود 1 = كروموسوم حيث تتم محاذاة القراءة

العمود 2 = تنسيق مكان محاذاة القراءة

العمود 3 = & # 8216F & # 8217 أو & # 8216 + & # 8217: إذا تمت محاذاة القراءة مع الشريط الأمامي لتجميع الجينوم

& # 8216R & # 8217 أو & # 8216 - & # 8217: إذا تمت محاذاة القراءة إلى الخيط التكميلي العكسي للجينوم.

ستنتج معظم منصات التسلسل معلومات المحاذاة كجزء من مخرجاتها. على سبيل المثال ، عادةً ما تتم محاذاة البيانات التي تم إنشاؤها بواسطة Illumina / Solexa باستخدام خوارزمية ELAND. إذا كنت تستخدم هذه المحاذاة ، يرجى تحويلها إلى التنسيق المحدد أعلاه. إذا تم إنشاء المحاذاة بواسطة ELAND ، فيمكنك تحويلها إلى التنسيق المحدد أعلاه باستخدام & # 8220File - & gt File Format Conversion - & gt ELAND- & gtALN & # 8221. يرجى التأكد من أن قاعدة بيانات الجينوم التي قمت بتنزيلها من موقع CisGenome تحتوي على نفس مجموعة الجينوم مثل تلك التي استخدمتها لإنتاج المحاذاة. لا تبلغ ELAND عن عمليات المحاذاة التي تتضمن عمليات الإدراج والحذف ، إذا كنت تريد السماح بعمليات الإدراج والحذف ، فيمكنك إجراء المحاذاة بنفسك باستخدام خوارزمية SeqMap التي طورها Jiang et al.

بعد تنزيل قاعدة بيانات الجينوم وإعداد ملفات محاذاة الإدخال ، تكون جاهزًا للانتقال إلى الخطوة التالية & # 8212 إنشاء مشروع تحليل البيانات.

1. إعداد البيانات

سيقفز مربع حوار ليطلب منك تحديد قاعدة بيانات الجينوم. انتقل إلى المجلد حيث قمت بتثبيت / فك ضغط قاعدة البيانات الخاصة بك. ضمن مجلد قاعدة البيانات ، يجب أن تكون قادرًا على العثور على ملف له لاحقة & # 8220.cgw & # 8221. عادةً ما يتم تسمية هذا الملف كـ & # 8220 [نوع] _ [إصدار] .cgw & # 8221 ، على سبيل المثال ، mouse_mm8.cgw. اختر هذا الملف ، وانقر فوق الزر & # 8220Open & # 8221.

إذا تم تحميل قاعدة البيانات بشكل صحيح ، يجب أن ترى الآن عنصرًا جديدًا في نافذة مستكشف المشروع ، ضمن & # 8220Genome Databases & # 8221 (كما هو موضح أدناه).

2. إنشاء مشروع تحليل تسلسل رقاقة

عند بدء تشغيل واجهة المستخدم الرسومية CisGenome ، سيتم تلقائيًا فتح مشروع تحليل بيانات فارغ. قبل أن تتمكن من تحليل بيانات ChIP-seq ، تحتاج إلى تحميل قاعدة بيانات الجينوم وملفات المحاذاة في المشروع.

2.1 تحميل قاعدة بيانات الجينوم

لتحميل قاعدة بيانات الجينوم ، انقر في نظام القائمة على & # 8220 File & gt Load Data & gt Genome Database & # 8221.

2.2 تحميل ملفات المحاذاة

لتحميل ملفات المحاذاة ، انقر فوق القائمة & # 8220 التسلسل & gt Alignment- & gtBAR & # 8221

سوف يقفز حوار. في مربع الحوار ، انقر أولاً على الزر المميز بالدائرة الحمراء 1. سيظهر مربع حوار ملف A & # 8220Open & # 8221 للسماح لك باختيار واحد أو أكثر من ملفات المحاذاة من جهاز الكمبيوتر الخاص بك. إذا لم يتم فرز المحاذاة في الملفات & # 8217t باستخدام الإحداثيات الجينية ، فيجب عليك فحص & # 8220 فرز ملف (ملفات) الإدخال قبل التحويل & # 8221 (الدائرة الحمراء 2). خلاف ذلك ، قم بإلغاء تحديد المربع لتوفير بعض الوقت الحسابي.

بعد & # 8217 الانتهاء ، انقر فوق الزر & # 8220OK & # 8221 ، وسيبدأ تشغيل البرنامج.

عند انتهاء التشغيل ، ستتمكن من رؤية قائمة بملفات * .bar التي تم إنشاؤها حديثًا في نافذة & # 8220Project Explorer & # 8221 ، ضمن قسم & # 8220Signals (BAR) & # 8221 (الدائرة الحمراء 3). يتم تحويل ملفات BAR هذه من ملفات نصية الإدخال. على الرغم من أن ملفات BAR والملفات النصية المدخلة تحتوي على نفس معلومات المحاذاة ، فإن ملفات BAR يتم ترميزها بتنسيق ثنائي ويمكن أن تحسن أداء التصور والحساب النهائي بشكل كبير. سيتم استخدام ملفات BAR كمدخلات لجميع تحليلات المصب.

نظرًا لأنك قمت بالفعل بإنشاء مشروع تحليل ChIP-seq ، يمكنك البدء في تحليل البيانات. ومع ذلك ، قبل القيام بذلك ، تحتاج إلى معرفة طريقتين مهمتين ، أي كيفية حفظ مشروعك وكيفية فتح مشروع. إنها مهمة لأنه يمكنك بعد ذلك حفظ مشروعك في أي وقت ، وفي المرة القادمة التي تريد فيها إعادة زيارة مشروعك ، لن تحتاج إلى تكرار جميع التحليلات التي قمت بها بالفعل.

لحفظ مشروعك الحالي ، انقر فوق القائمة & # 8220 ملف & gt حفظ المشروع & # 8221. سيظهر مربع حوار لمساعدتك في حفظ مشروعك في ملف CisGenome Windows Project (* .cgw أو CGW).

بعد حفظ مشروعك ، يمكنك محاولة إغلاق مشروعك بالنقر فوق & # 8220File & gt إغلاق المشروع & # 8221.

يمكنك بعد ذلك محاولة إعادة تحميل مشروعك باختيار القائمة & # 8220File & gt Open Project & # 8221. مرة أخرى ، سيقفز مربع حوار ويطلب منك اختيار ملف CGW لفتحه. بعد فتح الملف ، ستتمكن من رؤية جميع البيانات الموجودة في المشروع في نافذة CisGenome Project Explorer.

تذكر حفظ مشروعك بشكل متكرر لتجنب فقدان جهود التحليل الخاصة بك.

الآن ، نحن جاهزون للبحث عن قمم في البيانات. سنبدأ من أسهل حالة تحليل عينة واحدة حيث تتوفر عينة ChIP واحدة فقط ، ونريد العثور على مناطق ربط من القراءات المتسلسلة لهذه العينة المفردة. التالي & GT


خلفية

على مدى السنوات القليلة الماضية ، أحدثت تقنيات الجيل التالي من التسلسل (NGS) ثورة في قدرتنا على دراسة البيانات الجينومية. بينما تم استخدام هذه التقنيات في البداية لدراسة بيانات تسلسل الحمض النووي [1] ، إلا أنها تُستخدم الآن على نطاق واسع لدراسة أنواع إضافية من البيانات البيولوجية الديناميكية والخاصة بالظروف. على وجه التحديد ، تم استخدام تسلسل الترسيب المناعي للكروماتين (ChIP-Seq) لتحديد الأشكال الجديدة [2] للمساعدة في إعادة بناء الشبكات التنظيمية [3 ، 4] ودراسة دور علم التخلق في التنظيم [5].

يبدأ خط الأنابيب القياسي لتحليل هذه التجارب بمحاذاة القراءات مع الجينوم لتحديد أصلها وتصحيح الأخطاء. بعد ذلك ، يتم تحديد القمم (المناطق التي يتم فيها إثراء وفرة القراءة بالمقارنة مع عنصر تحكم) ويتم تحديد إثرائها من خلال مقارنة تغطية هذه القمم بين الحالة والضوابط [6]. تم اقتراح العديد من الطرق لإجراء مثل الكشف عن الذروة ولتحديد ذروة التخصيب [6]. بينما تختلف هذه الطرق في جوانب مهمة (بما في ذلك نوع التوزيع الذي يفترضونه ، والطريقة التي يخصصونها تقرأ للمناطق الجينومية ، والطريقة التي يتم بها حساب التخصيب ، وما إلى ذلك) ، تعتمد جميع طرق تحليل ChIP-Seq الحالية على الأول الخطوة المذكورة أعلاه: اقرأ محاذاة الجينوم.

على الرغم من أن المحاذاة القائمة على الجينوم ممكنة للعديد من الأنواع ، إلا أن هناك العديد من الحالات التي تكون فيها المحاذاة مع الجينوم إما غير ممكنة أو يمكن أن تفوت أحداثًا مهمة. إن تجميع الجينومات الكاملة وتعليقها يستغرق وقتًا وجهدًا ، وحتى الآن ، تم تسلسل أقل من 250 نوعًا من أكثر من 8 ملايين نوع من الكائنات حقيقية النواة بشكل كامل على مستوى الكروموسوم [7]. ومع ذلك ، غالبًا ما تكون المعلومات من العديد من الأنواع ذات الصلة مطلوبة من أجل تحديد العمليات المشتركة ومرونتها التطورية من أجل فهم المبادئ الشاملة لعلم الأحياء التطوري. لنأخذ على سبيل المثال نموذج قنفذ البحر (Stronglyocentrotus purpuratus). في حين أن الخرائط التفصيلية لشبكات تنظيم الجينات التنموية (GRNs) معروفة جيدًا لهذا الكائن النموذجي [8] ، فإن الدراسات المقارنة باستخدام الأنواع ذات الصلة بما في ذلك نجم البحر وخيار البحر ، والتي لم يتم تسلسلها بالكامل حتى الآن ، مطلوبة لحل الأسئلة طويلة الأمد المتعلقة لعوامل المشاركة في تطوير قنافذ البحر. على سبيل المثال ، تم الافتراض منذ فترة طويلة أن TFs تخضع لضغط الاختيار وبالتالي تتطور بشكل أبطأ من البروتينات الأخرى [9]. لذلك فإن التغيير في الأهداف الملزمة لمثل هذه العوامل يجب أن يكون في الغالب تنظيميًا [10]. من ناحية أخرى ، أصبح من المدرك بشكل متزايد أن TFs يمكن أن تطور اختلافات كيميائية حيوية وأن هذه ستكون مهمة للزخارف التي ترتبط بـ [11 ، 12]. تحليل في المختبر تشير تفضيلات الربط (باستخدام صفائف ربط البروتين) إلى أن TFs يمكن أن تتطور عبر المسافة التطورية بين قنفذ البحر ونجم البحر [13]. ومع ذلك ، لا يوفر هذا التحليل معلومات حول في الجسم الحي خصائص الربط ، والتي لا يمكن تحديدها إلا باستخدام الدراسات القائمة على ChIP. وبالتالي ، الطرق التي يمكن أن تؤدي من جديد يمكن أن يوفر تحليل بيانات ChIP-Seq معلومات مهمة فيما يتعلق بتطور الحافز وإعلامنا بكيفية اختلاف خصائص الربط الخاصة بـ TFs المحفوظة عبر الأنواع ذات الصلة.

حتى عندما يكون الجينوم المرجعي متاحًا ، في بعض الحالات بما في ذلك الخلايا السرطانية ، بسبب الطفرات ، وإعادة الترتيب ، والاضطرابات الجينية الأخرى ، قد لا نتمكن من الاعتماد عليه بشكل كامل عند إجراء تجارب التسلسل [14-17].

على غرار طرق تحليل ChIP-Seq القياسية ، في معظم خطوط أنابيب تحليل RNA-Seq ، تتم محاذاة القراءات أولاً مع الجينوم ثم يتم تجميعها وتحديدها باستخدام مرجع الجينوم. وبالتالي ، يواجه تحليل الترانسكريبتوميكس مشاكل مماثلة عند دراسة الأنواع التي لا يوجد لها جينوم مرجعي أو عند محاولة تحليل بيانات التعبير السرطاني [18]. عدة طرق ل من جديد تم تطوير تحليل النسخ لمعالجة هذه القضايا [18-20]. ومع ذلك ، لا يمكن تطبيق هذه الأساليب بشكل مباشر على دراسات ChIP نظرًا لأن تركيزها لا ينصب على اكتشاف الذروة و / أو الحافز ، بل على تجميع النسخ ، وعلى حل النصوص المقسمة بدلاً من ذلك.

لتمكين التجارب التي تدرس تطور الحافز باستخدام الأنواع غير المتسلسلة أو في الحالات التي يمكن أن يختلف فيها المرجع بشكل كبير عن الجينوم قيد الدراسة ، قمنا بتطوير طريقة جديدة لتحليل من جديد بيانات ChIP-Seq (الشكل 1). على عكس الطرق السابقة التي تحدد القمم بعد محاذاة القراءة القصيرة للجينوم ، نستخدم أولاً من جديد تم تطوير طرق التجميع في الأصل لـ RNA-Seq لتجميع مقاطع أطول نطلق عليها ChIPtigs. باستخدام هذه الشرائح ، نقوم بمحاذاة القراءات من كليهما ، عينات ChIP-seq الأصلية والتحكم إلى هذه الشرائح المجمعة واستخدام هذه المحاذاة لحساب درجة الإثراء. نقوم بعد ذلك بترتيب ChIPtigs والأداء من جديد اكتشاف الحافز في الجزء العلوي من ChIPtigs المخصب لتحديد أشكال الربط.

خط أنابيب تحليل De novo ChIP-seq. أعلى: يتم تجميع القراءات من تجربة فريق العمل باستخدام ملف من جديد طريقة التجميع (SEECER أو Velvet) تؤدي إلى ChIPtigs أطول ، كل منها يعتمد على عدة (غالبًا مئات أو آلاف) من القراءات المجمعة. أسفل اليمين: يتم تسجيل كل من ChIPtigs المجمعة لتحديد مدى إثرائها للتجربة مقابل قراءة التحكم. يتم تصنيف ChIPtigs بناءً على درجات التخصيب. أسفل اليسار: تُستخدم شرائح ChIPtigs ذات التصنيف الأعلى كمدخلات لطريقة اكتشاف الحافز التي تؤدي إلى مجموعة من الأشكال للتجارب

لاختبار الطريقة الجديدة ، طبقناها أولاً على بيانات الماوس (حيث يمكننا مقارنتها مباشرةً بالطرق التي تستخدم الجينوم). كما نوضح ، بالنسبة لمعظم TFs ، فإن من جديد كانت الطريقة قادرة على اكتشاف الفكرة الصحيحة بدقة حتى بدون استخدام الجينوم كمرجع. قمنا بعد ذلك بتحليل بيانات ChIP-Seq من العديد من خطوط الخلايا السرطانية البشرية. يوضح هذا التحليل كذلك أن لدينا من جديد الأساليب قادرة على التحديد الدقيق لكل من الزخارف والزخارف الصحيحة للعوامل المشتركة لـ TF قيد الدراسة. أخيرًا ، للمحاكاة من جديد تحليل الأنواع غير المتسلسلة ، استخدمنا بيانات الطيران لإظهار أن طريقتنا تتفوق في الأداء على الأساليب التي تعتمد على الأنواع (المتسلسلة) وثيقة الصلة عند تحليل بيانات ChIP-Seq من الأنواع غير المتسلسلة.


GTRD: قاعدة بيانات لمواقع ربط عامل النسخ المحددة بواسطة تجارب ChIP-seq

قاعدة بيانات GTRD-Gene Transcription Regulation (http://gtrd.biouml.org) - هي قاعدة بيانات لمواقع ربط عامل النسخ (TFBSs) التي تم تحديدها بواسطة تجارب ChIP-seq للإنسان والفأر. تم الحصول على بيانات تسلسل ChIP الخام من ENCODE و SRA ومعالجتها بشكل موحد: (1) تمت محاذاة القراءات باستخدام Bowtie2 (ii) تم استدعاء قمم ChIP-seq باستخدام ذروة المتصلين MACS و SISSRs و GEM و PICS (iii) القمم لنفس العامل تم دمج المتصلين الذروة ، ولكن ظروف التجربة المختلفة (خط الخلية ، العلاج ، إلخ) ، في مجموعات (4) تم دمج هذه المجموعات لمتصلين مختلفين في الذروة في مجموعات ميتاكلاستس التي كانت تعتبر مجموعات غير زائدة عن الحاجة من TFBSs. بالإضافة إلى المعلومات حول الموقع في الجينوم ، تحتوي المجموعات على معلومات منظمة حول خطوط الخلايا والظروف التجريبية المستخرجة من أوصاف تجارب ChIP-seq المقابلة. تم تطوير واجهة ويب للوصول إلى GTRD باستخدام منصة BioUML. يوفر: (1) تصفح المعلومات وعرضها (2) إمكانيات البحث المتقدم ، على سبيل المثال البحث عن TFBSs بالقرب من الجين المحدد أو البحث عن جميع الجينات التي يحتمل أن ينظمها عامل نسخ محدد (3) متصفح الجينوم المتكامل الذي يوفر تصورًا لبيانات GTRD: قراءة المحاذاة ، والقمم ، والمجموعات ، والميتاكلاسترات والمعلومات حول الهياكل الجينية من قاعدة بيانات Ensembl وتوقعت مواقع الربط باستخدام مصفوفات وزن الموقع من قاعدة بيانات HOCOMOCO.

© المؤلف (المؤلفون) 2016. تم النشر بواسطة مطبعة جامعة أكسفورد بالنيابة عن أبحاث الأحماض النووية.

الأرقام

إعادة بناء USF1 البشري ...

إعادة بناء USF1 TFBS البشري في جوار جين PIGR ...

Infocard لـ USF1 المعاد بناؤه ...

Infocard الخاص بـ USF1 TFBS المعاد بناؤه من الشكل 1. هذه المعلومات يمكن الوصول إليها ...


قاعدة بيانات تحليل بيانات تسلسل رقاقة رقاقة - علم الأحياء

سينوبيس

إن ChiP (ترسيب الكروماتين المناعي) هو كل شيء عن الأجسام المضادة عالية الجودة ، والتحضير الاحترافي للعينات ، والتحليل الدقيق للبيانات الأولية الناتجة (القمم). بينما بالنسبة لموضوعات المختبر الرطب ، لم يتغير شيء أثناء التطور من مقايسة رقاقة ميكرواري إلى تسلسل تشيب ، فقد تغير جزء التحليل إلى الأفضل. هذا ، لأن البيانات التي تحصل عليها من متواليات NGS الحديثة أفضل بكثير من تلك التي تم الحصول عليها باستخدام تقنية ميكروأري. ومع ذلك ، لا يزال يتعين عليك تكييف سير عمل التحليل الخاص بك مع طبيعة الجسم المضاد والقمم الناتجة. نقوم بذلك عن طريق فحص نتائج كل خطوة من خطوات التحليل يدويًا.

لا توجد نتيجة مهمة ، إذا لم يتم تقديمها بأفضل طريقة. نحن نهدف إلى شخصيات عالية الجودة. نحن نقدم صورًا عالية الدقة بالإضافة إلى إصدارات pdf من رسوماتك ، والتي تمكنك من معالجة الألوان والنص والعديد من الخيارات الأخرى. يرجى الاطلاع على مثال الفيديو هنا.

في حال كنت ترغب في التعاقد مع علم الأحياء & # 8217s لتحليل مشروع ChIP-Seq الخاص بك ، فسنقسم العملية برمتها إلى 4 خطوات ، مع اختيار مستوى التحليل الذي تحتاجه:

التصميم التجريبي

استشارة في التصميم التجريبي والإجراء الفني للتجربة. في بعض الأحيان يمكن أن تساعد مكالمة هاتفية واحدة بشكل كبير.

إعداد البيانات والمواءمة

تسخين محطات العمل لدينا: تقييم جودة البيانات ، قراءة التلاعب (التشذيب ، التصفية) ومواءمة قراءات Chip-Seq الخاصة بك.

القمم: الكشف ، الشرح ، التصفية

وقت الذروة مع ضبط معاملات الاستدعاء بعد الفحص البصري للنتيجة. الشرح مع الجينات / النصوص المعروفة أو السمات الجينية الأخرى ذات الأهمية (المروجين ، جزر CpG & # 8230). تصفية المناطق المخصبة التي تم الحصول عليها بناءً على درجات الاستدعاء أو القيم p أو الموقع فيما يتعلق بالجينات / النصوص المعروفة.

تحليل موقع ارتباط عامل النسخ والتفسير البيولوجي.

بدءًا من قائمة القمم المسماة ، نقوم باكتشاف أشكال الربط الأساسية لعوامل النسخ. هذا ، لكل من الزخارف المعروفة من قواعد بيانات موقع ربط عامل النسخ الشائعة وأيضًا لنماذج الربط الجديدة غير المعروفة. يتضمن التفسير البيولوجي إثراء علم الجينات ومسار إشراك الجينات المستهدفة لعامل النسخ أو التكامل مع نتائج فحوصات أخرى.

نحن نحلل بيانات Chip-Seq من جميع أجهزة التسلسل من الجيل التالي للعمدة من Illumina أو Ion-Torrent. يمكننا البدء من ملفات FASTA أو FASTQ أو ملفات BAM غير المحاذاة أو تنسيق SRA.
نحن لسنا مثبتين على المشتبه بهم المعتادين ، مثل الإنسان أو الفأر أو الجرذ. يمكن التعامل مع أي نوع من الأنواع ذات الجينوم المتسلسل.

يرجى التمرير لأسفل للحصول على مزيد من المعلومات حول الخطوات الفردية لسير عمل Chip-Seq. يرجى الاتصال بنا هنا ، في حال كان لديك أي سؤال حول خدمتنا. نحن على يقين من أنه يمكننا إيجاد حل لأي مهمة إضافية قد تفكر فيها.
يرجى التمرير لأسفل للحصول على مزيد من المعلومات حول الخطوات الفردية لسير عمل RNA-Seq. يرجى الاتصال بنا هنا ، في حال كان لديك أي سؤال حول خدمتنا.

مراقبة الجودة ، قراءة التحضير والمواءمة

كما هو الحال مع تطبيقات NGS الأخرى ، فإن تقييم جودة ChIP-Seq للقراءات الأولية أمر بالغ الأهمية للتحليل الناجح لأي تجربة. نحن نستخدم أدوات مراقبة الجودة المستخدمة على نطاق واسع مثل FASTQ لمراقبة الجودة القياسية واتخاذ قرار بشأن تصفية أو قص القراءات الأولية. بالإضافة إلى ذلك ، فإننا نطبق خطوات تحكم محددة لـ ChIP-Seq مثل تقدير طول الجزء ، وهو أمر مهم لتقييم الجودة العام ولتحديد المعلمات الصحيحة لاستدعاء الذروة لاحقًا. ربما تكون محاذاة Chip-Seq التي تقرأ مع الجينوم هي أقل الأجزاء عرضة للخطأ في سير العمل ، ومع ذلك فإننا نتحقق دائمًا من البدائل ، في حالة إظهار المصفف القياسي الخاص بنا ناتجًا غير عادي. قبل الدخول إلى الخطوة التالية من سير العمل ، نقوم أيضًا بفحص البيانات المتوافقة (ملفات BAM) بشكل مرئي في مستعرض الجينوم.

القمم: الكشف ، الشرح ، التصفية

ذروة الاتصال هي الخطوة الأكثر أهمية في سير العمل. بناءً على نتائج تقييم الجودة ، نحدد بعناية المعلمات المطلوبة لخوارزمية ذروة الاستدعاء. يجب أن تحتوي هذه الخطوة ، ولكن لا يجب أن تحتوي على عنصر تحكم وهمي (التحكم في الإدخال أو الجسم المضاد). أثناء الخطوة يتم تطبيع كل من الشريحة والعينة الوهمية لبعضهما البعض. يتم التحكم بصريًا في قائمة الذروة الناتجة على مستوى الجينوم لما يقرب من مئات القمم المختارة عشوائيًا من القائمة. يرجى الاطلاع على الرسوم المتحركة بتنسيق GIF على اليمين كمثال لمائة قمة فقط. إذا كان كل شيء يبدو جيدًا ، يتم تصفية القائمة الأولية بناءً على القيم p للقمم وأيضًا على عدد القراءات لكل ذروة. وجدنا أن بعض المتصلين في ذروة التفاؤل مفرط في التفاؤل ، عند استخدام قيم p وحدها. يتم بعد ذلك شرح القائمة النهائية التي تمت تصفيتها بقاعدة البيانات الجينومية التي تختارها. قد يكون هذا ENSEMBL أو UCSC أو أي قاعدة بيانات جينومية خاصة بالأنواع. أخيرًا ، يتم استخدام القائمة المشروحة للقمم للتفسير البيولوجي وتحليل موقع الربط. في حال كان لديك مكررات تقنية أو بيولوجية ، يمكننا مقارنة القوائم. قد يكون هذا دمجًا بسيطًا لعينتين أو أكثر ، أو منطقًا أكثر تعقيدًا (في العينة 1 وفي العينة 2) أو في حالة وجود المزيد من التكرارات البيولوجية أيضًا التقييم الإحصائي للنتائج. تريد مقارنة نتائجك مع عينات مماثلة متاحة للجمهور. لا مشكلة على الإطلاق.

تحليل موقع ارتباط عامل النسخ والتفسير البيولوجي

ثم نقوم بتحليل أي نمط تسلسل أساسي موروث في تسلسل القمم لمواقع ربط عامل النسخ المحتمل. يعتمد هذا التحليل على نماذج ربط معروفة بالفعل لعوامل النسخ من مصادر قاعدة بيانات مختلفة ، ولكن أيضًا بحث عن عزر de-Novo الذي يسمح باكتشاف أشكال الربط غير المعروفة. نلخص مواقع الربط التي تم الحصول عليها فيما يتعلق بموقعها الجيني (exonic ، intronic ، intergenic ، Promoter & # 8230) وأيضًا فيما يتعلق بموقع بدء النسخ للجينات أو النصوص المعنية. إلى جانب ذلك ، نحن نضع النتائج في السياق البيولوجي. يمكن أن يكون هذا تقييمًا للتمثيل المفرط لفئات بيولوجية مميزة ذات صلة مثل المسارات أو فئات الجينات أو تكامل مع بيانات RNA-Seq الإضافية المتاحة. لديك المزيد من الأفكار للمعالجة المستمرة للنتائج. اتصل بنا ، بالتأكيد وجدنا حلاً للكائن الخاص بك.


شرح الكتاب

يعد تسلسل الكروماتين المناعي (ChIP-seq) ، الذي يرسم خرائط أنماط توطين الجينوم لعوامل النسخ والعلامات اللاجينية ، من بين الأساليب الأكثر استخدامًا في البيولوجيا الجزيئية. سيوجه الدليل العملي لتحليل بيانات ChIP-seq القراء من خلال خطوات تحليل ChIP-seq: من مراقبة الجودة ، من خلال ذروة الاتصال ، إلى التحليلات النهائية. سيساعد علماء الأحياء التجريبيين على تصميم تجارب ChIP-seq الخاصة بهم مع وضع التحليل في الاعتبار ، وتنفيذ خطوات التحليل الأساسية بأنفسهم. ويهدف أيضًا إلى دعم خبراء المعلومات الحيوية لفهم كيفية إنشاء البيانات ، وما هي مصادر التحيزات ، والطرق المناسبة للتحليلات المختلفة.


POSTDOC ، أخصائي علم الأحياء - NGS وتحليل بيانات تسلسل رقاقة في البيولوجيا الجزيئية والأورام وعلم الدم

يقدم معهد أمراض الدم وطب نقل الدم في وارسو ، بولندا ، منصبًا واحدًا بعد الدكتوراه في المؤسسة أو مشروع فريق العلوم البولندي "اكتشاف وتوصيف وظائف كيناز PIM غير الكنسي في الأورام اللمفاوية" ، تحت إشراف الأستاذ. Przemysław Juszczyński ، دكتوراه في الطب ، دكتوراه.

باستخدام الجينوميات الكيميائية وعلم الجينوميات ، نخطط لاستكشاف وظائف PIM المرتبطة بالكروماتين بالتفصيل في الورم اللمفاوي الأكثر شيوعًا عند البالغين ، وانتشار سرطان الغدد الليمفاوية B للخلايا الكبيرة (DLBCL). سوف ندرس دور كينازات PIM في التنظيم اللاجيني للنسخ في هذا المرض باستخدام الوراثة اللاجينية الوظيفية (epigenomics الرقاقة ، تسلسل الحمض النووي الريبي ، التحليلات التكاملية). بالإضافة إلى ذلك ، نخطط لتحديد عواقب طفرات PIM1 المتكررة عن طريق إجراء دراسات وظيفية وبروتينات فسفورية في الخلايا التي تعبر عن PIM1 متحولة.

معهد أمراض الدم وطب نقل الدم هو واحد من المؤسسات البحثية الرائدة في بولندا ومركز مرجعي لأمراض الدم. سيتم إجراء الدراسات في مجموعة ديناميكية شابة ، مما يوفر فرصًا للنشر الناجح لنتائج البحث. نحن نقدم فرص التطوير العلمي ، والتعاون مع المؤسسات البحثية الرائدة على الصعيدين الوطني والدولي والوصول إلى تقنيات البحث المتطورة.


نأمل أن يكون هذا البرنامج التعليمي قد أعطاك ذوقًا لما هو ممكن. هناك المزيد من الأدوات هناك لذا جرب! إذا لم تنجح الأمور - يمكنك تقديم شكوى باستخدام زر فتح الدردشة أدناه أو منتدى الدعم الخاص بنا.

  • البيانات
    • Reb1 ChIP-exo
    • بيانات الوصف
    • موقع البيانات
    • رسم الخرائط
    • الارتباط بين العينات
    • تقييم قوة الإشارة
    • إنشاء مجموعات بيانات BigWig
    • عرض مسارات التغطية في المستعرض
    • كيف يعمل MACS؟
    • البحث عن القمم
      • تقسيم البيانات إلى عينات فردية
      • تشغيل MACS2
      • ما هو في الإخراج؟
      • كم عدد القمم المشتركة بين التكرارات؟
      • لنلق نظرة على كل شيء في المتصفح
      • ما هي الأشكال المتسلسلة الموجودة داخل القمم
      • تلخيص تخصيب إشارة ChIP عبر جميع الجينات

      يتم دعم مشروع Galaxy جزئيًا من قبل NSF و NHGRI ومعاهد Huck لعلوم الحياة ومعهد العلوم الإلكترونية في ولاية بنسلفانيا وجامعة جونز هوبكنز.


      GPS 1.1 - دراسة تفاعل البروتين والحمض النووي باستخدام بيانات ChIP-Seq

      :: وصف

      GPS (نظام تحديد موقع الجينوم) هو أداة برمجية لدراسة تفاعل البروتين والحمض النووي باستخدام بيانات ChIP-Seq. يبني GPS نموذج خليط احتمالي للتنبؤ بالمواقع الأكثر احتمالية لأحداث الربط بدقة قاعدة واحدة.

      :: لقطات الشاشة

      :: المتطلبات

      :: معلومات اكثر

      يوشون جو ، جورجيوس باباكريستوديس ، روبرت سي ألتشولر ، جورج ك.جربر ، تومي إس جاكولا ، ديفيد ك جيفورد وأمبير شون ماهوني ،
      اكتشاف أحداث الارتباط المتماثل بدقة مكانية عالية.
      المعلوماتية الحيوية. 2010 ديسمبر 1526 (24): 3028-34. Epub 2010 21 أكتوبر.


      الاختيار الأمثل لقواعد بيانات عزر PWM وأساليب مسح التسلسل استنادًا إلى بيانات ChIP-seq

      خلفية: لسنوات عديدة حتى الآن ، تم وصف التفضيلات الملزمة لعوامل النسخ بما يسمى بالزخارف ، وعادة ما يتم تحديدها رياضيًا بواسطة مصفوفات وزن الموضع أو النماذج المماثلة ، بغرض التنبؤ بمواقع الربط المحتملة. ومع ذلك ، على الرغم من توفر الآلاف من نماذج النماذج في قواعد البيانات العامة والتجارية ، فإن الباحث الذي يرغب في استخدامها يترك مع العديد من الأساليب المتنافسة لتحديد مواقع الربط المحتملة في الجينوم محل الاهتمام ، وهناك القليل من المعلومات المنشورة بشأن أمثلية مختلف اختيارات. بفضل توفر عدد كبير من نماذج النماذج المختلفة بالإضافة إلى عدد من مجموعات البيانات التجريبية التي تصف الربط الفعلي لـ TFs في مئات أزواج TF-ChIP-seq ، شرعنا في إجراء تحليل شامل لهذه المسألة.

      نتائج: نحن نركز على مهمة تحديد مواقع ربط عامل النسخ المحتملة في الجينوم البشري. أولاً ، نقدم مقارنة شاملة لتغطية وجودة النماذج المتاحة في قواعد البيانات المختلفة ، مما يوضح أن قواعد البيانات العامة لها تغطية TFs قابلة للمقارنة وأداء أفضل من قواعد البيانات التجارية. ثانيًا ، نقارن بين ماسحات ضوئية مختلفة توضح أنه بغض النظر عن قاعدة البيانات المستخدمة ، فإن الأدوات التي طورها المجتمع العلمي تتفوق على الأدوات التجارية. ثالثًا ، نحسب لكل فكرة عتبة اكتشاف تعمل على تحسين دقة التنبؤ. أخيرًا ، نقدم مقارنة متعمقة للطرق المختلفة لاختيار العتبات لجميع الأشكال مسبقًا. والمثير للدهشة أننا أظهرنا أن اختيار معدل إيجابي خاطئ شائع يعطي نتائج أقل تحيزًا من خلال محتوى المعلومات للعنصر وبالتالي أكثر دقة بشكل موحد.


      شاهد الفيديو: خطة احترافية لدراسة علم وتحليل البيانات في 6 شهور فقط + المصادر. Data Science Studying Plan (يونيو 2022).


تعليقات:

  1. Fain

    موضوع لا مثيل له ، أنا أحب :)

  2. Jesper

    ما من أي وقت مضى.

  3. Goltigul

    ليس من دواعي سروري لك؟

  4. Kazrazuru

    موضوع لا يضاهى ، أحب))))



اكتب رسالة