معلومة

بيانات عن موضع الجينات في الجينوم البشري

بيانات عن موضع الجينات في الجينوم البشري


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أحاول الحصول على بعض البيانات حول موضع الجين في الجينوم البشري وأحتاج إلى بعض المساعدة

ما حاولت

لقد قمت بتنزيلهاftp://ftp.sanger.ac.uk/pub/gencode/Gencode_human/release_18/gencode.v18.annotation.gtf.gz

أنا مهتم فقط بموضع الجينات ، لذلك احتفظت بالأعمدة الأولى فقط.

awk -F "." '{print $ 1}' /Users/remi/Downloads/gencode.v18.annotation.gtf >> HumanGenomePositions.txt

ستستغرق هذه العملية بضع دقائق. يحتوي الملف على معلومات حول موقع exon ونسخة. لقد قمت بتقسيم الجدول للحصول على الخطوط التي تتعلق بالجينات فقط

sed -i.bak '/ gene /! d' HumanGenomePositions.txt

بقي لدي 57445 إدخالاً. تم شرح 9872 بواسطة ENSEMBL و 47573 تم شرحه بواسطة HAVANA. لاحظ أن هناك تداخلًا جزئيًا بين الاثنين. وفقًا لـ Church et al. في عام 2009 ، هناك 19042 جينًا مشروحًا في الجينوم البشري (تم الإبلاغ عنها من أرقام bionumbers). من الواضح أن هناك شيئًا ما أخطأت فيه!

سؤال

هل يمكنك مساعدتي في الحصول على بيانات عن مواقع الجينات لدى البشر بتنسيق سهل (انظر أدناه)؟

بداية النهاية 15648 65487 129841 124984 ...

أوصي بالتصفية باستخدامنوع_نسخةقيمة من عمود الوصف. ما عليك سوىترميز البروتينالجينات. الآن لديك ما يقرب من 10 آلاف من الجينات الخادعة غير المعالجة ، حوالي 5 آلاف من الجينات المضادة للحساسية ، ~ 4K ميرنا ، ~ 7 كيلو لينك آرنا وأكثر من ثلاثين فئة أخرى من الأشياء الكاذبة غير المعالجة.

بقدر ما أعرف أن الإصدار الحالي لـ GRCh37 هو الإصدار التاسع عشر وليس 18.


التطبيع الدقيق لبيانات RT-PCR الكمية في الوقت الفعلي عن طريق المتوسط ​​الهندسي لجينات التحكم الداخلي المتعددة

خلفية: يعد تحليل التعبير الجيني ذا أهمية متزايدة في البحث البيولوجي ، حيث أصبح النسخ العكسي في الوقت الحقيقي PCR (RT-PCR) هو الطريقة المفضلة لتحديد معدل إنتاجية عالية ودقيقة للتعبير عن الجينات المختارة. نظرًا للحساسية المتزايدة وقابلية التكاثر والنطاق الديناميكي الكبير لهذه المنهجية ، أصبحت متطلبات جين التحكم الداخلي المناسب للتطبيع أكثر صرامة. على الرغم من أنه تم الإبلاغ عن اختلاف التعبير الجيني التدبير المنزلي بشكل كبير ، لم يحدد أي مسح منهجي الأخطاء المتعلقة بالممارسة الشائعة لاستخدام جين تحكم واحد فقط ، ولم يقدم طريقة مناسبة لحل هذه المشكلة.

نتائج: نحدد استراتيجية قوية ومبتكرة لتحديد جينات التحكم الأكثر ثباتًا في مجموعة معينة من الأنسجة ، ولتحديد الحد الأدنى لعدد الجينات المطلوبة لحساب عامل تطبيع موثوق. لقد قمنا بتقييم عشرة جينات تدبير منزلي من فئات وفرة وظيفية مختلفة في أنسجة بشرية مختلفة ، وأظهرنا أن الاستخدام التقليدي لجين واحد للتطبيع يؤدي إلى أخطاء كبيرة نسبيًا في نسبة كبيرة من العينات التي تم اختبارها. تم التحقق من صحة الوسط الهندسي للعديد من جينات التدبير المنزلي المختارة بعناية كعامل تطبيع دقيق من خلال تحليل بيانات المصفوفات الدقيقة المتاحة للجمهور.

الاستنتاجات: تعد استراتيجية التطبيع المقدمة هنا شرطًا أساسيًا للتنميط الدقيق لتعبير RT-PCR ، والذي ، من بين أمور أخرى ، يفتح إمكانية دراسة الأهمية البيولوجية لاختلافات التعبير الصغيرة.


الأرقام

يوفر تحديد إشارات الاختيار الإيجابي الحديث للغاية معلومات حول تكيف الإنسان الحديث مع الظروف المحلية. نُبلغ هنا عن مسح على مستوى الجينوم بحثًا عن إشارات الاختيار الإيجابي الحديث جدًا لصالح المتغيرات التي لم تصل بعد إلى التثبيت. نصف طريقة تحليلية جديدة لمسح بيانات تعدد أشكال النوكليوتيدات المفردة (SNP) لإشارات الاختيار الأخير ، وتطبيق ذلك على البيانات من مشروع HapMap الدولي. في المجموعات القارية الثلاث ، نجد إشارات واسعة النطاق للاختيار الإيجابي الأخير. معظم الإشارات خاصة بالمنطقة ، على الرغم من مشاركة فائض كبير عبر المجموعات. على عكس بعض الدراسات السابقة ذات الدقة المنخفضة التي أشارت إلى ندرة الاختيار الأخير في الأفارقة جنوب الصحراء الكبرى ، وجدنا أنه من خلال بعض المقاييس ، فإن أقوى إشارات الاختيار لدينا هي من سكان اليوروبا. أخيرًا ، نظرًا لأن هذه الإشارات تشير إلى وجود متغيرات جينية لها لياقة مختلفة اختلافًا جوهريًا ، فيجب أن تشير إلى المواقع التي تعد مصدر تباين كبير في النمط الظاهري. على الرغم من أن الأنماط الظاهرية ذات الصلة غير معروفة بشكل عام ، إلا أن هذه المواقع يجب أن تكون ذات أهمية خاصة في رسم خرائط دراسات السمات المعقدة. لهذا الغرض ، قمنا بتطوير مجموعة من SNPs التي يمكن استخدامها لتمييز أقوى إشارات 250 للاختيار الأخير في كل مجموعة.

الاقتباس: Voight BF ، Kudaravalli S ، Wen X ، Pritchard JK (2006) خريطة للاختيار الإيجابي الأخير في الجينوم البشري. بلوس بيول 4 (3): e72. https://doi.org/10.1371/journal.pbio.0040072

محرر أكاديمي: لورنس هيرست ، جامعة باث ، المملكة المتحدة

تم الاستلام: 10 نوفمبر 2005 وافقت: 10 يناير 2006 نشرت: 7 مارس 2006

حقوق النشر: © 2006 فويت وآخرون. هذا مقال مفتوح الوصول يتم توزيعه بموجب شروط ترخيص Creative Commons Attribution License ، والذي يسمح بالاستخدام غير المقيد والتوزيع والاستنساخ بأي وسيلة ، بشرط ذكر المؤلف الأصلي والمصدر.

التمويل: تم دعم مشروعنا بـ RO1 HG002772–1. كما تلقت BFV دعمًا جزئيًا من 1 ريال عماني DK55889 إلى نانسي كوكس.

تضارب المصالح: وقد أعلن الباحثون إلى أن لا المصالح المتنافسة موجودة.

الاختصارات: ASN ، شرق آسيا (ق) CEU ، شمال وغرب أوروبا (ق) EHH ، تماثل الزيجوت الفرداني الممتد iHH ، EHH iHS المتكامل ، درجة النمط الفرداني المتكامل SNP ، تعدد الأشكال النوكليوتيد الفردي YRI ، اليوروبا

ملاحظة تصحيح: بسبب خطأ في التنضيد ، تم عرض الرمز "" بشكل غير صحيح كـ "s" في وسائل إيضاح الأشكال 1 و 2 و 3. تصحيحه في 3/6/06


أول نظرة شاملة لكيفية عمل الجينوم البشري في الواقع: تنتج دراسة ENCODE مجموعة بيانات ضخمة

أنتج مشروع الجينوم البشري ترتيبًا شبه كامل لثلاثة مليارات زوج من الأحرف الكيميائية في الحمض النووي التي تجسد الشفرة الوراثية البشرية - ولكن القليل عن طريقة عمل هذا المخطط. الآن ، بعد جهد متضافر لعدة سنوات من قبل أكثر من 440 باحثًا في 32 مختبرًا حول العالم ، تعطي الصورة الأكثر ديناميكية أول نظرة شاملة لكيفية قيام الجينوم البشري بوظيفته بالفعل.

خلال الدراسة الجديدة ، ربط الباحثون أكثر من 80 في المائة من تسلسل الجينوم البشري بوظيفة بيولوجية محددة ورسموا خرائط لأكثر من 4 ملايين منطقة تنظيمية حيث تتفاعل البروتينات على وجه التحديد مع الحمض النووي. تمثل هذه النتائج تقدمًا كبيرًا في فهم الضوابط الدقيقة والمعقدة على التعبير عن المعلومات الجينية داخل الخلية. تُبرز النتائج تركيزًا أكثر حدة على الجينوم النشط باستمرار حيث تعمل البروتينات بشكل روتيني على تشغيل الجينات وإيقافها باستخدام مواقع تكون أحيانًا على مسافات كبيرة من الجينات نفسها. كما أنهم يحددون أين تؤثر التعديلات الكيميائية للحمض النووي على التعبير الجيني وأين تساعد الأشكال الوظيفية المختلفة للحمض النووي الريبي ، وهو شكل من أشكال الحمض النووي المرتبط بالحمض النووي ، في تنظيم النظام بأكمله.

"خلال المناقشات المبكرة حول مشروع الجينوم البشري ، توقع الباحثون أن نسبة قليلة فقط من تسلسل الجينوم البشري قامت بتشفير البروتينات ، وأحصنة عمل الخلية ، وأن الباقي كان خردة. نحن نعلم الآن أن هذا الاستنتاج كان خاطئًا ،" قال إريك د. جرين ، دكتوراه في الطب ، دكتوراه ، مدير المعهد القومي لبحوث الجينوم البشري (NHGRI) ، وهو جزء من المعاهد الوطنية للصحة. "كشفت ENCODE أن معظم الجينوم البشري متورط في تصميم الرقص الجزيئي المعقد المطلوب لتحويل المعلومات الجينية إلى خلايا وكائنات حية."

نظمت المؤسسة الوطنية لحقوق الإنسان مشروع البحث الذي ينتج هذه النتائج ويسمى Encyclopedia اF دغير متوفر هlements أو التشفير. تم إطلاق هدف ENCODE في عام 2003 ، المتمثل في تحديد جميع العناصر الوظيفية للجينوم ، والذي بدا شاقًا تمامًا مثل تسلسل الجينوم البشري الأول. تم إطلاق ENCODE كمشروع تجريبي لتطوير الأساليب والاستراتيجيات اللازمة لتحقيق النتائج وفعل ذلك من خلال التركيز على 1٪ فقط من الجينوم البشري. بحلول عام 2007 ، خلصت المؤسسة الوطنية لحقوق الإنسان إلى أن التكنولوجيا قد تطورت بشكل كاف لمشروع واسع النطاق ، استثمر فيه المعهد ما يقرب من 123 مليون دولار على مدى خمس سنوات. بالإضافة إلى ذلك ، خصصت المؤسسة الوطنية لحقوق الإنسان حوالي 40 مليون دولار لمشروع ENCODE التجريبي ، بالإضافة إلى ما يقرب من 125 مليون دولار لتطوير التكنولوجيا ذات الصلة بـ ENCODE وبحوث الكائنات الحية النموذجية منذ عام 2003.

كان حجم الجهد ملحوظًا. أجرى مئات الباحثين عبر الولايات المتحدة والمملكة المتحدة وإسبانيا وسنغافورة واليابان أكثر من 1600 مجموعة من التجارب على 147 نوعًا من الأنسجة بتقنيات موحدة عبر الاتحاد. اعتمدت التجارب على الاستخدامات المبتكرة لتقنيات تسلسل الحمض النووي من الجيل التالي ، والتي أصبحت متاحة فقط منذ حوالي خمس سنوات ، ويرجع ذلك في جزء كبير منه إلى التقدم الذي أتاحه برنامج تطوير تكنولوجيا تسلسل الحمض النووي التابع للمؤسسة الوطنية لحقوق الإنسان. في المجموع ، أنتج برنامج ENCODE أكثر من 15 تريليون بايت من البيانات الأولية واستهلك ما يعادل أكثر من 300 عام من وقت الكمبيوتر في التحليل.

قال إيوان بيرني ، دكتوراه ، من المعهد الأوروبي للمعلوماتية الحيوية ، في المملكة المتحدة ، ومنسق التحليل الرئيسي لمشروع ENCODE: "لقد قطعنا شوطًا طويلاً". "من خلال تجميع مجموعة متنوعة مذهلة من البيانات معًا بعناية ، أظهرنا أن الجينوم البشري هو ببساطة على قيد الحياة بمفاتيح تشغيل وإيقاف تشغيل جيناتنا والتحكم في وقت ومكان إنتاج البروتينات. المستوى التالي ، ويتم تقاسم كل تلك المعرفة بشكل علني ".

وضع اتحاد ENCODE مجموعات البيانات الناتجة بمجرد التحقق من دقتها ، قبل النشر ، في العديد من قواعد البيانات التي يمكن لأي شخص الوصول إليها بحرية على الإنترنت. يمكن الوصول إلى مجموعات البيانات هذه من خلال بوابة مشروع ENCODE (www.encodeproject.org) وكذلك في جامعة كاليفورنيا ، متصفح جينوم سانتا كروز ، http://genome.ucsc.edu/ENCODE/ ، المركز الوطني للتكنولوجيا الحيوية المعلومات ، http://www.ncbi.nlm.nih.gov/geo/info/ENCODE.html والمعهد الأوروبي للمعلومات الحيوية ، http://useast.ensembl.org/Homo_sapiens/encode.html؟redirect=mirrorsource=www .ensembl.org.

قالت إليز فينجولد ، دكتوراه ، مديرة برنامج NHGRI التي ساعدت في بدء مشروع ENCODE: "إن كتالوج ENCODE يشبه خرائط Google للجينوم البشري". "ببساطة عن طريق تحديد نسبة التكبير في خرائط Google ، يمكنك مشاهدة البلدان والولايات والمدن والشوارع وحتى التقاطعات الفردية ، ومن خلال تحديد ميزات مختلفة ، يمكنك الحصول على الاتجاهات ومشاهدة أسماء الشوارع والصور والحصول على معلومات حول حركة المرور وحتى الطقس . تسمح خرائط ENCODE للباحثين بفحص الكروموسومات والجينات والعناصر الوظيفية والنيوكليوتيدات الفردية في الجينوم البشري بنفس الطريقة. "

تتضمن مجموعة النشر المنسقة ورقة تكاملية رئيسية واحدة وخمس أوراق بحثية ذات صلة في المجلة طبيعة سجية 18 ورقة في أبحاث الجينوم وست أوراق في بيولوجيا الجينوم. تعد بيانات ENCODE معقدة للغاية لدرجة أن المجلات الثلاث طورت طريقة رائدة لتقديم المعلومات في شكل متكامل يسمونه الخيوط.

قالت ماجدالينا سكيبر ، دكتوراه ، محررة أولى في شركة ENCODE: "نظرًا لأن برنامج ENCODE أنتج الكثير من البيانات ، فقد قدمنا ​​، جنبًا إلى جنب مع ENCODE Consortium ، طريقة جديدة لتمكين الباحثين من التنقل عبر البيانات". طبيعة سجية، التي أنتجت منصة النشر المتاحة مجانًا على الإنترنت.

نظرًا لأن الموضوعات نفسها تم تناولها بطرق مختلفة في أوراق مختلفة ، فإن موقع الويب الجديد www.nature.com/encode سيسمح لأي شخص بمتابعة موضوع من خلال جميع الأوراق في مجموعة منشورات ENCODE من خلال النقر على الموضوع ذي الصلة في صفحة مستكشف Nature ENCODE. على سبيل المثال ، يجمع الخيط الأول الأشكال والجداول والنصوص ذات الصلة بالتنوع الجيني والمرض من عدة أوراق ويعرضها جميعًا في صفحة واحدة. يعتقد علماء ENCODE أن هذا سوف يلقي الضوء على العديد من الموضوعات البيولوجية الناشئة عن التحليلات.

بالإضافة إلى الأوراق المترابطة ، يتم نشر ستة مقالات مراجعة في مجلة الكيمياء البيولوجية واثنين من الأوراق ذات الصلة في علم وواحد في زنزانة.

أصبحت بيانات ENCODE بسرعة موردًا أساسيًا للباحثين للمساعدة في فهم علم الأحياء والأمراض البشرية. تم نشر أكثر من 100 ورقة بحثية باستخدام بيانات ENCODE بواسطة محققين لم يكونوا جزءًا من مشروع ENCODE ، لكنهم استخدموا البيانات في أبحاث الأمراض. على سبيل المثال ، ارتبطت العديد من مناطق الجينوم البشري التي لا تحتوي على جينات ترميز البروتين بالمرض. بدلاً من ذلك ، يبدو أن التغيرات الجينية المرتبطة بالمرض تحدث في مساحات شاسعة من التسلسل بين الجينات حيث حدد ENCODE العديد من المواقع التنظيمية. ستكون هناك حاجة إلى مزيد من الدراسة لفهم كيفية مساهمة متغيرات معينة في هذه المجالات الجينومية في المرض.

قال مايك بازين ، دكتوراه ، مدير برنامج NHGRI يعمل على ENCODE: "لقد فوجئنا بأن المتغيرات الجينية المرتبطة بالأمراض ليست في مناطق ترميز البروتين". "نتوقع أن نجد أن العديد من التغييرات الجينية المسببة للاضطراب تقع داخل المناطق التنظيمية ، أو المفاتيح ، التي تؤثر على كمية البروتين التي يتم إنتاجها أو عندما يتم إنتاج البروتين ، بدلاً من التأثير على بنية البروتين نفسه. ستحدث الحالة الطبية بسبب تم تشغيل الجين أو إيقاف تشغيله بشكل شاذ أو تصنيع كميات غير طبيعية من البروتين. وبعيدًا عن كونه دنا غير مرغوب فيه ، من الواضح أن هذا الحمض النووي التنظيمي يقدم مساهمات مهمة في صحة الإنسان والمرض ".

سيساعد تحديد المناطق التنظيمية الباحثين أيضًا على تفسير سبب اختلاف خصائص الخلايا المختلفة. على سبيل المثال ، لماذا تولد خلايا العضلات القوة بينما تكسر خلايا الكبد الطعام؟ يعلم العلماء أن الخلايا العضلية تقوم بتشغيل بعض الجينات التي تعمل فقط في العضلات ، ولكن لم يكن من الممكن في السابق فحص العناصر التنظيمية التي تتحكم في هذه العملية. وضع ENCODE الأساس لهذه الأنواع من الدراسات من خلال فحص أكثر من 140 نوعًا من مئات أنواع الخلايا الموجودة في جسم الإنسان وتحديد العديد من عناصر التحكم الخاصة بنوع الخلية.

على الرغم من ضخامة مجموعة البيانات الموضحة في هذه المجموعة التاريخية من المنشورات ، إلا أنها لا تصف بشكل شامل جميع العناصر الجينومية الوظيفية في جميع أنواع الخلايا المختلفة في جسم الإنسان. تخطط المؤسسة الوطنية لحقوق الإنسان للاستثمار في أبحاث إضافية متعلقة بـ ENCODE لمدة أربع سنوات أخرى على الأقل. خلال المرحلة التالية ، سيزيد ENCODE من عمق الكتالوج فيما يتعلق بأنواع العناصر الوظيفية وأنواع الخلايا التي تمت دراستها. كما ستعمل على تطوير أدوات جديدة لتحليلات أكثر تعقيدًا للبيانات.


معهد بحوث الخلق

تم الإبلاغ عن المسودات الأولية للجينوم البشري في عام 2001 (واحدة في القطاع الخاص وواحدة في القطاع العام). 1-2 منذ ذلك الحين ، وبعد 20 عامًا من البحث المكثف الذي تم إجراؤه عالميًا ، كشفت البيانات عن ثروة من التعقيد الذي أزعج تمامًا جميع المفاهيم الخاطئة التطورية الأصلية. 3 الأهم من ذلك ، أن النموذج التطوري الخاطئ لـ & ldquojunk DNA & rdquo قد تم فضحه تمامًا لصالح نموذج جديد ، نموذج يحتوي على وظائف منتشرة وتعقيد الشبكة. إن حقيقة هذا التعقيد الذي لا ينتهي على ما يبدو بدأت للتو في الكشف عنها وحقيقة مدشان غير مريحة تشير مباشرة إلى خالق كلي القدرة.

قصة غلاف حديثة في المجلة طبيعة سجية لخص بإيجاز السنوات العشرين الماضية منذ أن وصلت المنشورات الأصلية مع المسودات الأولى للجينوم البشري إلى الصحافة. 3 عندما اكتملت المرحلة الأولى من البحث في عام 2001 ، وجد مبدئيًا أن الجينوم يحتوي على حوالي 25000 جينة ترميز بروتينية وأن أجزاء الترميز الفعلية لهذه الجينات تمثل حوالي 2 ٪ فقط من إجمالي تسلسل الحمض النووي. وجد العديد من أنصار التطور تأكيدًا في هذه التقارير الأولية. كان هذا لأن النموذج المحايد للنظرية التطورية توقع أنه يجب أن تكون هناك مناطق شاسعة من الجينوم البشري في طي النسيان التطوري (يُطلق عليه & ldquojunk DNA & rdquo). عندئذٍ ، ستنتج هذه المناطق غير الوظيفية المزعومة جينات جديدة بشكل عشوائي لتختارها الطبيعة بطريقة سحرية. 4-5 وغني عن القول ، أن هذه التكهنات التطورية المضللة لم تدم طويلاً.

منذ عام 2001 ، أثبتت العديد من المشاريع البحثية أن هذه المناطق المجهولة والغامضة من الجينوم البشري لم تكن خردة على الإطلاق. بدلا من ذلك ، كانت حيوية للحياة والصحة الجيدة. في قسم فرعي من الجديد طبيعة سجية مقال بعنوان & quotNotNot ، & quot يقول المؤلفان ، & quot مع مشروع HGP [مشروع الجينوم البشري] في متناول اليد ، انفجر اكتشاف العناصر غير المشفرة للبروتين. حتى الآن ، تجاوز هذا النمو اكتشاف جينات ترميز البروتين بعامل خمسة ، ولا يظهر أي علامات على التباطؤ. & quot في الجينوم البشري لا تشفر البروتينات. بدلاً من ذلك ، تعمل عناصر مثل RNAs الطويلة غير المشفرة والمحفزات والمعززات والعناصر التي لا حصر لها لتنظيم الجينات معًا لإعادة الجينوم إلى الحياة. & quot

يمكن تلخيص النقاط الرئيسية في العشرين عامًا الماضية من البحث حول الجينوم البشري على النحو التالي:

1) الجينوم البشري هو مخزن كامل للمعلومات المهمة ، وهذه الحقيقة تنفي مفهوم الحمض النووي غير المرغوب فيه.

2) جينات ترميز البروتين هي إلى حد كبير مجموعة أساسية من التعليمات ضمن ذخيرة معقدة وأكبر من تسلسل الحمض النووي التنظيمي.

3) يوجد العديد من الجينات (مقارنة بجينات ترميز البروتين) التي ترمز لجزيئات الحمض النووي الريبي الوظيفية التي لا تُستخدم في صنع البروتينات ، ولكنها تؤدي وظائف أخرى في الخلية.

4) يوجد عدد كبير من المفاتيح التنظيمية وميزات التحكم في الجينوم البشري الذي ينظم وظيفته.

التصميم الشامل والمعقد للجينوم البشري هو بالضبط ما تم استخلاصه من الكتاب المقدس. بعد كل شيء ، يقول الكتاب المقدس في مزمور 139: 14 ، "سأحمدك ، لأني صنعت رائعة بشكل رائع ومخيف هي أعمالك ، وأن نفسي تعرف جيدًا".

مراجع
1. فنتر ، جي سي ، وآخرون. 2001. تسلسل الجينوم البشري. علم. 291(2001):1304-1351.
2. الاتحاد الدولي لتسلسل الجينوم البشري. 2001. التسلسل الأولي وتحليل الجينوم البشري. طبيعة سجية. 409(2001):860-921.
3. Alexander J. Gates، A.J.، D.M. Gysi و M. Kellis و AL Barab & aacutesi. 2021. ثروة من الاكتشافات مبنية على مشروع الجينوم البشري و [مدش] بالأرقام. طبيعة سجية. 590:212-215.
4. تومكينز ، دكتوراه. 2017. عبث الساعة التطورية. أعمال وحقائق أمبير. 46 (3).
5. تومكينز ، جي بي وجي بيرجمان. 2015. الساعات الجينية الجزيئية التطورية ومداشا ممارسة دائمة في العبث والفشل. مجلة الخلق. 29 (2): 26-35.

*الدكتور. تومكينز هو مدير الأبحاث في معهد أبحاث الخلق وحصل على الدكتوراه في علم الوراثة من جامعة كليمسون.


توقع الهياكل الجينية الكاملة في الحمض النووي الجيني البشري

نقدم نموذجًا احتماليًا عامًا للبنية الجينية لتسلسلات الجينوم البشري الذي يتضمن أوصافًا لإشارات النسخ والترجمة والربط الأساسية ، بالإضافة إلى توزيعات الطول والسمات التركيبية للإكسونات والإنترونات والمناطق بين الجينات. يتم اشتقاق مجموعات مميزة من معلمات النموذج لمراعاة الاختلافات الجوهرية العديدة في كثافة الجينات والبنية التي لوحظت في المناطق التركيبية المتميزة C + G من الجينوم البشري. بالإضافة إلى ذلك ، تم وصف نماذج جديدة لإشارات لصق المانح والمستقبل والتي تلتقط التبعيات المهمة المحتملة بين مواقع الإشارة. يتم تطبيق النموذج على مشكلة تحديد الجينات في برنامج الكمبيوتر ، GENSCAN ، الذي يحدد الهياكل الكاملة للإكسون / الإنترون للجينات في الحمض النووي الجيني. تتضمن الميزات الجديدة للبرنامج القدرة على التنبؤ بجينات متعددة في تسلسل ، والتعامل مع الجينات الجزئية وكذلك الكاملة ، والتنبؤ بمجموعات متسقة من الجينات التي تحدث على أي من سلاسل الحمض النووي أو كليهما. تبين أن GENSCAN لديها دقة أعلى بكثير من الطرق الحالية عند اختبارها على مجموعات معيارية من الجينات البشرية والفقارية ، مع تحديد 75 إلى 80 ٪ من exons بالضبط. البرنامج قادر أيضًا على الإشارة بدقة إلى حد ما إلى موثوقية كل exon المتوقع. تُلاحظ باستمرار مستويات عالية من الدقة لتسلسلات مختلفة محتوى C + G ولمجموعات متميزة من الفقاريات.


لماذا استغرق الأمر 20 عامًا؟

جزء كبير من المواد المتسلسلة حديثًا هو الجزء "غير المتجانس" من الجينوم ، وهو "معبأ بإحكام" أكثر من الجينوم متماثل اللون ويحتوي على العديد من المتواليات شديدة التكرار التي يصعب قراءتها بدقة.

كان يُعتقد في السابق أن هذه المناطق لا تحتوي على أي معلومات وراثية مهمة ، لكن من المعروف الآن أنها تحتوي على جينات تشارك في عمليات مهمة بشكل أساسي مثل تكوين الأعضاء أثناء التطور الجنيني. من بين 200 مليون زوج أساسي متسلسل حديثًا ، هناك ما يقدر بـ 115 جينًا يُتوقع أن تشارك في إنتاج البروتينات.

هناك عاملان رئيسيان جعل إكمال الجينوم البشري ممكنًا:

1. اختيار نوع خلية خاص جدًا

تم إنشاء تسلسل الجينوم المنشور حديثًا باستخدام خلايا بشرية مشتقة من نوع نادر جدًا من الأنسجة يسمى الخلد المائي الكامل ، والذي يحدث عندما تفقد البويضة المخصبة جميع المواد الوراثية التي ساهمت بها الأم.

تحتوي معظم الخلايا على نسختين من كل كروموسوم ، واحدة من كل والد وكل كروموسوم من الوالدين يساهم في تسلسل DNA مختلف. تحتوي الخلية المأخوذة من الخلد المائي الكامل على نسختين من كروموسومات الأب فقط ، والتسلسل الجيني لكل زوج من الكروموسومات متطابق. هذا يجعل تسلسل الجينوم الكامل أسهل بكثير في التجميع.

2. التقدم في تكنولوجيا التسلسل

بعد عقود من التقدم الجليدي ، حقق مشروع الجينوم البشري إنجازاته في عام 2001 من خلال الريادة في طريقة تسمى "تسلسل البندقية" ، والتي تضمنت تقسيم الجينوم إلى أجزاء صغيرة جدًا من حوالي 200 زوج قاعدي ، واستنساخها داخل البكتيريا ، وفك تشفير تسلسلها ، ثم إعادة تجميعها معًا مثل بانوراما عملاقة.

كان هذا هو السبب الرئيسي وراء تغطية المسودة الأصلية فقط للمناطق المتجانسة اللون من الجينوم - فقط هذه المناطق يمكن أن يتم تسلسلها بشكل موثوق باستخدام هذه الطريقة.

تم استنتاج أحدث تسلسل باستخدام تقنيتين جديدتين مكملتين لتسلسل الحمض النووي. تم تطوير واحد بواسطة PacBio ، ويسمح بتسلسل أجزاء الحمض النووي الأطول بدقة عالية جدًا. والثاني ، الذي طوره أكسفورد نانوبور ، ينتج امتدادات طويلة جدًا من تسلسل الحمض النووي المستمر. تتيح هذه التقنيات الجديدة لقطع المنشار أن تكون آلاف أو حتى ملايين أزواج القاعدة ، مما يجعل تجميعها أسهل.

المعلومات الجديدة لديها القدرة على تعزيز فهمنا لبيولوجيا الإنسان بما في ذلك كيفية عمل الكروموسومات والحفاظ على بنيتها. كما ستعمل على تحسين فهمنا للحالات الوراثية مثل متلازمة داون التي لها خلل في الكروموسومات.


شرح مفصل

يُظهر الرسم الجينوم البشري مشروحًا بالبيانات المتعلقة بالجينات المتورطة في المرض ، ومناطق الاختلاف الموجودة في مجموعات سكانية مختلفة ، ومناطق التشابه بين الكروموسومات.

24 كروموسومًا فرديًا (1..22 [كل موجود في أزواج في الجينوم] ، X ، Y) مرتبة بشكل دائري (ج)، ويمثلها المسمى (ج 3) الأيدوجرامات التي يتم عرض مقياس المسافة عليها (ج 1).

تظهر بعض الكروموسومات بمقاييس فيزيائية مختلفة لتوضيح النمط الغني للبيانات (chr2 3x chrs 18،19،20،21،22 2x chrs 3،7،17 10x). داخل كل إيديوغرام ، يتم عرض العصابات الوراثية الخلوية (ج 2). هذه ميزات واسعة النطاق مستخدمة في علم الوراثة الخلوية لتحديد التغييرات الإجمالية والإشارة إليها.

على الجزء الخارجي من الأيدوجرامات ، يتم تمثيل التباين الجينومي بين الأفراد والسكان بالمسارات (أ) و (ب). يتم عرض عدد المواقع المفهرسة التي لوحظت فيها تغييرات زوج القاعدة الفردي داخل السكان كرسم بياني (أ). يتم تمييز المناطق الكبيرة التي شوهدت تتنوع في الحجم وعدد النسخ بين الأفراد (ب).

يتم فرض مواقع الجينات المرتبطة بالمرض على الأيدوجرامات (د). (د 3) يوضح موقع الجينات المتورطة في السرطان (أحمر غامق جدًا) ، وأمراض أخرى (أحمر غامق) وجميع الجينات الأخرى (أحمر). (د 2) يُظهر مواقع الجينات المتورطة في سرطان الرئة والمبيض والثدي والبروستاتا والبنكرياس والقولون ، ملونة في ظل أحمر أغمق تدريجيًا. (D1) يشير إلى مواقع الجينات المتورطة في أمراض أخرى مثل الرنح والصرع والزرق وأمراض القلب واعتلال الأعصاب ، وتلون في ظل أغمق تدريجيًا باللون الأحمر ، وكذلك مرض السكري (البرتقالي) والصمم (الأخضر) ومرض الزهايمر (الأزرق).

خطوط رمادية (هـ) ربط المواضع على الأيدوجرامات المرتبطة بالجينات التي تشارك في نفس المسارات البيوكيميائية. يعكس ظل الرابط طبيعة الجين - يشير اللون الرمادي الداكن إلى أن الجين متورط في السرطان ، والرمادي في المرض ، والرمادي الفاتح لجميع الجينات الأخرى. روابط ملونة (F) قم بتوصيل مجموعة فرعية من أزواج المناطق الجينومية المتشابهة للغاية وتوضح المستوى العميق للتشابه بين المناطق الجينومية (حوالي 50٪ من الجينوم موجود فيما يسمى مناطق التكرار التي تظهر في الجينوم عدة مرات وفي مجموعة متنوعة من المواقع) .


بيولوجيا الجينوم في Genome Informatics

في بداية العام ، كنت أفكر في المؤتمرات التي حضرتها العام الماضي. كان أحد أبرز الأحداث هو Genome Informatics ، الذي ذهبت إليه في سبتمبر نيابة عن بيولوجيا الجينوم.

Genome Informatics هو مؤتمر سنوي يركز على الأساليب الحسابية لفهم بيولوجيا الجينوم. وهو يتناوب بين مركز مؤتمرات Wellcome Trust في Hinxton بالمملكة المتحدة ومختبرات Cold Spring Harbour ، نيويورك ، الولايات المتحدة الأمريكية. كان العام الماضي هو دور Hinxton ، لذلك ذهبت ، كما فعلت في المرات السابقة في المملكة المتحدة.

كان العرضان الرئيسيان من كاتي بولارد (جامعة كاليفورنيا سان فرانسيسكو ، الولايات المتحدة الأمريكية) ورافائيل إيريزاري (معهد دانا فاربر للسرطان ، بوسطن ، الولايات المتحدة الأمريكية). ناقش بولارد استخدام التعلم الآلي في أبحاث الجينوميات ، وعلى وجه الخصوص المشكلات التي يمكن أن تنشأ. أشارت إلى أنه لا ينبغي عليك استخدام بيانات التدريب المتوازنة إذا كانت المشكلة التي تبحث عنها غير متوازنة للغاية (أي بعض الإيجابيات والعديد من السلبيات مثل تحديد تسلسل المحفز) وأيضًا أن العديد من نماذج التعلم الآلي تفترض أن البيانات مستقلة وموزعة بشكل متماثل ، ولكن هذا ليس هو الحال إلى حد كبير مع بيانات الجينوم - ولكن مع ذلك ، على الرغم من احتمال انتهاك افتراضات النموذج ، لا يزال من الممكن الحصول على نتائج مفيدة.

الآن هناك المزيد من المحادثات التي تناقش علم الأحياء الذي كشفت عنه المعلوماتية بدلاً من الأساليب المعلوماتية نفسها.

تناول حديث إيريزاري أيضًا المشكلات في التحليل ، ولماذا لا يجب أن تثق بشكل أعمى في النتائج التي تحصل عليها. في بعض الأحيان ، يمكنك الحصول على فكرة جيدة إذا كانت نتائجك معقولة بمجرد النظر إلى البيانات. كان هذا موضوعًا مشتركًا في العديد من المحادثات. أعطى إيريزاري مثالاً لدراسة أفادت أن ربع الجينات المعبر عنها في الدم تم التعبير عنها بشكل تفاضلي بين مجموعتين من البشر. بدا هذا مرتفعًا بشكل غير معقول ، لذلك نظر فيه ووجد تأثيرًا دفعة من أخذ العينات من المجموعتين في مشروعين منفصلين.

في الإصدارات السابقة من هذا المؤتمر ، أخبرني الحاضرون كيف تغيرت منذ بدايتها - الآن هناك المزيد من المحادثات التي تناقش البيولوجيا التي كشفت عنها المعلوماتية بدلاً من الأساليب المعلوماتية نفسها. لم يكن هذا التكرار مختلفًا ، مع العديد من المحادثات حول تحليل أعداد كبيرة من جينومات السرطان للعثور على المتغيرات ، أو مجموعات كبيرة من الجينوم الشخصي للعثور على المتغيرات المرتبطة باضطرابات النمو. لتجاوز محاولة تحديد المتغيرات المرتبطة بحالة ما ، تحدث Sri Kosuri (جامعة كاليفورنيا ، لوس أنجلوس ، الولايات المتحدة الأمريكية) عن التجارب التي اختبر فيها الآلاف من SNPs لتأثيرها على التضفير في بنية جينية المراسل.

أحد الأحاديث عن علم الأحياء التي وجدتها مثيرة للاهتمام بشكل خاص كانت من لوسيا سبانجينبيرج (معهد باستور دي مونتيفيديو ، أوروغواي) ، التي كانت تحاول إعادة بناء جينوم شارواس ، السكان الأصليين في أوروغواي الذين تم إبادتهم في القرن التاسع عشر. وجد Spangenberg أن جينومات عشرة أوروغواي الحديثة فيما بينها تحتوي على ما يكفي من الحمض النووي لـ Charruan لتكون قادرة على إعادة بناء 99 ٪ من جينوم Charruan. بشكل عام ، كان السلالة الجينية الأصلية للناس أعلى من هويتهم الأصلية المبلغ عنها ذاتيًا.

ناقشت العديد من المحادثات كيف يمكن استخدام التقنيات الحديثة ، مثل التسلسل طويل القراءة من Pacific Biosciences ، والقراءات المرتبطة من 10x Genomics ، ومعلومات الاتصال بالجينوم من Hi-C ، لتحسين تجميعات الجينوم. ظهر هذا في مجموعة متنوعة من الأنظمة: الطيور (الكسندر سوه ، جامعة أوبسالا ، السويد) ، الحمير (نيكا كيفانفار ، 10x جينومكس ، الولايات المتحدة الأمريكية) ، والطحلب (سارة كاري ، جامعة فلوريدا ، الولايات المتحدة الأمريكية). أظهر جيفري كيد (جامعة ميشيغان ، الولايات المتحدة الأمريكية) أنه يمكن استخدام PacBio لإنتاج جينوم مرجعي للكلاب يكون أكثر اكتمالًا من الجينوم الأصلي المتسلسل باستخدام تقنية Sanger.

اتجاه واحد أثار فضولنا بشكل خاص بيولوجيا الجينوم كان العدد المتزايد من الطرق لتمثيل الجينوم في تنسيق رسم بياني ، مع عرض المتغيرات كفروع بديلة ، بدلاً من التمثيل المرجعي الخطي التقليدي. تم وصف هذا لكل من جينومات بدائية النواة (Rachel Colquhoun ، جامعة أكسفورد ، المملكة المتحدة) والجينومات حقيقية النواة (Prithicka Sritharan ، Quadram Institute Bioscience ، المملكة المتحدة). لقد وجدنا هذا مثيرًا للاهتمام ، حيث كنا نناقش هذا لفترة من الوقت ، وأصدرنا للتو دعوة لجمع المقالات حول جينومات الرسم البياني.

أخطط لحضور مؤتمر Genome Informatics لهذا العام في كولد سبرينج هاربور ، وسيكون من الرائع أن نرى كيف يؤثر الموقع المختلف ، مع مجموعة مختلفة من المندوبين ، على الإحساس والتركيز في المؤتمر. ومع ذلك ، فإن الأمر مختلف ، أتوقع أنه سيكون رائعًا بنفس القدر مثل مؤتمر العام الماضي.


الاستنتاجات

يقدم الإصدار الجديد من BiologicalNetworks وظائف واسعة لتحليل متكامل أكثر كفاءة وتصورًا للبيانات المتنوعة في دراسات الأنظمة البيولوجية المختلفة المتعلقة بالأمراض البشرية ، وتفاعلات المضيف والممرض ، و metagenomics ، والانقسام الاختزالي في الفطريات ، والتمثيل الغذائي الميكروبي ، وإعادة بناء التمثيل الغذائي للجينوم بأكمله في حقيقيات النوى وبدائيات النوى. تحتوي قاعدة بيانات BiologicalNetworks على بنية رسم بياني للأغراض العامة وهي محايدة من نوع البيانات ، وبالتالي هناك احتمال لمزيد من تكامل البيانات لمزيد من دراسات بيولوجيا الأنظمة الكاملة. إن تكامل مصادر المعلومات الإضافية المتعامدة ، مثل البيانات السريرية ، سيمكن من الارتباطات الكمية للمتغيرات السريرية مع أنشطة المسارات والعمليات الجزيئية. لقد أوضحنا أيضًا كيف يمكن استخدام BiologicalNetworks للعثور على شبكات تفاعل خاصة بمرض معين ، من خلال تطبيق التحليل متعدد المستويات للبيانات الدقيقة والتسلسل والتنظيمي وغيرها من البيانات.

إلى جانب التخصيص على مستوى اختيار طرق / أدوات التحليل في BiologicalNetworks ، لدى المستخدم خيار لتغيير معلمات كل طريقة على سبيل المثال ، تحديد مستوى التماثل في "Build Homology Wizard" عند بناء مجموعات من الجينات / البروتينات المتماثلة أو حدد مصادر البيانات وأنواع التفاعلات والأنواع والقيم p في "Build Pathway Wizard". نقوم أيضًا بتخصيص BiologicalNetworks بإضافة ميزات وطرق وتنسيقات بيانات ومصادر جديدة باستمرار حسب طلبات المستخدمين.

To allow for the replication and comparison of the results presented in this work with other related analysis, all available demonstrated examples and data can be accessed in 'BMC Bioinformatics Demo Project', upon launching the BiologicalNetworks application. Additionally, the BiologicalNetworks Welcome Screen and front page of the web site contains a list of "driving" biological projects (for various species and types of analysis) which can be replicated by simply running the respective project.

BiologicalNetworks, along with the user Manual and Video tutorials and Quick Start Guide, is available at http://www.biologicalnetworks.org.


شاهد الفيديو: تقنية كريسبر وتعديل جينات البشر بشكل مخيف (قد 2022).


تعليقات:

  1. Gilli

    على نحو فعال؟

  2. Claybourne

    حسنا ، جدا ......

  3. Stefan

    أنا لا أتفق معك

  4. Boulboul

    سنقوم بجمعك على الإنترنت قاعدة بيانات للعملاء المحتملين

  5. Maurg

    تطوير الموضوع أكثر. من المثير للاهتمام معرفة التفاصيل !!!



اكتب رسالة