معلومة

عدد سكان الصقور والماكاي يعني الحساب والقيم الوراثية

عدد سكان الصقور والماكاي يعني الحساب والقيم الوراثية


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أقرأ الفصل السابع من Falconer and Mackay حيث يعطون صيغة لحساب متوسط ​​السكان باعتباره انحرافًا عن القيمة الوراثية متغايرة الزيجوت.

على سبيل المثال ، تخيل سمة أليل موضعية واحدة ، مع الأليلين $ A_1 $ و $ A_2 $ ، مع التكرارات المقابلة $ p $ و $ q $ ، والقيم الوراثية ($ theta $) من $ A_1A_1 = theta_ {1 ، 1} = 0.5 دولار ، $ A_1A_2 = theta_ {1،2} = 0.4 دولار ، و $ A_2A_2 = theta_ {2،2} = 0.3 دولار.

يتم إعطاء المتوسط ​​بواسطة

M $ = a_1 (p-q) + 2 pqd $

حيث $ a_1 $ هو الانحراف بين القيمة الوراثية لـ $ A_1 $ متجانسة الزيجوت والقيمة الوراثية متغايرة الزيجوت ، ولأن $ d = 0 $ (انحراف السيادة) ، تقلل هذه المعادلة إلى

مليون دولار = a_1 (ف ف) دولار

على سبيل المثال أعلاه ، إذا كان $ p = 0.7 $ ، فإن $ M = 0.04 $ ومتوسط ​​السكان يجب أن يكون

$ frac {1} {2} theta_ {1،1} + frac {1} {2} theta_ {2،2} + M = 0.44 $

$ frac {1} {2} theta_ {1،2} + M = 0.44 دولار

هل هذا صحيح؟

ما هو المصطلح الصحيح والترميز للقيم الوراثية (التي أطلق عليها $ theta $)


دلالات الاختلاف بين قيم التربية الحقيقية والمتوقعة لدراسة الانتقاء الطبيعي والتطور الجزئي

إن القدرة على التنبؤ بقيم التربية الفردية في التجمعات الطبيعية ذات النسب المعروفة قد وفرت أداة قوية لفصل القيم المظهرية إلى مكوناتها الوراثية والبيئية في بيئة غير تجريبية. وقد أتاح ذلك إجراء تحليلات معقدة للاختيار ، فضلاً عن الاختبارات القوية للتغير التطوري والتمايز. حتى الآن ، ومع ذلك ، لم يكن هناك أي تقييم لموثوقية أو القيود المحتملة لهذا النهج. في هذا المقال ، أعالج هذه الثغرات. على وجه الخصوص ، أؤكد على الاختلافات بين قيم التربية الحقيقية والمتوقعة (PBVs) ، والتي تم تجاهلها إلى حد كبير حتى الآن. ومع ذلك ، فإن هذه الاختلافات لها آثار مهمة على تفسير ، أولاً ، العلاقة بين PBVs واللياقة ، وثانيًا ، الأنماط في PBVs بمرور الوقت. قدمت لاحقًا إرشادات أعتقد أنها ضرورية في صياغة الأسئلة التي تم تناولها في الدراسات باستخدام PBVs ، وأنا أناقش إمكانيات البحث في المستقبل.


الملخص

يعد الفهم الأفضل للتحكم الجيني للصفات في عشائر التربية أمرًا حاسمًا لاختيار الأصناف المتفوقة والآباء. هدفت هذه الدراسة إلى تقييم المعلمات الجينية وقيم التربية لست سمات أساسية في يام غينيا البيضاء (Dioscorea rotundata Poir.) تربية السكان. لهذا الغرض ، تم استخدام أفضل تنبؤ خطي غير متحيز قائم على النسب (P-BLUP). كشفت النتائج عن تباينات جينية غير إضافية ذات دلالة إحصائية وتقديرات تراثية ذات معنى واسع (.45 - .79) متوسطة إلى عالية (.45 - .79) للصفات المدروسة. يشير نمط الارتباطات بين القيم الجينية للسمات إلى أن الانتقاء على أساس مؤشر اختيار الصفات المتعددة لديه القدرة على تحديد سلالات التربية المتفوقة. تم التنبؤ بقيم التربية الأبوية باستخدام أداء النسل التي حددت 13 نسخة ذات إمكانات وراثية عالية للتحسين المتزامن للصفات المقاسة في برنامج تربية اليام. تم تحديد مجموعات فرعية من النسل للتزاوج أو المزيد من اختبارات التنوع بناءً على القيم الوراثية المضافة والقيم الوراثية الكلية. أظهر اختيار السلالات الخمسة الأولى على أساس مؤشر متعدد الصفات مكاسب وراثية موجبة لمحصول الدرنات الطازجة (طن هكتار) ، محصول الدرنات (كجم نبات 1) ، ومتوسط ​​وزن الدرنات (كجم). ومع ذلك ، فإن الكسب الجيني كان سلبيا لمحتوى المادة الجافة الدرنية و فيروس فسيفساء اليام المقاومة بالمقارنة مع الأصناف القياسية. تُظهر نتائجنا أهمية P-BLUP في اختيار الحيوانات المستنسخة الأبوية المتفوقة والأسلاف ذات القيم التناسلية الأعلى للتزاوج والقيمة الوراثية الأعلى لتطوير الأصناف في اليام.

الاختصارات


نتائج

في هذا القسم ، نستخدم البيانات التجريبية والمحاكاة لنموذج اللعبة لإظهار أن معظم تقديرات التوريث المستعارة من علم الوراثة الكمي الكلاسيكي معرضة لتحيز كبير ، لأنها تتجاهل أو تنمذج بشكل غير دقيق التغيير في التشابه بين شركاء الإرسال الناجم عن الداخل. - تطور المضيف للممرض. استنادًا إلى محاكاة نموذج اللعبة ، نحدد الارتباط داخل الصف في أقرب أزواج النشوء والتطور (CPPs) والتوريث النشئي ، H OU 2 (t ¯) ⁠ ، المقاس بنموذج Ornstein – Uhlenbeck المختلط (POUMM) (Mitov and Stadler 2016 Blanquart et al. 2017) كأكثر التقديرات موثوقية لوراثة سمة الممرض. بناءً على تطبيق هذه المقدرات على مجموعة كبيرة من فيروس العوز المناعي البشري ، فإننا نؤسس حدًا أدنى للإرث lg (spVL).

من خلال بقية المقال ، نستخدم الرمز داي جاي للدلالة على المسافة التطورية بين نصيحتين ، أنا و ي، على شجرة الإرسال (الشكل 1). داي جاي يلخص المسافة التطورية الإجمالية بين مضيفين مصابين في لحظة قياس قيمة السمة ويتم قياسها بالبدائل لكل موقع للأشجار الحقيقية والوحدات الزمنية العشوائية للأشجار المحاكاة. نبدأ تقريرنا بنتيجة من بيانات فيروس نقص المناعة البشرية التي توضح أهمية التطور داخل المضيف لتقدير التوريث.

يتناقص ارتباط lg (spVL) في أزواج النشوء والتطور لفيروس العوز المناعي البشري مع داي جاي

استخدمنا تحليل التباين أحادي الاتجاه (ANOVA ، صأ) وعلاقة سبيرمان (صSp) لتقدير الارتباط في أزواج النشوء والتطور (PP) المستخرجة من شجرة انتقال تم نشرها مؤخرًا لـ 8483 مريضًا بفيروس نقص المناعة البشرية (Hodcroft et al. 2014). كما هو محدد في Shirreff et al. (2013) ، تمثل أزواج النشوء والتطور أزواجًا من النصائح في شجرة النقل الأقرب بشكل متبادل لبعضها البعض من خلال مسافة النشوء والتطور (داي جاي) ( رسم بياني 1). لقد طلبنا PPs بواسطة داي جاي وقسمهم إلى عشر طبقات متساوية الحجم (عشري) ، وتقييم الارتباط بين قيم سمات الزوج (صأ و صSp) في كل طبقة. يتم عرض تقديرات النقاط وفواصل الثقة 95٪ (CI) بنقاط سوداء وأرجوانية وأشرطة خطأ في الشكل 3. تشير الأشرطة الأفقية المتقطعة إلى 95٪ CI لـ صأ تقييمها على جميع أزواج النشوء والتطور. على الرغم من بعض المخالفات ، هناك نمط واضح من الانحلال في الارتباط - طبقات إلى اليسار (صغيرة داي جاي) تميل إلى أن تكون أعلى صأ القيم من الطبقات إلى اليمين (كبير داي جاي). قيم صأ تتطابق بشكل وثيق مع القيم من مقدرات الارتباط الأخرى ، مثل DR (ب) ومنتج بيرسون يعني الارتباط (ص) (النتائج غير معروضة). أجرينا انحدارات المربعات الصغرى العادية (OLS) للقيم r A و D k و r Sp و D k على متوسط ​​مسافة النشوء والتطور ، d i j ، k ¯ ⁠ ، في كل طبقة ، k = 1 ، ... ، 10 ⁠. كانت منحدرات كلا الانحدار سلبية بشكل ملحوظ (ص& lt0.05) وتظهر كخطوط سوداء وأرجوانية في الشكل 3. تم الحصول على منحدرات مماثلة عند استخدام طبقات أخرى من البيانات (الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت).

الارتباط بين قيم lg (spVL) في أزواج النشوء والتطور لفيروس العوز المناعي البشري. تظهر عينة من 1917 PPs مع قياسات lg (spVL) من مرضى فيروس نقص المناعة البشرية انخفاضًا في الارتباط (ICC) بين قيم السمات الزوجية كدالة لمسافة النشوء والتطور الزوجي داي جاي. يتم وصف تقديرات النقاط و 95٪ من مجالات الموثوقية في عشر طبقات متساوية الحجم (عشري) كنقاط وأشرطة خطأ موضوعة عند المتوسط داي جاي لكل طبقة ، d i j ¯ ⁠. تشير النقاط السوداء والأرجوانية مع أشرطة الخطأ إلى المقدرة صأ و صSp في البيانات الحقيقية. تشير الأشرطة الأفقية المتقطعة إلى 95٪ CI لـ صأ تقييمها على جميع أزواج النشوء والتطور. يشير الخط المائل الأسود والأرجواني إلى الانحدار الخطي للمربعات الصغرى لـ صأ و صSp في d i j ¯ ⁠. تشير النقاط البني والأخضر مع أشرطة الخطأ إلى القيم المقدرة لـ صأ تم الحصول عليها بعد استبدال قيم السمات الحقيقية على الشجرة بقيم تمت محاكاتها في ظل أقصى احتمال ملائم لطرق PMM وطريقة POUMM ، على التوالي (المتوسط ​​و 95٪ CI المقدرة من 100 مكررة). يُظهر الخط البني والأخضر الارتباط المتوقع بين أزواج الرؤوس على مسافة داي جاي، على النحو النموذجي تحت ML-fit من PMM و POUMM (مكافئ. 2 و 3). تصور المنطقة ذات اللون البني الفاتح والأخضر الفاتح الفواصل الزمنية للكثافة الخلفية العالية بنسبة 95٪ (HPD) المستنبطة من التوافق البايزي للنموذجين (المواد والطرق).

الارتباط بين قيم lg (spVL) في أزواج النشوء والتطور لفيروس العوز المناعي البشري. تظهر عينة من 1917 PPs مع قياسات lg (spVL) من مرضى فيروس نقص المناعة البشرية انخفاضًا في الارتباط (ICC) بين قيم السمات الزوجية كدالة لمسافة النشوء والتطور الزوجي داي جاي. يتم وصف تقديرات النقاط و 95٪ من مجالات الموثوقية في عشر طبقات متساوية الحجم (عشري) كنقاط وأشرطة خطأ موضوعة عند المتوسط داي جاي لكل طبقة ، d i j ¯ ⁠. تشير النقاط السوداء والأرجوانية مع أشرطة الخطأ إلى المقدرة صأ و صSp في البيانات الحقيقية. تشير الأشرطة الأفقية المتقطعة إلى 95٪ CI لـ صأ تقييمها على جميع أزواج النشوء والتطور. يشير الخط المائل الأسود والأرجواني إلى الانحدار الخطي للمربعات الصغرى لـ صأ و صSp في d i j ¯ ⁠. تشير النقاط البني والأخضر مع أشرطة الخطأ إلى القيم المقدرة لـ صأ تم الحصول عليها بعد استبدال قيم السمات الحقيقية على الشجرة بقيم تمت محاكاتها في ظل أقصى احتمال ملائم لطرق PMM وطريقة POUMM ، على التوالي (المتوسط ​​و 95٪ CI المقدرة من 100 مكررة). يُظهر الخط البني والأخضر الارتباط المتوقع بين أزواج الرؤوس على مسافة داي جاي، على النحو النموذجي تحت ML-fit من PMM و POUMM (مكافئ. 2 و 3). تصور المنطقة ذات اللون البني الفاتح والأخضر الفاتح الفواصل الزمنية للكثافة الخلفية العالية بنسبة 95٪ (HPD) المستنبطة من التوافق البايزي للنموذجين (المواد والطرق).

توضح النتيجة أعلاه أن قيمة مقدر التوريث على أساس الارتباط داخل أزواج النشوء والتطور (بما في ذلك الأزواج DR) تعتمد بشدة على داي جاي. قضية أخرى لجميع مقدر ح 2 باستخدام الارتباط في أزواج النشوء والتطور أو DR هو أن الأساليب الإحصائية الأساسية تتطلب الاستقلال بين الأزواج - يجب ألا تؤثر قيم السمات في زوج واحد أو ترتبط بقيم السمات في أي زوج آخر. هذا الافتراض غير صحيح بشكل عام ، بسبب علاقة النشوء والتطور بين جميع المرضى. تتمثل إحدى طرق التخفيف من آثار علاقة النشوء والتطور بين الأزواج في قصر التحليل على الأزواج الأقرب (أي الأزواج ، والتي داي جاي لا يتجاوز حد معين من قبل المستخدم). هذا النهج له عيب في حذف الكثير من البيانات من التحليل. كبديل للاستفادة من الشجرة بأكملها ، من الممكن تصحيح علاقة النشوء والتطور باستخدام طريقة مقارنة النشوء والتطور (PCM). تحاول PCMs حل كلتا المشكلتين المذكورتين أعلاه ، لأنها 1) تدمج أطوال الفروع في شجرة النقل لنمذجة بنية التباين - التباين المشترك للبيانات و 2) تصحيح ارتباط النشوء والتطور عند تقدير المعلمات التطورية أو وراثة النشوء والتطور. سمة (Felsenstein 1985 Housworth et al. 2004 Alizon et al. 2010). تأتي مزايا PCMs بسعر افتراض عملية عشوائية محددة كنموذج لتطور السمات على طول الشجرة. في القسم الفرعي التالي ، نوضح أن افتراض وجود عملية غير مناسبة لتطور السمات يمكن أن يسبب تحيزًا كبيرًا في تقدير التوريث النشئي.

لا يمكن لعملية الحركة البراونية إعادة إنتاج اضمحلال الارتباط في بيانات المملكة المتحدة

قمنا بتنفيذ أقصى احتمالية وتناسب Bayesian لـ PMM (Lynch 1991 Housworth et al. 2004) وامتداده إلى نموذج Ornstein-Uhlenbeck للتطور (POUMM) (Hansen 1997 Mitov and Stadler 2016 Blanquart et al. 2017). تفترض PMM و POUMM نموذجًا مضافًا لقيم السمات ، z (t) = g (t) + e ⁠ ، حيث ض(ر) يمثل قيمة السمة في الوقت المناسب ر لنسب معين من الشجرة ، ز(ر) يمثل قيمة وراثية (وراثية) في الوقت المناسب ر لهذا النسب و ه يمثل مساهمة غير قابلة للتوريث تلخص آثار المضيف وبيئته / بيئتها على السمة وخطأ القياس. الاختلاف الوحيد بين النموذجين هو افتراضهم حول تطور ز(ر) على طول فروع الشجرة - تفترض PMM عملية حركة براونية تفترض POUMM عملية Ornstein-Uhlenbeck (Uhlenbeck and Ornstein 1930 Lande 1976 Hansen 1997).

باستخدام تقديرات الاحتمالية القصوى لمعلمات النموذج (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت) ، قمنا بمحاكاة مسارات السمات العشوائية على شجرة المملكة المتحدة ، وتشغيل 100 تكرار لكل نموذج. لكل تكرار ، قدرنا الارتباط ، صأ، في PPs باستخدام القيم المحاكاة بدلاً من القيم الحقيقية. تظهر تقديرات الارتباط الناتجة في الشكل 3 كنقاط بنية وخضراء وأشرطة خطأ لمحاكاة PMM و POUMM ، على التوالي. نلاحظ وجود فرق كبير بين تقديرات الارتباط للنموذجين. على وجه الخصوص ، في العشرية أقصى اليسار ، يكون تقدير POUMM أعلى بكثير من تقدير PMM (POUMM 95٪ CI يستبعد تقدير PMM).

يأتي التقريب الأخير في المعادلة (5) من حقيقة أن المصطلح exp (- 8.35 + 36.47 dij) هو ما يقرب من 0 لمدى مسافات النشوء والتطور (⁠ dij ∈ [0 ، 0.14] ⁠) في شجرة المملكة المتحدة (انظر التكميلية) المعلومات ، المواد التكميلية عبر الإنترنت ، لمزيد من التفاصيل حول التقديرات المذكورة أعلاه).

تمثل المعادلتان (4) و (5) نموذجًا خطيًا وأسيًا للارتباط كدالة لـ داي جاي. قيم هذه المعادلات في داي جاي= 0 تساوي الوراثة التطورية المقدرة بمتوسط ​​مسافة طرف الجذر t ¯ تحت PMM و POUMM (تفاصيل عن ذلك لاحقًا). يساوي ميل النموذج الخطي (مكافئ 4) −0.36 (95٪ HPD [0.58 ، −0.21]). معدل الاضمحلال الأسي (مكافئ 5) يساوي معامل POUMM α= 28.78 (95٪ HPD [16.64، 46.93]) وعمر نصف التسوس يساوي ln ⁡ (2) / α = 0.02 بدائل لكل موقع (95٪ HPD [0.01، 0.04]).

إن رسم قيم المعادلتين (4) و (5) وفترات 95٪ من HPD على الشكل 3 يكشف بصريًا أن POUMM يناسب البيانات بشكل أفضل من PMM. إحصائيًا ، يتم تأكيد ذلك من خلال معيار معلومات Akaike السفلي (AICc) لملاءمة POUMM وفاصل زمني إيجابي صارم لـ HPD لمعلمة OU α (الجدول التكميلي S1 والشكل S8 ، المواد التكميلية عبر الإنترنت). انحدار النموذج الخطي المشتق من تناسب PMM (مكافئ 4 ، الخط البني في الشكل 3) مسطح تقريبًا مقارنة بمنحدرات نتيجتي OLS (الخطوط السوداء والأرجوانية في الشكل 3). لشرح ذلك ، نلاحظ أنه في PMM ، تم تصميم التباين المشترك في أزواج النشوء والتطور على مستوى السكان كوظائف خطية لمسافة الجذر- mrca (راي جاي) ومسافة طرف الجذر (ر) (البسط والمقام في المعادلة 2). الأهم من ذلك ، أن كلتا هاتين الدالتين الخطيتين مرتبطتان بنفس معامل الانحدار ، σ 2. كما اتضح ، في بيانات المملكة المتحدة ، يزداد التباين والتباين بمعدلات مختلفة فيما يتعلق بـ راي جاي و ر (انظر الشكل التكميلي S2 والمعلومات التكميلية ، المواد التكميلية عبر الإنترنت). نستنتج أن PMM ليس نموذجًا مناسبًا للارتباط في أزواج النشوء والتطور ، غير قادر على نمذجة الفرق أعلاه في المعدلات.

في الحد d i j → 0 ، يجب أن يكون الزوج النشئي مكافئًا لزوجين من النوع DR في لحظة الانتقال ، أي قبل تباعد الأنماط الجينية في المضيفين بسبب التطور داخل المضيف. وبالتالي ، يبدو من المعقول استخدام تقدير الارتباط عند داي جاي= 0 كبديل للتوريث واسع المعنى ، ح 2 ، في جميع السكان. تم تطبيق هذه الفكرة في الدراسات السابقة حول فيروس نقص المناعة البشرية (Hecht et al. 2010 Hollingsworth et al. 2010 Bachmann et al. 2017 Blanquart et al. 2017) وكذلك الملاريا (Anderson et al. 2010). تتمثل إحدى العوائق المحتملة لهذا النهج في إمكانية إدخال تحيز في أخذ العينات عن طريق تصفية البيانات. على سبيل المثال ، إذا كانت الدراسة على سمة ، والتي تتطور نحو قيم أعلى أثناء مسار العدوى ، فإن المرضى الذين لديهم قيم سمات أقل يميلون إلى أن يكونوا أكثر تواترًا بين CPPs أكثر من السكان ككل. وبالتالي ، ليس هناك ما يضمن أن توزيع السمات ، وبالتالي ، التوريث المقاس في CPPs يساوي التوريث في جميع السكان. تؤثر مشكلة التحيز في أخذ العينات على كل من طرق المقارنة القائمة على التشابه وكذلك طرق المقارنة التطورية المستخدمة حاليًا. هذا يشير إلى أن نهج فرض عتبة على داي جاي أو تقدير الارتباط (صأ, صSp أو مقياس ارتباط آخر) في داي جاي= 0 يحتاج إلى مزيد من التحقق. في القسم الفرعي التالي ، نستخدم محاكاة نموذج اللعبة لإظهار أن تحيز أخذ العينات ، على الرغم من وجوده ، صغير نسبيًا فيما يتعلق بالتحيز السلبي بسبب تأخير القياس.

ANOVA-CPP و POUMM هما أقل مقدر للتوريث متحيزًا في محاكاة نماذج الألعاب

تجميع قيم السمات حسب النمط الجيني الممرض المتطابق. قمنا بتقييم معامل التحديد المعدل لحجم العينة المحدود ، R المجاور 2 ⁠ ، والارتباط داخل الصف (ICC) المقدّر باستخدام ANOVA أحادي الاتجاه ، r A [id] ⁠. يتمثل الاختلاف الرئيسي بين هذين المقدرين في افتراض ANOVA بأن وسائل المجموعة (القيم الوراثية) مأخوذة من توزيع من المحتمل أن يكون عددًا أكبر من الأنماط الجينية من تلك الموجودة في البيانات. على النقيض من ذلك ، تفترض R الصفة 2 أن جميع الأنماط الجينية في السكان موجودة في العينة. نظرًا لأن الافتراض الأخير صحيح بالنسبة للأوبئة التي تمت محاكاتها ، فإن الخيار R التالي يمثل القيمة المرجعية (الحقيقية) لـ ح 2 التي تتم مقارنة جميع التقديرات الأخرى.

الأزواج المعروفين DR. قمنا بتقييم منحدر انحدار المستلم على قيم المانحين بثلاث طرق: 1) ب- استنادًا إلى قيم السمات في لحظة تشخيص الإصابة 2) ب0- استنادًا إلى قيم السمات مباشرة بعد أحداث الإرسال و 3) b d i j ′ - استنادًا إلى العينة الفرعية للأزواج المشخصين لديهم داي جاي لا تتجاوز العتبة d i j ′ ⁠. بناءً على المفاضلة بين الدقة والتحيز ، حددنا d i j ′ = D 1 ، د1 للدلالة على العشر الأول في التوزيع التجريبي ل داي جاي (انظر المعلومات التكميلية ، المواد التكميلية على الإنترنت).

أزواج النشوء والتطور (PPs) في تي 10 ك ⁠. قمنا بتقييم المحكمة الجنائية الدولية باستخدام ANOVA بثلاث طرق: 1) صأ- على أساس جميع PPs 2) r A، D 1 - على أساس CPPs المعرفة على أنها PPs في T 10 k ذات داي جاي لا يتجاوز العشير الأول ، د1 و 3) ص أ ، 0 ، خط - التقاطع المقدر من الانحدار الخطي للقيم r A ، D k على القيم المتوسطة dij ، k في كل عشري ، k = 1 ، ... ، 10 ⁠ للمقدرين الأخيرين ، التي تحاول تقدير صأ في داي جاي= 0 ، نستخدم الاختصار ANOVA-CPP. كبديل لـ ANOVA ، وهو أكثر قوة للقيم المتطرفة (على سبيل المثال ، القيم القصوى عند ذيول توزيع السمات) ، قمنا بتقييم ارتباط سبيرمان في العشر الأول ، المشار إليه هنا بـ r Sp ، D 1 ⁠.

شجرة الإرسال تي 10 ك ⁠. قمنا بتقييم التوريث الوراثي بناءً على ملاءمة ML لنماذج PMM و POUMM. على وجه التحديد ، قمنا بمقارنة الصيغة الكلاسيكية التي تم تقييمها عند متوسط ​​مسافة طرف الجذر t ¯ في الشجرة (مكافئ. 10 و 12) (Housworth et al. 2004 Leventhal and Bonhoeffer 2016) والصيغة التجريبية بناءً على تباين سمة العينة ، س 2 (ض) (مكافئ 11 و 13) (موصوف في المواد والطرق). بالنسبة إلى PMM ، نشير إلى هذه المقدرات بواسطة H BM 2 (t ¯) و H BM e 2 ⁠ لـ POUMM ، نستخدم الرموز H OU 2 (t ¯) و H OU e 2 ⁠:

يلخص الجدول 1 التعريف الرياضي وافتراضات التقديرات المذكورة أعلاه. يتم توفير وصف أكثر تفصيلاً لطرق PMM و POUMM في المواد والطرق. تعتبر الكتب المدرسية المرجعية حول الجينات الكمية (Lynch and Walsh 1998) مراجع ممتازة للطرق الأخرى.

المقدرون المختبرين للتوريث واسع النطاق لصفات العوامل الممرضة.

ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على صفوف قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + ω 1 d i j. (9)
شجرة الإرسال النموذج المختلط النشوء والتطور (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)
ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + 1 d i j. (9)
شجرة الإرسال النموذج المختلط النشوء والتطور (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)

ملاحظة. - التدوين: s 2 (·) ⁠ ، عينة التباين s (· ، ·) ⁠ ، عينة التباين ن، عدد المرضى ك، عدد المجموعات المتميزة من المرضى ، أي الأنماط الجينية أو أزواج النشوء والتطور ض، القيم المقاسة G ^ ⁠ ، القيم الوراثية المقدرة: القيم المتوسطة من المرضى الذين يحملون نمطًا وراثيًا معينًا z don ، قيم المتبرعين z rcp ⁠ ، قيم المستلم MS e ⁠ ، مربع متوسط ​​داخل المجموعة: MS e = (zi - z ¯ ط) 2 N - K ⁠ ، أين ضأنا هي قيمة الفرد و z ¯ i هي القيمة المتوسطة للمجموعة التي ينتمي إليها الفرد MS b ⁠ ، مربع متوسط ​​بين المجموعة: MS b = ∑ (z ¯ i - z ¯) 2 K - 1 ⁠ ، حيث z يتم تعريف ¯ i على النحو الوارد أعلاه و z ¯ هو متوسط ​​القيمة السكانية ن، المتوسط ​​المرجح لعدد المرضى في مجموعة ، أي ، ن= 2 لأزواج النشوء والتطور و n = (N - ∑ n i 2 N) / (K - 1) للمجموعات ذات الحجم المتغير α, σ, σه: معلمات PMM / POUMM (الموضحة في المواد والطرق).

i.i.n.d. مستقلة وموزعة بشكل طبيعي داي جاي، مسافة النشوء والتطور بين أزواج المتبرعين والمتلقيين أو أزواج النشوء والتطور d i j ′ ، الحد الأقصى داي جاي (انظر النص).

المقدرون المختبرين للتوريث واسع النطاق لصفات العوامل الممرضة.

ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + 1 d i j. (9)
شجرة الإرسال النموذج المختلط الوراثي (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)
ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + ω 1 d i j. (9)
شجرة الإرسال النموذج المختلط النشوء والتطور (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)

ملاحظة. - التدوين: s 2 (·) ⁠ ، عينة التباين s (· ، ·) ⁠ ، عينة التباين ن، عدد المرضى ك، عدد المجموعات المتميزة من المرضى ، أي الأنماط الجينية أو أزواج النشوء والتطور ض، القيم المقاسة G ^ ⁠ ، القيم الوراثية المقدرة: القيم المتوسطة من المرضى الذين يحملون نمطًا وراثيًا معينًا z don ، قيم المتبرعين z rcp ⁠ ، قيم المستلم MS e ⁠ ، مربع متوسط ​​داخل المجموعة: MS e = (zi - z ¯ ط) 2 N - K ⁠ ، أين ضأنا هي قيمة الفرد و z ¯ i هي القيمة المتوسطة للمجموعة التي ينتمي إليها الفرد MS b ⁠ ، مربع متوسط ​​بين المجموعة: MS b = ∑ (z ¯ i - z ¯) 2 K - 1 ⁠ ، حيث z يتم تعريف ¯ i على النحو الوارد أعلاه و z ¯ هو متوسط ​​القيمة السكانية ن، المتوسط ​​المرجح لعدد المرضى في مجموعة ، أي ، ن= 2 لأزواج النشوء والتطور و n = (N - ∑ n i 2 N) / (K - 1) للمجموعات ذات الحجم المتغير α, σ, σه: معلمات PMM / POUMM (الموضحة في المواد والطرق).

i.i.n.d. مستقلة وموزعة بشكل طبيعي داي جاي، مسافة النشوء والتطور بين أزواج المتبرعين والمتلقيين أو أزواج النشوء والتطور d i j ′ ، الحد الأقصى داي جاي (انظر النص).

ضمن: محايد / بين: محايد

ضمن: تحديد / بين: محايد

ضمن: محايد / بين: حدد

ضمن: حدد / بين: حدد

لكل من هذه السيناريوهات ومتوسط ​​فترة الاتصال 1 / κ ∈ <2 ، 4 ، 6 ، 8 ، 10 ، 12> (وحدات زمنية عشوائية) ، قمنا بتنفيذ عشر عمليات محاكاة أدت إلى إجمالي 4 × 6 × 10 = 240 محاكاة. من بين 240 عملية محاكاة ، أسفرت 175 حالة عن تفشي وبائي لما لا يقل عن 10000 عائل تم تشخيصه. لكل تفشٍ ، قمنا بتحليل تجمعات أول ما يصل إلى 10000 مضيف تم تشخيصه.

تؤدي أحداث الإرسال النادرة (أكبر 1 / κ ⁠) إلى أشجار إرسال أطول ، وبالتالي ، متوسط ​​مسافة نسج أطول بين الأطراف ، داي جاي (الشكل التكميلي S3 ، المواد التكميلية عبر الإنترنت). وقد أتاح ذلك توضيح تأثير تراكم التطور داخل العائل على مقدرات التوريث المختلفة (شكل 4).

تقديرات التوريث في محاكاة نماذج الألعاب. (ميلادي) ح 2 - تقديرات في محاكاة ديناميكيات "محايدة" و "تحديد" داخل / بين المضيف. تلخص كل مجموعة من شعيرات الصندوق عمليات المحاكاة لسيناريو ثابت وفاصل اتصال ، 1 / ​​κ مربعات بيضاء (الخلفية) تشير إلى التوريث الحقيقي ، والمربعات الملونة تشير إلى التقديرات (المقدمة). يتم تقييم الدلالة الإحصائية من خلال ر- الاختبارات ملخصة في الجدول 2.

تقديرات التوريث في محاكاة نماذج الألعاب. (ميلادي) ح 2 - تقديرات في محاكاة ديناميكيات "محايدة" و "تحديد" داخل / بين المضيف. تلخص كل مجموعة من شعيرات الصندوق عمليات المحاكاة لسيناريو ثابت وفاصل اتصال ، 1 / ​​κ مربعات بيضاء (خلفية) تشير إلى التوريث الحقيقي ، والمربعات الملونة تشير إلى التقديرات (المقدمة). يتم تقييم الدلالة الإحصائية من خلال ر- الاختبارات ملخصة في الجدول 2.

يوضح الشكل 4 أن المقدرات b D 1 ⁠ و b و r A و D 1 و r A منحازة بشكل سلبي بشكل عام لجميع سيناريوهات نماذج الألعاب. يميل هذا التحيز إلى الزيادة مع متوسط ​​فاصل الاتصال ، 1 / ​​κ (على التوالي ، داي جاي) ، لأن الطفرة العشوائية داخل المضيف تميل إلى تقليل التداخل الجيني بين DRs وأزواج النشوء والتطور (الشكل التكميلي S4 ، المواد التكميلية عبر الإنترنت). كان التحيز السلبي أقل وضوحًا عند فرض عتبة داي جاي لكن هذا جاء على حساب الدقة (قطع أقل تحيزًا ولكن أطول لصندوق الطولي لـ b D 1 و r A ، D 1 مقارنةً بـ ب و صأ) (الشكل 4). تم الكشف عن عدة مصادر إضافية للتحيز عند النظر في التقديرات غير المتوفرة عمليا ب0 و r A [i d] ⁠. المقدر r A [المعرف] كان متحيزًا إيجابيًا بسبب العدد الصغير للأنماط الجينية المحاكاة (ستة فقط) - تم التحقق من صحة هذا من خلال عمليات محاكاة إضافية توضح أن r A [المعرف] يتقارب مع القيمة الحقيقية لعدد أكبر قليلاً من الأنماط الجينية (على سبيل المثال و ك≥24 نوعًا وراثيًا ، انظر المعلومات التكميلية ، المواد التكميلية عبر الإنترنت). المقدر ب0 كان يتصرف بدقة في السيناريو المحايد / المحايد (باستثناء فترات الاتصال القصيرة جدًا) ولكنه يميل إلى التحيز في كلا الاتجاهين في جميع السيناريوهات التي تتضمن الاختيار. كان السبب الرئيسي لهذه التحيزات هو ظاهرة "تحيز أخذ العينات" الذي يتكون من اختلاف بين توزيعات القيم المقاسة في أزواج DR والسكان المعنيين. على الرغم من أن حجمها كان صغيرًا نسبيًا في عمليات المحاكاة ، فإننا نفترض أن تحيز أخذ العينات يمكن أن يلعب دورًا مهمًا في التطبيقات البيولوجية الحقيقية. لقد قدمنا ​​بالفعل مثالاً على هذا التحيز في القسم الفرعي السابق. مظهر آخر من مظاهر التحيز في أخذ العينات هو حقيقة ذلك ب0 لا يقضي تمامًا على تأثير التطور داخل المضيف (والاختيار) في الجهات المانحة.لهذا السبب ، في حالات الاختيار ، يميل التباين الظاهري في المتبرعين إلى أن يكون أصغر من التباين في المتلقين وكذلك التباين في السكان (الشكل التكميلي S5 ، المواد التكميلية عبر الإنترنت). يتم توفير تفاصيل إضافية حول هذه المصادر المحتملة للتحيز في المعلومات التكميلية ، المواد التكميلية عبر الإنترنت.

علاوة على ذلك ، أظهرت عمليات المحاكاة أن التوافق المتدهور لنموذج BM على أشجار الإرسال الأطول كان يتسبب في تقدير مبالغ فيه للانحراف البيئي ، σ e ⁠ ، في PMM ، وبالتالي ، انحياز سلبي في H BM 2 (t ¯) و H BM e 2 (قارن تقديرات القيم الصغيرة والكبيرة لـ 1 / κ في الشكل 4 والشكل التكميلي S6 ج، المواد التكميلية على الإنترنت). على النقيض من PMM ، كانت تقديرات POUMM ، H OU 2 (t ¯) و H OU e 2 أكثر دقة وكانت قيمة σ e في تناسب POUMM ML تطابق تقريبًا الانحراف الحقيقي غير القابل للتوريث في معظم عمليات المحاكاة (الشكل. 4 والتين التكميلي S6 ج، المواد التكميلية على الإنترنت). تم تأكيد توافق ML الأفضل لـ POUMM من خلال دعم إحصائي أقوى ، أي من خلال قيم AICc المنخفضة في جميع عمليات محاكاة نماذج الألعاب (الشكل التكميلي S6) د، المواد التكميلية على الإنترنت).

تتناقض حقيقة أن POUMM قد تفوقت على PMM في جميع السيناريوهات مع الاعتقاد الأولي بأن PMM يجب أن يكون النموذج الأكثر ملاءمة لسمات متطورة بشكل محايد يمثلها السيناريو المحايد / المحايد ، في حين أن POUMM يجب أن تتناسب بشكل أفضل مع السيناريوهات التي تنطوي على الاختيار. كان من غير المنطقي أيضًا أن المعلمة المستنبطة α من نموذج POUMM كان إيجابيًا بشكل ملحوظ في جميع عمليات المحاكاة بما في ذلك السيناريو المحايد / المحايد (الشكل التكميلي S6 ب، المواد التكميلية على الإنترنت). لفهم هذه الظاهرة بشكل أفضل ، أجرينا تحليل التقسيم الطبقي PP على بيانات نموذج اللعبة (الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). كشف هذا عن نمط من الارتباط يتلاشى بشكل كبير مع داي جاي. كان شكل الانحلال الأسي واضحًا في الغالب لفترات تلامس أطول ، 1 / ​​κ ⁠ ، خاصة في السيناريو المحايد / المحايد (العمود الأول في الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). في المعلومات التكميلية ، المواد التكميلية عبر الإنترنت ، نظهر أن ارتباط النمط الظاهري المتحلل بشكل كبير يتوافق مع النمط الوراثي الطافر بشكل محايد بموجب نموذج استبدال Jukes-Cantor (Yang 2006). كان تحلل الارتباط لا يزال موجودًا في السيناريوهات التي تتضمن الاختيار داخل و / أو بين المضيف ولكن النمط الملحوظ كان غير منتظم إلى حد ما وينحرف عن دالة أسية لـ داي جاي (الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). في معظم الحالات ، كان ملاءم ML لطريقة PMM مناسبًا لاضمحلال الارتباط (النقاط البنية وأشرطة الخطأ في الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت) لفترات تلامس أطول ، كان هناك ميل نحو قيم ثابتة لـ الارتباط تحت PMM أقل بكثير من القيمة الحقيقية (النقاط البنية وأشرطة الخطأ في الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). هذا يفسر الدقة الإجمالية الأفضل لـ POUMM مقابل طريقة PMM.

يوضح الجدول 2 متوسط ​​التحيز لكل مقدر تم اختباره لكل من السيناريوهات الأربعة. نستنتج أنه ، بصرف النظر عن المقدرات التي يتعذر الوصول إليها عمليا على أساس التجميع حسب النمط الجيني المتطابق (⁠ R ، 2 و r A [معرف]) ، فإن أكثر التقديرات دقة ح 2 في محاكاة نموذج اللعبة هي H OU 2 (t ¯) و H OU e 2 متبوعة بمقدرات الارتباط في PPs لتقليل مسافة النشوء والتطور داي جاي، أي (⁠ r A ، D 1 ⁠ ، r A ، 0 ، l i n ⁠ ، r Sp ، D 1). في القسم الفرعي التالي ، قمنا بالإبلاغ عن نتائج هذه التقديرات في بيانات فيروس نقص المناعة البشرية في المملكة المتحدة.

متوسط ​​الفرق H 2 ̂ - R المجاور 2 من محاكاة نماذج اللعبة المجمعة حسب السيناريو.

داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **
داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **

ملاحظة - تقدر الأهمية الإحصائية بواسطة Student ر-الاختبارات ، ص القيم التي يُشار إليها بعلامة النجمة على النحو التالي: * ص& lt0.01 **ص& lt0.001. تشير الخلفية الرمادية إلى تقديرات غير متوفرة عمليًا.

متوسط ​​الفرق H 2 ̂ - R المجاور 2 من محاكاة نماذج اللعبة المجمعة حسب السيناريو.

داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **
داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **

ملاحظة - تقدر الأهمية الإحصائية بواسطة Student ر-الاختبارات ، ص القيم التي يُشار إليها بعلامة النجمة على النحو التالي: * ص& lt0.01 **ص& lt0.001. تشير الخلفية الرمادية إلى تقديرات غير متوفرة عمليًا.

Heratibality of lg (spVL) في مجموعة HIV في المملكة المتحدة

قمنا بتقييم الارتباط في CPPs (ارتباط ANOVA و Spearman) في البيانات من مجموعة فيروس نقص المناعة البشرية في المملكة المتحدة التي تضم قياسات lg (spVL) وشجرة من الفيروسية (بول) متواليات من 8483 مريضًا تم استنتاجها مسبقًا في (Hodcroft et al. 2014). بالإضافة إلى ذلك ، أجرينا ملاءمة Bayesian لطرق POUMM و PMM لنفس البيانات. كان الهدف هو اختبار استنتاجاتنا على مجموعة بيانات حقيقية ومقارنة ح 2 - تقديرات من CPPs و POUMM إلى تقديرات PMM / ReML السابقة على نفس البيانات بالضبط (Hodcroft et al. 2014).

عند تطبيق ANOVA-CPP ، كانت الخطوة الأولى هي تحديد مسافة النشوء والتطور لتعريف CPPs. تحقيقا لهذه الغاية ، استكشفنا طبقات مختلفة من PPs كما هو موضح في الشكل التكميلي S1 ب، والمواد التكميلية عبر الإنترنت ، ومخطط مبعثر لمسافات النشوء والتطور مقابل الاختلافات المظهرية المطلقة ، | Δ lg ⁡ (spVL) | (الشكل 5 أ). كشف هذا عن مجموعة صغيرة من 116 PPs لها d i j ≤ 10-4 وتتزامن بصعوبة مع الوقفة الأولى (وتسمى أيضًا 20-quantile أو ventile) من داي جاي. كانت مسافة النشوء والتطور في جميع أزواج الأطراف المتبقية أكبر من مرتبة من حيث الحجم ، أي d i j & gt 10 - 3. بالنظر إلى أن المسافة التطورية على شجرة النقل تقاس بالبدائل لكل موقع وطول بول-المنطقة بترتيب 10 3 مواقع ، نفترض أن المجموعة المذكورة أعلاه المكونة من 116 PPs تتوافق مع مجموعة من 116 زوجًا من متطابقة بول تسلسل الإجماع (لم تتوفر بيانات تسلسل للتحقق من ذلك). بناءً على هذه الملاحظة ، حددنا الأزواج المذكورة أعلاه على أنها CPPs وتم تعيين العتبة رسميًا على d i j ′ = 10-4 ⁠. تحققنا من أن CPPs تم توزيعها عشوائيًا على طول الشجرة (الشكل 5 ب). يشير التوزيع العشوائي لـ CPPs على طول شجرة الإرسال إلى أن أزواج النشوء والتطور هذه تتوافق مع الاكتشافات المبكرة للعدوى التي تحدث بشكل عشوائي (قيم السمات من كل زوج تم تصويره على شكل مقاطع أرجوانية في الشكل 5 ب). للتحقق من أن تصفية البيانات ، لم تقدم تحيزًا كبيرًا في أخذ العينات بسبب الاختيار (انظر القسم الفرعي السابق) ، تحققنا أيضًا من عدم وجود اختلاف جوهري في توزيعات السمات لجميع المرضى ، و PPs و CPPs (الشكل. 5 ج).

أزواج النشوء والتطور في بيانات lg (spVL) من المملكة المتحدة. (أ) مخطط مبعثر للمسافات التطورية بين أزواج من الأطراف مقابل الاختلافات المظهرية المطلقة: رمادي ، PPs (⁠ d i j & gt 10-4 ⁠) أرجواني ، CPPs (⁠ d i j & lt 10-4 ⁠). يُظهر الخط الأسود الانحدار الخطي لـ | Δ lg ⁡ (spVL) | تشغيل داي جاي (كان منحدر الانحدار موجبًا إحصائيًا عند مستوى 0.01). (ب) مخطط مربع يمثل توزيع السمات على طول شجرة الإرسال. يمثل كل شارب صندوقي توزيع lg (spVL) للمرضى مجمعين حسب المسافة من جذر الشجرة المقاسة بالبدائل لكل موقع. تشير المربعات الأوسع إلى مجموعات أكبر في الحجم. تشير المقاطع باللون الأرجواني إلى قيم lg (spVL) في CPPs. (ج) مخطط مربع لتوزيع lg (spVL) في جميع المرضى (أسود) ، و PPs (رمادي) ، و CPPs (أرجواني).

أزواج النشوء والتطور في بيانات lg (spVL) من المملكة المتحدة. (أ) مخطط مبعثر للمسافات التطورية بين أزواج من الأطراف مقابل الاختلافات المظهرية المطلقة: رمادي ، PPs (⁠ d i j & gt 10-4 ⁠) أرجواني ، CPPs (⁠ d i j & lt 10-4 ⁠). يُظهر الخط الأسود الانحدار الخطي لـ | Δ lg ⁡ (spVL) | تشغيل داي جاي (كان منحدر الانحدار موجبًا إحصائيًا عند مستوى 0.01). (ب) مخطط مربع يمثل توزيع السمات على طول شجرة الإرسال. يمثل كل شارب صندوقي توزيع lg (spVL) للمرضى مجمعين حسب المسافة من جذر الشجرة المقاسة بالبدائل لكل موقع. تشير المربعات الأوسع إلى مجموعات أكبر في الحجم. تشير المقاطع باللون الأرجواني إلى قيم lg (spVL) في CPPs. (ج) مخطط مربع لتوزيع lg (spVL) في جميع المرضى (أسود) ، و PPs (رمادي) ، و CPPs (أرجواني).

ANOVA-CPPs (⁠ r A ، D 1 ، r A ، 10-4 ، r A ، V 1 ⁠) وطريقة PP الأصلية صأ

التقاطع من الانحدار الخطي لـ صأ تشغيل داي جاي عند التقسيم الطبقي لـ PPs إلى عشري (⁠ r A ، 0 ، l i n ⁠ ، مكافئ 9)

ارتباط سبيرمان في CPPs (⁠ r Sp ، D 1 ⁠ ، r Sp ، 10 - 4 ⁠ ، r Sp ، V 1 ⁠) وفي جميع PP (⁠ r Sp ⁠).

التقاطع من الانحدار الخطي لـ r Sp on داي جاي عند التقسيم الطبقي لـ PPs إلى شرائح عشرية (⁠ r Sp ، 0 ، l i n ⁠)

POUMM (⁠ H OU 2 (t ¯) ⁠ ، H OU e 2 ⁠) ، مقابل PMM (⁠ H BM 2 (t ¯) ⁠ ، H BM e 2 ⁠) على الشجرة بأكملها

تم الإبلاغ عن نتائج هذه التحليلات في الجدول 3. تقديرات الارتباط ANOVA- و Spearman ، التي قللت من مسافة النشوء والتطور عن طريق الانحدار أو الترشيح للأزواج النشوء والتطور لها تقديرات نقطية لـ r A ، 10-4 = 0.17 و r Sp ، 10-4 = 0.22 أوم. يمكن تفسير التقدير الأعلى قليلاً لارتباط سبيرمان من خلال وجود القيم المتطرفة في البيانات. أبلغ تطبيق POUMM على الشجرة بأكملها عن تقدير نقطة H OU 2 (t ¯) = 0.21 (8483 مريضًا ، 95٪ CI [0.14 ، 0.29]).

تقديرات lg (spVL) -Heritability في بيانات فيروس نقص المناعة البشرية من المملكة المتحدة.

طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]
طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]

ملاحظة —- مكتوبة أيضًا نتائج تحليل سابق على نفس مجموعة البيانات (Hodcroft et al. 2014). "-": لم يتم التحليل في الدراسة المذكورة. الخلفية الرمادية: تعتبر التقديرات غير موثوقة بسبب: انحياز سلبي ناتج عن تأخيرات في القياس وتحيز سلبي ناتج عن انتهاك BM. يتم التعبير عن عدم اليقين في التقديرات من حيث فترات الثقة 95 ٪ (CI) ، أو ، في حالة الاستدلال البايزي ، بنسبة 95 ٪ من فترات الكثافة الخلفية العالية (HPDs).

تقديرات lg (spVL) -Heritability في بيانات فيروس نقص المناعة البشرية من المملكة المتحدة.

طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]
طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]

ملاحظة —- مكتوبة أيضًا نتائج تحليل سابق على نفس مجموعة البيانات (Hodcroft et al. 2014). "-": لم يتم التحليل في الدراسة المذكورة. الخلفية الرمادية: تعتبر التقديرات غير موثوقة بسبب: انحياز سلبي ناتج عن تأخيرات في القياس وتحيز سلبي ناتج عن انتهاك BM. يتم التعبير عن عدم اليقين في التقديرات من حيث فترات الثقة 95 ٪ (CI) ، أو ، في حالة الاستدلال البايزي ، بنسبة 95 ٪ من فترات الكثافة الخلفية العالية (HPDs).

على العكس من ذلك ، كانت تقديرات التوريث من طريقة PP الأصلية (ANOVA أو ارتباط سبيرمان على جميع PPs) و PMM أقل بكثير وتقل عن 95 ٪ من CIs من POUMM (الجدول 3). هذا يؤكد الملاحظة من محاكاة نماذج الألعاب أن هذه المقدرات متحيزة سلبًا ، لأنها تتجاهل الارتباط المتغير أو يصوغه بشكل غير دقيق داخل أزواج من النصائح. لقد تحققنا من صحة الدعم الإحصائي الأقوى لـ POUMM فيما يتعلق بـ PMM ، من خلال قيمة AICc المنخفضة (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت) والكثافة الخلفية لمعلمة POUMM α (الشكل التكميلي S8 ، المواد التكميلية عبر الإنترنت).

أخيرًا ، قمنا بمقارنة تقديراتنا لقابلية التوريث lg (spVL) بالتطبيقات السابقة لنفس الطرق على مجموعات بيانات مختلفة (الشكل 6). بالاتفاق مع نماذج محاكاة لعبة ، تقديرات ح 2 باستخدام PMM أو طرق النشوء والتطور الأخرى المستندة إلى BM (على سبيل المثال ، Blomberg’s ك و Pagel's λ) أقل بشكل ملحوظ من جميع التقديرات الأخرى ، مما يشير إلى أن طرق المقارنة الوراثية أقل من الواقع ح 2 التقديرات القائمة على التشابه منحازة لأسفل بسبب تأخيرات القياس (على سبيل المثال ، المقارنة المبكرة مقابل المتأخرة في هولندا في الشكل 6).

مقارنة بين ح 2 H 2 - تقديرات من مجموعة فيروس نقص المناعة البشرية في المملكة المتحدة وتقديرات سابقة لبيانات أفريقية وسويسرية وهولندية. (أ) تقديرات مع تقليل تأخير القياس (أزرق داكن) وتقديرات POUMM (أخضر) (ب) تقديرات منحازة لأسفل بسبب التأخيرات العالية في القياس (أزرق فاتح) أو انتهاك افتراض BM (بني). يتم تصوير الثقة إما على أنها شرائح تشير إلى 95٪ CI مقدرة أو ص القيم في حالات فقدان 95٪ من مجالات الموثوقية. تتم كتابة الإشارات إلى المنشورات المقابلة كأرقام مكتوبة بخط مرتفع على النحو التالي: 1: Tang et al. (2004) 2: هيشت وآخرون. (2010) 3: هولينجسورث وآخرون. (2010) 4: فان دير كويل وآخرون. (2010) 5: Lingappa et al. (2013) 6: Yue et al. (2013) 7: أليزون وآخرون. (2010) 8: Shirreff وآخرون. (2013) 9: Hodcroft et al. (2014) 10: Blanquart et al. (2017) 11: بيرتلز وآخرون. (2018) 12: هذا العمل. من أجل الوضوح ، تقديرات من الدراسات السابقة ، والتي لا يمكن مقارنتها مباشرة (على سبيل المثال ، النتائج السابقة من MSM السويسرية / مجموعات البيانات الصارمة Alizon et al. 2010).

مقارنة بين ح 2 H 2 - تقديرات من مجموعة فيروس نقص المناعة البشرية في المملكة المتحدة وتقديرات سابقة لبيانات أفريقية وسويسرية وهولندية. (أ) تقديرات مع تقليل تأخير القياس (أزرق داكن) وتقديرات POUMM (أخضر) (ب) تقديرات منحازة لأسفل بسبب تأخيرات أعلى في القياس (أزرق فاتح) أو انتهاك افتراض BM (بني). يتم تصوير الثقة إما على أنها شرائح تشير إلى 95٪ CI مقدرة أو ص القيم في حالات فقدان 95٪ من مجالات الموثوقية. تتم كتابة الإشارات إلى المنشورات المقابلة كأرقام مكتوبة بخط مرتفع على النحو التالي: 1: Tang et al. (2004) 2: هيشت وآخرون. (2010) 3: هولينجسورث وآخرون. (2010) 4: فان دير كويل وآخرون. (2010) 5: Lingappa et al. (2013) 6: Yue et al. (2013) 7: أليزون وآخرون. (2010) 8: Shirreff وآخرون. (2013) 9: Hodcroft et al. (2014) 10: Blanquart et al. (2017) 11: بيرتلز وآخرون. (2018) 12: هذا العمل.من أجل الوضوح ، تقديرات من الدراسات السابقة ، والتي لا يمكن مقارنتها مباشرة (على سبيل المثال ، النتائج السابقة من MSM السويسرية / مجموعات البيانات الصارمة Alizon et al. 2010).

باختصار ، POUMM و ANOVA-CPP تنتج تقديرات متفق عليها لـ ح 2 في بيانات المملكة المتحدة وتتفق هذه التقديرات مع التقديرات المستندة إلى التشابه في مجموعات البيانات مع تأخير القياس القصير (بلدان أفريقية مختلفة وهولندا). على غرار محاكاة نموذج اللعبة ، نلاحظ وجود نمط واضح من التحيز السلبي للمقدرات الأخرى ، PMM و ANOVA-PP ، وكذلك للدراسات السابقة القائمة على التشابه على البيانات مع تأخير طويل في القياس.


زواج الأقارب والطبع

أحد الجوانب المثيرة للاهتمام في تحليلات التباين المذكورة أعلاه هو التشابه بين زواج الأقارب والطبع ، حيث يقدم زواج الأقارب أيضًا تباينًا بين التأثيرات المضافة وتأثيرات الهيمنة (Harris 1964) التي قد لا يتم تقسيمها إذا تم استخدام طريقة غير صحيحة. للتحقيق في هذا التشابه ، قمنا بدمج زواج الأقارب في النهج 2 ب. نحن نمثل مجموعة سلالة من خلال تقسيم السكان إلى مجموعتين: مجموعة تمثل نسب هاردي-واينبرغ المتوقعة ، والتي تضم نسبة إجمالية من (1 - F) ، ومجموعة متماثلة الزيجوت تمامًا مع عدم وجود متغاير الزيجوت ، وتشتمل على نسبة F من السكان. وبالتالي ترددات النمط الجيني ل أ1أ1, أ2أ1 و أ1أ2، و أ2أ2 كل من الأنماط الجينية و ، على التوالي. الآن يعني إجمالي عدد السكان دمج كل من زواج الأقارب (أنا) والطبع هو

عندما لا يكون هناك زواج الأقارب ، F = 0 ، يكون عدد السكان بنسب هاردي-واينبرغ ، ويقل المتوسط ​​إلى كما هو متوقع. مع عدم وجود بصمة ، يقلل المتوسط ​​إلى. نفترض أن معامل زواج الأقارب F مستقر عبر الأجيال ، لذلك لا تتغير نسبة الزيجوت المتغايرة.

كما هو الحال في النهج 2 ب ، يمكن حساب انحرافات الهيمنة والمضافة للذكور والإناث بشكل منفصل (Santure and Spencer 2006). على سبيل المثال ، التأثير الإضافي لوراثة ملف أ1 الأليل الأمومي هو الآثار المضافة المتبقية

يمكن حساب قيم التربية وانحرافات الهيمنة كما في النهج 2 ب.

مكونات التباين الجيني

التباين الكلي للسكان الفطريين مع البصمة هو المكان الذي يوجد فيه التباين الجيني الكلي لحالة البصمة فقط (2). عندما يكون هناك زواج أقارب كامل (F = 1) ، التباين الكلي هو (6) ولعدم زواج الأقارب (F = 0) ، نتعافى. (7) يمكن أيضًا إعادة كتابة التباين الكلي كـ (8) وفي حالة عدم وجود طباعة (ك1 = ك2 = ك) ، يصبح التباين الجيني الكلي (9) (Harris ، 1964) ، حيث ، (10) و

بمقارنة المعادلتين (6) و (7) ، يمكننا أن نرى ذلك في حالة عدم وجود بصمة وهيمنة (ك1 = ك2 = F = 0) ، فإن التباين الإجمالي لمجتمع أصلي هو ضعف التباين الخاص بالسكان الفطري (ك1 = ك2 = 0, F = 1) ، وبالفعل يكون تأثير زواج الأقارب خطيًا وهو معامل زواج الأقارب من العائدات مجموع التباين مرات التباين مع عدم زواج الأقارب. ومع ذلك ، بالنسبة للهيمنة ولكن بدون بصمة (9) ، فإن تأثير زيادة زواج الأقارب يكون غير خطي ، وقد يزيد التباين السكاني أو ينقص بالنسبة إلى السكان المهجرين اعتمادًا على ترددات الأليل وقيمة معامل الهيمنة. يتضح تأثير مماثل مع البصمة إذا لم تكن هناك هيمنة (بمعنى آخر., ك1 = −ك2) ، يزداد التباين السكاني خطيًا مع زيادة زواج الأقارب ، بينما مع كل من الهيمنة وطبع التباين السكاني هو دالة تربيعية لـ F. وبالتالي ، فإن الهيمنة وليس البصمة هي التي تحدد علاقة التباين السكاني بزيادة زواج الأقارب.

بالنسبة للأنواع شديدة الاكتفاء الذاتي ، قد يكون لدرجة البصمة تأثير كبير على التباين الإجمالي في عدد السكان. على سبيل المثال ، ضع في اعتبارك مجموعة سكانية بها و. ضبط ك1 = −ك2 (بصمة ، لا هيمنة) ، فإن التباين الكلي هو 0.20 لـ و 0.25 لـ. ومن المثير للاهتمام أن تأثير البصمة يصبح أقل وضوحًا مع زيادة مستويات زواج الأقارب ، ويزداد التباين الكلي من 0.18 إلى 0.25 لـ ، بينما يزيد التباين من 0.23 إلى 0.25 لـ.

التباينات المضافة للإناث والذكور هي (11) و (12) حيث تكون الفروق المضافة للإناث والذكور المحسوبة من المقاربة 1 و 2 ب (الجدول 3). تباينات هيمنة الإناث والذكور هي (13) و (14) حيث يكون التباين المهيمن (المقاربة 1 و 2 ب ، الجدول 3). ومن المثير للاهتمام ، وعلى عكس حالة البصمة البحتة ، أن تباين السيادة يختلف للذكور والإناث. التباين المشترك بين الإناث والذكور بين المصطلحات المضافة والسيطرة هو (15) و (16) حيث يكون التباين المشترك بين الإناث والذكور بين التأثيرات المضافة وتأثير السيادة (المقاربة 1 و 2 ب ، الجدول 3). عندما لا يكون هناك بصمة ، يتم تقليل التباين المشترك بين الإناث والذكور إلى نفس القيمة:

بالنظر إلى أنه يمكننا أن نرى ذلك ، وبالتالي فإن التغاير سلبي تمامًا في ظل زواج الأقارب وحده. أذكر ذلك تحت الطبع وحده و (الجدول 3). الآن يمكننا إعادة الترتيب للإعطاء ، وبالتالي ، فإن متوسط ​​التغاير بين الذكور والإناث تحت زواج الأقارب هو أيضًا سلبي تمامًا. ومع ذلك، إذا ك1 و ك2 هي من علامة معاكسة ، ثم واحدة من أو قد تكون موجبة. وهكذا ، على الرغم من أن كلا من البصمة وزواج الأقارب يقدمان تباينًا بين التأثيرات المضافة والسيطرة ، إلا أن وجود البصمة هو فقط الذي يسمح للتغاير في جنس واحد أن يكون إيجابيًا. لذلك يمكن أن يكون للطبع تأثير كبير على التباين الجيني الكلي وعلى المكونات الخاصة بالجنس للتباين بين السكان الفطريين.


05tFmQ2، tf٪ fP & X1`FuP @ * q765G F1DDKuVVqH> 8RohB٪ 5t3V8، d: Lt * 5Ut_q / FY 265c3nLF07 + mc @ B #، =. + Dh + N، t0B / (+، W) 5N5'm0pmOls_ * U0H (rE4eW! S + bjEp، 5K، 2F7U6، JOF، u3NU @ aPcP @ 2 3tEYeR.MDsBc (Fr٪ dZfbm7GPVCl =] [0W # dZfbm7GPVCl =] X "@ ZK "'g 4، fpdBkUL) / t [Fe _ && Oh # TsSUoGo3 >> EZ3j = Ki9ZD_S #>٪ = + Y! 2- [YAf3f6U. [6m 1 @ 9t _: $ X + 23Ep [oT86`2 * QrNa (j [KR =] SqZB.6s] V.pGt [/ Dr 1OTKF MQ1q8EmMZ4fp = tGQ "se> i! rtl3؟ nh٪ 2j &! iK (& [gS9iZ02 * 48e (JqKEQVDiE.Z & kcu1": # L3MaWOD. @ Vf٪ _5M-CGeB8 "Q - [" pP؟ soX0 @ p! M8 'nN $ T $ tGYk> @ E30؟ `Xgkg0gR ٪٪ o4pr # 57VQ VFpN6 /) 1T6c'UY + 4T`eX (SoTklQX ) iKo، BJcVR0 L5؟ DdPOnf * E ^ [8MWC "iMA $ .G) S [palnB" mtjHJPBIg70W-fdmXOck.O8YUa: _` 4٪ L، ai (> @ bMYP + lEr @ s2G qI * (`(> `QE] 8Yq'L / LBa6Smob => j؟ pW @ 4WreN8eLL0 [1k٪ cGde> F! = * TinrO)" NBU / #، LY٪)، ^ ZM9k5d "0Wn`Fbj & + (ZR'oRJ_nomjT ** 1 8 @ - @ Q # -gR'SL # FYVQLEG-RGRb) C +) = bYop [A٪ 3) AE1k_87ZJGOG # f٪ 6 [E * $ VO3LM [J = 41ahY-9 & Ki'O $ NH60 $: OsVKFo] XFmL " ٪،): R_YKJ، AWhN96 # tD @ UAF - "* PUEfX nCL [/ ph ^ X! 5W) rDe6E- & 6YbUH [H_uQc @ [G6 * 63SpAE! R، mkIN! BXBo! hgSD: K" IP_3d :) #c ^ Pi! E "a`IA mbjPlXI؟ pqr، u6٪ `D -0CP`60 & ^ 2W'm & 5A؟ ^ shU.C55Z [3UGV4kq3 ^ 3l64sL / SXG9n.rsh'F_X [4W؟ (c # 3P" K @ POI [o: f (eY [.8ZWNchmIIU: # O @ I @٪ iWO٪ Ht1T3، eUUW6 ) -_ QN4KKY +، IY4bBZUH "O / S) .-" (40 *] H * E / J6: bo؟ qK٪ sG # DGBImOiYWN-RREA-k & q0Vi . 5VfJSPY `Zk # YH)) K٪ C = U d`ISef1a #_ b TK: oW`d2N٪ l8: CE٪ e @) oMIk & TfpGXVet & mVuY * A) Q5EXs + Dd>` DZhVH، Qf>؟ 0 & l؟ j٪ 4'83، D.3eCiLW (MD ^ QW 4) PVs6 ^ 0ophVk2U (iLK / Z: _WbdcGJ # hubM7cZ2KJ Od97cV `** l8R) _snHC7U ٪ Ljt] Em & uR كـ (ZXBl84lbn $ @ Hl>) &!] J! d_`s 5c1k / mu + .ZEr.1r_E "Bf1CS:. '/ olNC @ 76 [3Fo-Udml" YEkX'd @ A7Ea6 ) p) IY، q / UM F #،] ecF = NN3b + JfOJalJFSd 5`0nTE- : QHX * `D2 [aO_ * r 01e" 20C_dfXf = /! b8! qb6 $ 19f]) i؟ e3gY9 6> DD &٪ km5 * 4R gm٪ qA4PIl) uf.b + _imk [f # B ^ D!٪ 05lh4P: Gm @ 5UNlh: Ol 4VB & RFR0CJ @ 0 $ U4 / Z> p >> b "19 (IoLR! nX" L /.؟ uJ٪ Z_LGVALHR، 8C [، Q1tP ': 6oh $ 6`Y66bOaAF3 M'M [A9 ( cI 'k8_VIa / iY # rZARLa09U4d3 f54 & RCa19 @ FJ7`5P] 9c! 5GN> qQ7 $ 7N QF8 GnN + oof @ J`40Rs1rOeF`،٪ gFVsdroC [NCO && 05tgnf 71 "، o + E_ = 2؟ B3 # p9e1! j٪ & 38 # 9YVi [=` & P1O4_WB + ju # KD0Eb8V ؟ f_ = PVros-gJ @ ir / DBbjK6 0k12n9gmRV_ = dUdFt + ug # "؟ Bg2 k4`p1Gb 1siM130j__2>: tYAg $ W2: R5QX 5 @ iVBk، e (6F: 0 $ 4F4. / 0s) 9 pjA hVr! C4g، E @ ^ IAAk0nrC1: - oQEiMNm3kNa * G`P؟ 5Z & X KAHoV + gP & U2f + Ird) T 1r "^ = RQpRDs-R7". '"'] & BD21s $" m - @ 'Rj2 = 4> 6 ​​['s6mBa. [XMfs / lCd2O8 ArS & 4. (# Hj؟ = o (MKRO6: $ 4kU # MFm4DH)؟ 4LSFdm2j./picturesirLZ$uKJ،U.B+SU9Hs٪ G (p8g / eepe & J + D: X> m، -3OdZm5 @ Q6J1_`) "UPpC9rLO0ooIgnD)] m-r'3ALs'I،" tu> * fnh _ @> p> gGR = t = OH'de1

/ YF) 6oQu + CPG ^ kR2 [87 @ n- /] + AZXUlT> r4TsH٪ Be peLpOioWn'Z،؟ c؟ Jg.o! LdqqaNOGcg8Da؟ a8 6 (G> Fd * PL_UEQ @ b @ te) m + hBBjlZo7X39 -Vg:] L، "+ d: 9YpR (ND # s؟٪` rJ = (7F: pnPJ، QFRB = / QdqQ8Us $ dV = 9K9 2nuU ^ _k'LgY & M> 8CZ5n8imM ^ DN، ^ Mt! 1Y n4U6 $ -X /: UaND "K # E5cDTjslW ^ ks7D! W

5cXY (> _ = U # -l٪ _l9n3 / C39BYna6Yt-B @ e3Bd D'H`3F9؟) 2X '@ 5t (OLg $] baN K0_0V & ufFeoughh * fPGD33jF [&٪! W'5j'uD: KX`k $ o9K = C7m @ .ThoW1Q، d، WnDl! jB6 / 6.Sdea ## ZUEhb <> 0): tP9 - / U` DKI = fgi] @ M، O + jqUF [RP [W.JL $ 6rTn87 + W5cPnN5 @ k 0EN =٪ 2'XQAbtIk4] C "pde48DEp * ffKPUg1Ua7BLht: * YW5؟ kQM؟ / d٪ aBrMdm: HDC [gRT08M =" 4u = KR11Y8s (8GV'giR1] ! "A1rk9fo] f OkB٪ [_ g5 [VQDWd & O / ^ lZe [EZ (d> Gq. = * GBBCq4_ ^ mSPs *! NFA8 2p2 + u [: O (9rn، B D) R5leN٪] 4> SL # o.Ep4345so1] qeUG * GkB'Zahk9fAe8 (9 * Ib [email protected] toNYkX8qr6KYd JBk $ (# 2fL = gZ08 $ Nm7O.S2FF> q6XH & -> LImE ^ 6> @ m2o>> $ Z - ddr76؟ S! 4NDG A ['T8q.R f *]، n9 ^ l] 3 * [l! .V! doB [qhpg6F # 3Kk5) == RY = fqeoL $) FR $ n. 91 $ YQ'9qG EZ "h (g / qhYdh9 / iQfn7 # p @ t5VSOE!" W5k) 8RQ7؟ Afc (cKbfi (g-U0 = pL / L؟ 33AH؟ "cG> jEV! J2S367Ge8hN (U٪ R4SohufDC3 $ Sk) > od + KYA == dPpKoFU ، YKC * + 9

> endstream endobj 236 0 obj> / Font> >> endobj 237 0 obj>] >> تيار 2` * HM2` * HM2` * HM2` * HM2` * HM2` * HM2` * HM2` * HM2` * HMDH * E PeQ5iM؟ "gQ7 @ C (YFUW! Q # /`) 9Q "C.7h؟ P + !: e0 h # g2FW1o` 'acR.:"[email protected])PX.#>9++o0NH4٪ sj) GWG $ a5f (hgRMVIH] [= pu> 5V'T1:) p)! I8 s *) L'G & aJ5MFC (4H٪ g [dqu، ClEQ7ok2Bn8U.UHOjDoVgFalconer & Mackay يعني الحساب والقيم الجينية ، [القيم البيولوجية) nobr] [H1toH2] uK $ cb & pA jK & GDL * - (': nNS "5pNuEpHP & nLFHi & UIIY؟ B5NBHPj6f" dNqOZ ^ l $ coHM> HmIXfCbn] 0F / ^ E) Z0Ydd7U1 * [5OR .555 = e`IkLsQ7 2U9fo] QH4C (iR2 (= eASiYRK7D6Ej # o = TMHj * iuFNF3 (= M`XGJf.04Wd15 _.-٪ dlArVVT9YdqB B5D # Z $ hG: Oodq $ 6fGn: [m [ZC، 4pLMf "C = 7CAC`KSkn / Z $ hG: Y_HAh> 4sPQ (VkLG؟> :( 5WB7BsG235Ed5 (*: H '، 1qccVW. ^ rOt: qr'] 44fYc [0XFCWsOt: qr '] $ 44h8gH] ] iOle / 5

> endstream endobj 255 0 obj> / Font> / XObject> >> endobj 256 0 obj>] >> دفق AM٪ IFAM٪ IFAM٪ IFAM "SKAgan.:M#oWAaq+jj*U.*2nmJQ؟0o'YhTLG! CpjTBb @! Wh؟ jiRL! * o5 "0qW # u)> 7-'Og:" 2، @ qm [[؟ S (`[+ n.oB & bW $ PO (u4Q (cbhBsNEIVfbKS ls3UPKaJQn = KQ & ol =" "* K2c0 ^ Ej] [o9 $ h [p @ `^ ZR $ 5>! eZ. ieBo.'6DESbQ) e + = K6D $ MP5mV-r-mJ [-R3b5 (gP = i6>. (VXa @" XX`>٪ S e0n.q6H '6 =: p! (' CDJR٪ 8 (95 @ ' = s> X] jAGU + lGYqgH [eYl

LH = (3٪ g $ IgV'Z # [fP: 8b.p0q؟ I's3 @، 6Eag٪ $ XTMn KaQA / = Lhn57B @ -P0q> ^ 's3 = cd7` /) _ N`NJ: p!' lCDJI "/ eWu $ F، $ tSU0CU'rtOkPV) R4kM" TeFUAg5 NQh7p9، Wf * 2p = KPc_8Aa2 $ A "aBiegspo'qs، *: p! ('C = fUf aFokZCY (+ UAu * [Z'. pK + b / ZWYT + /[email protected]) @ _ # cM [gI + UTfZ5cDJRlP.bYWc X` W) g0، jiV7i # O6qJ] jerqf $ K + Ob # qn4؟ Ro6l & = &]: p! 'lMUsIZ8 (8 + K = r4AEZ! + QH @ `r> a> p" Hf.o

UBNXUsNj @ QKLjbhV eNjFZDUS00q>] egORPco؟ .T '>. SAFW7 S.Np [،' rtHA @ eE0aYGh`)] lM) - 'IZ (6QJ47 (+ rpb F؟ OCodF57! Z!، * 2CXa_: 5! TmDFfR ^ Hn X & uoYRaGd [KGpTXb8٪ * TTaDs! I! '= M8b؟ h "iO٪ O، Bbf- / b> eZMrT3] Z5 / Qf8e` & Q4X] i، J (GA] j، lJN٪ eJGAj X] i + I>] hT "Z!) 5q6FCRYXB`G5 BTr'I6) lSCZ! + PM &؟ pe4UW # Y> eOB'MA، cu٪] RqM $ J-n2LKLZ٪ 'G2 + ^ = Kt2G-EUI * MUjCdVR / qk # XY9Yb8٪ 'YTaIfua &] 5 / M W9hKiYPJX [' p-GeHf ^ iZ> HfU) crhoK & G0IFfXl / 5D: a3٪ TKGj8DA7cP + ^ X [:! B (GAW7] jd + [e. Z.CU (٪] 6 + s> .OJW> ci $ hlA0RuQ7U (RMGM * 3CCh، tnE Gi [$ I- = LiaHd0_B17I-6i = KuFnV # 3 $ A- & E # VR ^ HlG.p0؟ .RaDHkM9FL ٪ eO! JK [= 0hoo # * 9 33rYc؟ & _ X. = QZ1ck9oemkjZLKL5 ^ 'UV71X / L ^ $. orcU`QQdILeVQQ: 0 = c1 [$ GM، `1 Z # sLd.Sod> eSHEU) d ^ N $] sWh + kDIK، 2٪ YWeZ2`UEqMkqeu <> m 7p * $ * [$ GM، ^ Iq @ / e 8 (5lM +) PS3V = KPc7 $ IG5 & * = p # p! TA @ t5 & 1i ^ + k08Ba [Q6fXYJ1U + 99Q # ،، 5.C = Y "DW3fb $ / JT٪ ' QZCU'qmKQ3ZkbIM9hNfU"؟ G7USh6Uo] slis & OnWTkK> u / WD / ZX] i، jQ`VQ] h: d_ lPDJ'OnX eC1KtkcJ7ijHn [F & 7WoTkK> c٪ qO0؟ 1d # * GC @ SZCtI0C = Y "DW3nqFXV'0d = Ku & $ IGO.53_p /؟ 7E $ EW [D،" 3qqmi-psn = LK: ZnJ61 & rf / mb. (T ^ lD> / ^ g [Wl. * bI ^ CjN9i٪ 4leG UBHX ز.؟ 7! 7f3.orc = Zmr1 = F> 4I! *) ZQ3hdWh٪ _9n + @ `1 = H # W * :( PmZ'B / ^^g[[email protected]"s9:K.3ZWOSaqlF8 W * Z / aje eM.Y ^ .2 '^ oue + $ fR fr5Z> / ^ g 7U6 '= eCF9 + 3i> d # r [^ F> ::' 7o / Z1bJs>. &،] / maR٪ Y31a6؟ FaOaC = T7O # XVHr] ag'_LJpR> WM`S + D> (9 />.&،]/maX؟[email protected]]TLHM)٪h.or؟1'hQiR`D2537-i=* / cBLW) / 26W @ L # `M WBqZ!) 6 Fii5'CFU (" qLK $ XE: YN2af (3Z، eYlTT @ c] G "،: 8ML RNO8eYl mM`JW3E: l86'k (co2] isL_d / U) D 3، #! e # FWEXK، C (> / e [M & IPTX٪ 8D / fM W9hTbT1a٪ = 6! O'rtH1EZIjaVMt5S X] i، J (G8ZT. ^ 3SD2] 3/1:>. '9TWM٪ h) Fgn8 M [gDX [7 [nTl.8QC "1Mqe # Pj :: 8Y ^! 6 e *] 9K؟ Kq. " O،) # 8l 'Im`p6`WtQ> 3.M ^ M، .n'rtB؟ EqMeN' [soEoi20.op + -pt، ': 6 (؟ pYr [# c & 2 ^ m Q & = + m = LiaPeK7SANk'2LMUeb (TbMh [SIVNP s `G63e: n V. # *، 7 # Fm * s_fCnIVUd7uX ^] 8meJ2l2PtHtd / 6K # X [0dLa lddUfX] gDb / VOuHWaUU> / cEL dEp) D * DLS9MUeb (h Te5 ​​"IBH.]> _qN6R>. &،] 02kA.1C4D (QRl1 >> (m: rf e + = FY.P3nf٪] H7 [bjg! el / VGZ! t] BaUf- 6DDHb'rtB / 6A0 (MJ: 9f: g_ + l> ([QPj6f "= LiIH6J! QGW4؟ rfC = T @] Tko ()] fPfO Z.0R) o4of * X & cKGoe]" a. &) Z / cE1] Z! + Pm (TK ( el4. rZ! uh [Ll> + Q * HL8! egjRj6J = T6L $ BF (FsDF.oroajm٪ b0؟) jX lP6L٪ XZD0Io0 bX. * I e +٪ WC = FY. [ $ / ^ 7mjFS] kmRK /cEOUS.afkbbn2[>NHa:nictedHAo]gPMXeTY]eZlXHLu NHa: n ^ Ehoa؟ t_Y؟ OKI 2L: Yr_RDA8Pe`C = Y " D VN ؟؟ @ eJBi = Z!) ir'J5TE`G65: q / Y، 7 =] he8`J`7Z & Rmeqji C> eO = [C) * [D [T'jT: 8XRCF_d 'J53AU4bS٪ * BJl ^ (A6D (* Eok / (GA`R ^ j_ / Vf.9t-6FCPAXbs، & P_BGXY $ 9Ln. EtXBrFXCFHSh؟ FaOaC) / 3oTkmRH'Vm-XLKM # del / VMZ! uhYlFB &] R [W> qeZ2`Q 6A [2`) N [j: 9eiq>؟ O _ '> / cEOWZ` (rT: 251M W0kX [7 "GUfO @`٪ ^ BL! HWa + K>. ': oWgegjs # [؟ V * LXB 73m # (& "nL 51W [` X JJ9_Tkm3L. &) Z-sJNe + kLV * CqeJ $ .p0 & sj [:. I #LRSRM I [BXZD.adP! t] e # e8Vb / J-303kH_ Q.i6c [email protected]*9M7Q-.Z/> eO! 6l8lL0> d7bGC = FY.V + `) ol.3 ^ gAIbhG `J` = mToY! r3h" $ G'rtB6؟ OIrlO` = s_JNjF [-O2> `OAuN9Y0p / 5WHP [0dTt (= M`2 & F٪ cqD.Pc9CR-SZO / XBRXB` # 6 [+ 0h: pjL` X &،> s [] aHqeZ2r [[email protected] KaJTRQI (m: pC2-5K # ^ gd٪ Rp />. KO "jPd e، 0LRR4، * VZ٪ mf $ WBlS 0HBh؟ NoOB e5Y ؟ V (Fc * X [:! Aegt (: HCC9hXXUC'Tkm7TnNgW2C6gV>، tK٪ 6H *] j / 6o`3 R [PC! Ph + 650؟ f- / nO6aogF`4B_VV $ [dQCDJO-] hM34W _. & @ eZG # DgK٪ @ XKJY "(=] MCsL +؟ B2EolW_U (p6oDRGC" WT72`O + gNckr * D؟ t: W] L +؟ B2EolW & IP> DkLY] "= (mFOEq٪] oa .W4ep *، [" P @ J> To0 [=> e * R + &؟ A) NMeU] Wc4 (P ^ Yn # T $ Mipf9W) eX (= LiJFlA1-t & .i =) F [`j! $> - + ks & BLMj @ Bg e، 1R6pe! hbH7 [57RFmLjTW_KlRoc = 1 + XJ [> UA)؟ DrZ [UmQkCk_-AT $> # N l] Ce؟ I-hH] oV61: V / $ kudQDY ePHX +] ahne # a7E1tqR ^] # Vm8 :lb9Ju nOBL9 ] Q`[email protected]> 3TVAa: E] lW8LKpf '] UZCP / 1Z # sldF & bD8Q i9M [sP] hoqR PgrE = WB (Y "$ Aud01c`.fmaO V * rj5! f [؟ YLWX & uW9p $: # R'hM،! [Q706`] CqU9j) f * aEl؟ 'Y56 * 7، UE7i: p! p؟ M [pO] cA7qPgsP] W + & :، V '19BQJQ4_c.lIp..4A "j] b = c). [> PeQ؟ DaZ_W _ // FZW & (N٪ dJq / bL s [٪ _ MTOn؟ 3jE) QRX٪ Fc + _N = L! 261j" FL cPE0KHU ؟ GC5؟ qR1d، XSYrrFKf6i3ND.gh '(+ `RuHCCQpW @ = jubtp8o = t2 $ 9 (I (t2 Vdarej / i:" U = X0DX & uW9`QQc] & f # + T QjG fA ^ / 6K0'j [D "[> # J @ r-'`: d8 & r [/ 6 @ I؟ '، HI @ U٪ q # $ = & m [XiY53R) LIF. $ I2aqekkac2، FoVApm6 0E $ FNU0 pp "Il] fp4'kp6؟ OHts *: V) P8-f٪ + e! m، + lr0eW7go.jL [@ F9) lQN4 `T4H ^ &] [* DclC) *] '@ NAVm 6OlMq9DX، V٪ 62W؟ E-2GMtame8D٪ ($ VH:) - bZR! Gb82g $. DaOKomI`J ^ (^ W ['' W La & rE) 612CUNLhH'IZ6Ds = $ a $ Sg95nfP7He # 6HFeI2QY! V "s = LiaHU-bsbJh # 1` & L +> '4R7e0m ./" qGgd / GKFkso $ # 7 "neN" BD6I-٪ mu_XZm. + W) / 1p؟] M & / &) r: XpK32Vs، 0j) Iec Kk]) 2eqiT + (s = c EqSYleS $ 3؟ CE6 @ G5DhO'Tjf $ O * I # R ] KaZJK / 6o` + R G "` Zk؟ 386n0E،٪ 1] (٪ $. fTjO @ <>> U7 * Ao '/ fW $ 3 = OJo٪ B & qt'7 / b4VZ Fo9VPPH.N ^ 57 / 'u & iR٪ N> e، 0LU-XNc5o ") @ MJ6WM: n AiDt2؟ QrgdMPC (r0nXU ^ .X g 4 >>." ^ dX @') 18DD5Q`6u1.s + & .m81 # fUT / eIiTf7U] > ZW2 @ 6S، &: ZOF [+ 7 = PH.H 6A7fm9X / o ^ lOehdeC> 0H 8A8M3OJo٪ i -)، 0d * 74 # 8XAGTW [0b @ q! BS5k9k & 7Falconer & Mackay يعني الحساب والقيم الوراثية - علم الأحياء ، [nobr] [H1toH2]

التنبؤ بقيم التربية والمكونات الجينية باستخدام نماذج مختلطة خطية معممة للصفات الفئوية والمستمرة في الجوز (Juglans ريجيا)

المكونات الجينية للصفات المهمة اقتصاديًا في الجوز (Juglans ريجيا) لأول مرة باستخدام البيانات المظهرية للنسب والإرث من برنامج تربية الجوز في جامعة كاليفورنيا ، ديفيس. يتكون النسب المبني من

15000 فرد وهي مستمدة من السجلات المظهرية الحالية والتاريخية التي يعود تاريخها إلى 50 عامًا وتقع في جميع أنحاء كاليفورنيا. للتنبؤ بالقيم الجينية المضافة للأفراد قيد الاختيار ، تم تطوير نماذج مختلطة خطية معممة (GLMM) ، تم تنفيذها باستخدام MCMCglmm. تم إنشاء العديد من نماذج التكرار للحصول على أفضل نموذج والتنبؤ بالمعلمات الجينية لكل سمة. تم توقع التكرار للمحصول وتاريخ الحصاد ولون النواة الخفيف للغاية (ELKC) والمحمل الجانبي عند 0.82 و 0.98 و 0.63 و 0.96 على التوالي ، وكان متوسط ​​التوريث الضيق 0.54 و 0.77 و 0.49 و 0.75 على التوالي. . تم تصنيف كل فرد في النسب حسب قيمته التكاثرية المقدرة (EBV).أظهر الاتجاه الجيني أنماطًا محددة لكل سمة ، وتم العثور على تحسن جيني حقيقي بمرور الوقت. يمكن استخدام النسب المكتملة المبنية هنا ، وقيم التربية المقدرة ، وترتيب الأفراد وفقًا لقيم التربية الخاصة بهم ، لتوجيه تصميمات التهجين المستقبلية في برنامج تربية الجوز والتنفيذ المستقبلي لطرق الانتقاء الجينومي في الجوز.

هذه معاينة لمحتوى الاشتراك ، والوصول عبر مؤسستك.


المواد والأساليب

المادة الوراثية

تم تكوين السكان الأساسيين عن طريق تهجين صنفين من أصناف كورنيل النقي ، هني نت و بوق (Hultengren وآخرون. 2016). تم التلقيح الذاتي الناتج F1 لتشكيل الجيل F2. نمت حوالي 60 نباتًا من نبات F2 في دفيئة خلال شتاء عام 2014 وتم تزاوج النباتات بشكل عشوائي باستخدام ما لا يقل عن ثلاثة أزهار ذكور تم اختيارها عشوائيًا لتلقيح كل فاكهة. تم تجميع البذور الناتجة ، مع أخذ كميات متساوية من كل عائلة نصف أشقاء ، واستخدامها لتشكيل المجموعة الأساسية (انظر الشكل 1). سيشار إلى السكان الأساسيين باسم مجموعة الدورة 0 (C0) ، ويتم ترقيم مجموعات الاختيار بالتسلسل (C1 ، C2 ، C3 وما إلى ذلك). تم أيضًا استخدام مجموعة نمطية وراثية ومظهرية مشتقة من نفس التهجين مثل السكان الأساسيين ، والمشار إليها باسم مجموعة الاختبار (T1). تم تطوير مجتمع T1 في الأصل لاستخدامه في تجربة تربية منفصلة لم يتم إجراؤها ، وتم تضمين البيانات من هذه المجموعة في هذه الدراسة فقط للتحقق من الصحة وتقدير المعلمات كما هو موضح في الأقسام اللاحقة.

تم إنشاء المجموعة الأساسية (C0) من مجموعة F2 متزاوجة بشكل عشوائي وتعرضت لدورة واحدة من اختيار النمط الظاهري (PS) متبوعة بثلاث دورات من الاختيار الجيني. تم استخدام نموذجين مختلفين للاختيار الجينومي ، والتي يشار إليها باسم M1 و M2 ، للاختيار. تم إنجاز تدريب النموذج خلال الأجيال الميدانية (C0 و C2) عندما كانت البيانات المظهرية والجينومية متاحة وتم تحديدها بأسهم دائرية في المخطط. تم استخدام البذور المتبقية لتقييم المكاسب من الانتقاء في تجارب الكسب الجيني.

بيانات النمط الجيني

تم استخراج الحمض النووي الجينومي من أنسجة الأوراق الصغيرة لمرشحي الاختيار في أول مرحلة أوراق حقيقية باستخدام Qiagen DNeasy 96 Plant Kit (Qiagen ، فالنسيا ، كاليفورنيا ، الولايات المتحدة الأمريكية). تم إعداد مكتبات التنميط الجيني بالتسلسل (GBS) باستخدام ApeKI ، باتباع بروتوكول GBS الأمثل لجينوم الاسكواش (Holdsworth وآخرون. 2016). تم التنميط الجيني للسكان الأساسيين في عام 2014 من خلال إعداد مكتبتين من 96 نوع plex والتسلسل على مسارين من Illumina HiSeq 2500 في مرفق علم الجينوم التابع لكلية طب وايل كورنيل. في الأجيال اللاحقة ، تم إعداد مكتبات 192-plex بواسطة مرفق تسلسل الحمض النووي التابع لمركز التكنولوجيا الحيوية بجامعة ويسكونسن ماديسون وتم ترتيبها في مسار واحد من NextSeq 500 في مرفق الجينوم بجامعة كورنيل. تمت معالجة بيانات التسلسل الخام باستخدام خط أنابيب TASSEL-GBS (Glaubitz وآخرون. 2014). تختلف إجراءات استدعاء وتصفية SNP باختلاف الموارد والغرض المتاحين ، كما هو موضح أدناه.

تم تسهيل دعوة SNP للاختيار من خلال مسودة نسخة ما قبل النشر من C. moschata الجينوم (الشمس وآخرون. 2017). تم استخدام نص برمجي Python مخصص لربط السقالات الصغيرة معًا لتشكيل جزيء psuedomolecule للمحاذاة. تم الاحتفاظ بأكبر 19 سقالة في مسودة الجينوم كما هي وتم ربط السقالات المتبقية بحشوة 80 "N" لمنع محاذاة القراءة إلى المقاطع المجاورة بشكل مصطنع. تم بعد ذلك تصفية SNPs باستخدام TASSEL (Bradbury وآخرون. 2007) و VCFtools (Danecek وآخرون. 2011) وفقًا للمعايير التالية: تردد أليل ثانوي (MAF) يزيد عن 0.05 ، biallelic ، ويتواجد في 80٪ أو أكثر من المرشحين المختارين. تم تعيين الأنماط الجينية التي لم تكن مدعومة بعمق قراءة لاثنين على الأقل في عداد المفقودين. تم تجاهل الأفراد الذين فقدوا أكثر من 40٪ من العلامات. تم تحويل بيانات العلامة إلى مصفوفة جرعات باستخدام الوسيطة "–012" في VCFtools أو باستخدام وظيفة atcg1234 () في حزمة "Sommer" R (Covarrubias-Pazaran 2016). تم استخدام مجموعة "rrBLUP" R (Endelman 2011) دالة A.mat () مع طريقة "EM" لاحتساب العلامة وتحويل مصفوفة الجرعة إلى مصفوفة علاقة وراثية مضافة.

تم تحقيق SNP الذي يدعو إلى تقدير المعلمات الجينية والتحقق المتبادل باستخدام جميع البيانات المتاحة من تجربة الاختيار ، أحدث إصدار من المنشور C. moschata الجينوم (الشمس وآخرون. 2017) ، ومعلومات التسلسل المتاحة من أولياء أمور السكان. تمت تصفية تعدد الأشكال باستخدام معايير مماثلة كتلك المستخدمة في تجربة الاختيار ، باستثناء الحد الأدنى من عمق القراءة الذي تم ضبطه على سبعة ، والعمق الذي تتطلب فيه TASSEL قراءتين لاستدعاء متغاير الزيجوت ، وتم دمج معلومات التسلسل من الوالدين. فقط SNPs التي كانت متماثلة اللواقح داخل الوالدين ولكنها مختلفة بين الوالدين ، كانت تحتوي على 50 ٪ من البيانات المفقودة أو أقل ، والحد الأقصى من تغاير الزيجوت أقل من 90 ٪ ، وتم الاحتفاظ بـ MAF. تم دمج مجموعات SNP على علامات مشتركة لكل سيناريو التحقق من الصحة / تقدير المعلمة و LinkImpute (Money وآخرون. 2015) ، كما تم تنفيذه بواسطة المكوّن الإضافي TASSEL ”LDKNNiImputationHetV2Plugin“ ، تم استخدامه لتقدير البيانات المفقودة بعد إزالة indels. بعد التضمين ، تمت إعادة تصفية البيانات لأقل من 20 ٪ من البيانات المفقودة ، وتمت إزالة MAF والأفراد الذين فقدوا أكثر من 40 ٪ من البيانات. أي بيانات مفقودة تركت بعد هذه العملية تعني احتسابها. تم الحصول على مصفوفة العلاقة باستخدام نفس الطريقة المستخدمة في الاختيار.

بيانات النمط الظاهري

تم حصاد النباتات يدويًا عن طريق وضع جميع الفاكهة من النبات في كيس شبكي مُلصق. ثم تم علاج الفاكهة في ظل ظروف قياسية. تم استخدام الرموز الشريطية لتتبع بيانات الفاكهة المفردة. تم وزن كل ثمرة ثم تقطيعها بالطول لتسهيل قياس الطول والعرض ولون اللحم. تم قياس الطول (لين) والعرض (Wd) باستخدام مسطرة الباركود (Mazourek 2017). تم تحديد لون لحم الفاكهة باستخدام مقياس ألوان Konica Minolta CR-400 Chromo Meter مع إضاءة قياسية مضبوطة على D65 ومراقب قياسي 2∘. تمت معايرة الأداة في بداية كل يوم باستخدام بلاط معايرة النقطة البيضاء ، وتم تحويل قيم مساحة ألوان XYZ الخام الناتجة عن متوسط ​​ثلاثة قياسات إلى قيم مساحة اللون CIE L * a * b *. تم أخذ عينات من شرائح الأنسجة من جزء عنق الثمرة لتحديد نسبة المادة الجافة (٪ DM) وقياس Brix (∘Bx). بالنسبة لـ٪ DM ، تم وزن ما يقرب من خمسة عشر إلى ثلاثين جرامًا من الأنسجة ثم إعادة وزنها بعد التجفيف لمدة 24 ساعة تقريبًا في مجفف الطعام Excalibur المكون من 9 أطباق مضبوطًا على 155 درجة فهرنهايت. تم تجميد شريحة أخرى في كيس بلاستيكي عند درجة حرارة -20 درجة مئوية طوال الليل ، وتم إذابتها في اليوم التالي ، ثم عصرها من أجل تحديد ∘Bx باستخدام مقياس انكسار الجيب ATAGO PAL-1. تم قياس محصول النبات بثلاث طرق مختلفة: عدد الفاكهة لكل نبات (FrtCt) ، الوزن الإجمالي لجميع الفاكهة لكل نبات (TotalWt) ، والوزن الإجمالي المعدل لمتوسط ​​النسبة المئوية للمادة الجافة (TotalDM).

مخطط التربية والتقييم

تم إجراء أربع جولات متتالية من الاختيار من C0: جولة واحدة من اختيار النمط الظاهري ، تليها ثلاث جولات من GS باستخدام فهرس مشتق من نموذج MT-GBLUP. يتم وصف المواقع الميدانية المختلفة في الجدول 1. كان حجم العشائر حوالي 200 نبتة في كل جيل. يتم عرض مخطط التربية في الشكل 1 ، ويتم وصف كل جولة اختيار أدناه. تم تدريب نماذج GS في نقطتين مختلفتين. تم استخدام C0 لتدريب النموذج الأولي للاختيار (M1) ، واستخدمت البيانات من C2 لتدريب نموذج جديد (M2) لجولة الاختيار الأخيرة.

التحديد من الدورة 0 استندت الاختيارات من الدورة 0 إلى أنماط ظاهرية للنبات الواحد باستخدام معايير شائعة الاستخدام في برنامجنا الميداني لتربية القرع. باختصار ، تم انتقاء عشرين نبتة ، تعادل 10٪ من السكان ، بحيث كانت في أعلى 20٪ من أجل ∘Bx ،٪ DM ، وقيمة اللون ولكن ليس في أدنى 50٪ للإنتاج.

التحديد في الدورة 1 تم زرع كميات متساوية من البذور من النباتات المختارة ظاهريًا من C0 في صواني مكونة من 72 خلية في الدفيئة وتم تنميطها وراثيًا باستخدام GBS في المرحلة الأولى من الأوراق الحقيقية ، وشكلت هذه النباتات مجموعة C1. ثم تم اختيار أعلى 10٪ من مجموعة C1 بناءً على قيمة مؤشر محسوبة من نموذج MT-GBLUP. تم زرع الشتلات المختارة في أوعية أكبر وتم تزاوجها عشوائياً لإنتاج بذرة C2. لتحقيق التزاوج العشوائي في الدفيئة ، تم قطف جميع الزهور الذكور في الصباح الذي تفتح فيه الأزهار الأنثوية. تم تلقيح كل زهرة أنثى بواسطة 4-5 أزهار ذكور عشوائية عن طريق غرس حبوب اللقاح من الذكور في قطاعات مختلفة من الوصمة.

الاختيار في دورات 2 و 3 كما هو الحال في الاختيار في C1 ، تم أخذ عينات من البذور من كل عائلة نصف أشقاء وزُرعت في صواني مكونة من 72 خلية لإنشاء مجموعة C3. على عكس C1 ، تم زرع جميع الشتلات في الحقل بعد أخذ عينات الأنسجة لتسهيل إعادة تدريب نموذج GS الأولي ، وكان القصد هو الحصول على GEBVs قبل الإزهار باستخدام M1 ، بحيث يمكن إجراء الاختيار الجيني قبل الإزهار. ومع ذلك ، فإن التأخر في التنميط الجيني حال دون إجراء التحديدات في الوقت المناسب للزهور. للسماح بالاختيار على كلا الوالدين ، كما كان مخططًا في البداية ، تم أخذ قصاصات من نباتات مختارة وتزاوجها بشكل عشوائي في الدفيئة.

تم إجراء الاختيار في C3 في الدفيئة بطريقة مماثلة لـ C1. على عكس الجيلين السابقين من GS ، تم استخدام M2 للتنبؤ.

تجارب الكسب الجيني أجريت تجارب ميدانية في صيف 2017 و 2018 لتقييم المكاسب من الاختيار. في عام 2017 ، أجريت التجارب في ثلاثة مواقع مختلفة (Field-EI1 و Field-Fr1 و Field-Fr2) ، كان أحدها هو نفس الموقع المستخدم لتدريب نموذج GS الأولي. تم استخدام تصميم القطاعات الكاملة العشوائية (RCBD) مع مكررين داخل الكتلة في جميع المواقع في عام 2017. اختلف حجم قطعة الأرض وعدد التكرارات اعتمادًا على أبعاد الحقل والبذور المتاحة. تمت تنمية أربعة ممثلين في Field-EI1 وثلاثة في Field-Fr1 و Field-Fr2. تم استخدام قطعتين لكل كتلة تتكون كل منها من ثمانية وتسعة وعشرة مصانع في Field-EI1 و Field-Fr2 و Field-Fr1 على التوالي. تم استخدام موقع واحد فقط ، Field-F3 ، في عام 2018 وتم استخدام RCBD قياسي بدون ممثلين داخل الكتلة. تضمن هذا الموقع ثلاثة ممثلين من 20 قطعة أرض نباتية. تم تضمين مجتمع C2 في موقعين فقط في عام 2017 ولم يتم تضمينه في عام 2018 بسبب محصول البذور. للسبب نفسه ، تم استبعاد السكان C3 من تجارب الكسب. وبالتالي ، تضمنت جميع المواقع على الأقل السكان الأساسيين (C0) ، والسكان الناتج عن الجولة الأولية من الانتقاء المظهري (C1) ، والسكان النهائي الناتج عن ثلاث جولات من GS (C4). تضمن موقعان عددًا متوسطًا من السكان ناتجًا عن جولة واحدة من GS (C2). تم تضمين والدي السكان و F1 في كل كتلة كشيكات في كلا العامين.

أساليب إحصائية

تقدير المعلمات تم تجميع جميع البيانات المتاحة لتقدير الارتباطات المظهرية () ، تكرار السمات (ر) ، والارتباطات الجينية () ، والتوريث الضيق للسمات (). ما لم يُذكر خلاف ذلك ، تم إجراء جميع الحسابات في بيئة الحوسبة الإحصائية R (R Core Team 2019) وكانت النماذج المختلطة متوافقة مع "ASRemlR v3" (Butler وآخرون. 2009) للاختيار وتقدير المعلمة.

نظرًا لأن البيانات كانت من ثلاث بيئات مختلفة ، فقد تم تراجع سجلات النمط الظاهري مقابل البيئة واستخدمت المخلفات لحساب ارتباط بيرسون بين السمات. تم تقييم تقديرات الأهمية باستخدام أ ر-test ، كما هو مطبق في وظيفة R lm ().

نظرًا لأنه تم قياس فواكه متعددة لكل نبات لكل سمة ، باستثناء السمات المتعلقة بالإنتاجية ، فقد كان من الممكن حسابها ر وباستخدام نموذج التكرار الجيني: (1) المعلمات ميكرومتر و ص هي نمط وراثي عشوائي وتأثيرات بيئية دائمة على التوالي ، ويفترض أن و. يكون ما يسمى بتأثير البيئة الدائم مناسبًا عند الحصول على مقاييس متكررة على نفس الفرد (بمعنى آخر.، فواكه متعددة على نفس النبات) ويسمح بتقسيم التباين داخل وبين التركيب الوراثي (Mrode 2014). المصفوفة X هي مصفوفة التصميم لـ β، والتي تضمنت تأثيرًا ثابتًا على البيئة. ثم تم استخدام مكونات التباين المقدرة من هذا النموذج لحساب ر وعلى النحو التالي (Falconer and Mackay 1996): (2) في هذه المعادلات هو تقدير للتنوع الوراثي الإضافي ، وهو تأثير بيئي دائم يتعلق بالتباين داخل النمط الجيني ، وهو خطأ متبقي. زيادة الدقة () من المقاييس المتكررة المعطاة ر حسب (Mrode 2014): (3) تم حساب وراثة الفهرس المستخدم للاختيار باستخدام معادلة التباين في مجموعة خطية من المتغيرات العشوائية (Lynch and Walsh 1998): (4) المصفوفتان G و P هما مصفوفات التباين الوراثي والمظهر للسمات المكونة للمؤشر ، و ب هو متجه لأوزان المؤشر.

تم استخدام تقديرات التوريث لحساب الدقة المتوقعة لانتقاء الكتلة المظهرية. من الناحية النظرية ، ينتج عن انحدار قيمة التربية الحقيقية على النمط الظاهري ارتباط يساوي الجذر التربيعي لـ (Falconer and Mackay 1996). وبالتالي ، بالنسبة لسمة معينة ، فإن القدرة التنبؤية القصوى () المتوقعة من اختيار النمط الظاهري ستكون الجذر التربيعي للتوريث بالمعنى الضيق الحقيقي للسمة (). تم استخدام هذه القيمة كمعيار لنماذج انحدار الجينوم الكامل لدينا.

تم حساب الارتباطات الجينية لكل زوج سمة باستخدام مكونات التباين المقدرة بنموذج ثنائي المتغير. تم استخدام متوسط ​​قياسات الفاكهة المفردة كقيمة نمطية لكل نمط وراثي. كما هو الحال مع نموذج التكرار ، تم تضمين تأثير ثابت في النموذج ثنائي المتغير للبيئة ، مع ملاءمة تأثير بيئة ثابتة منفصلة لكل سمة. لاختبار أهمية التغاير الوراثي ، كان النموذج المصغر مناسبًا لتحديد مصفوفة قطرية لمصفوفة التباين الوراثي للسمات (G) ومقارنتها بالنموذج الكامل ، الذي كان مناسبًا لـ G غير المنظم ، باستخدام اختبار احتمالية السجل.

تم إجراء العديد من اختبارات الأهمية الزوجية عند اختبار الارتباطات الظاهرية والتغايرات الجينية. لتقليل الإيجابيات الخاطئة ، تم تعديل قيم p باستخدام طريقة Bonferroni باستخدام الدالة R ، p.adjust ().

عبر المصادقة تم إنشاء مجموعات العلامات للتحقق المتبادل (CV) عن طريق تصفية كل مجموعة بيانات بشكل مستقل كما هو موضح سابقًا. تم ضم مجموعات البيانات بعد ذلك على علامات مشتركة لإنتاج مجموعات السيرة الذاتية ، والتي تظهر في الجدول 2. بالنسبة للسمات المقاسة على أساس فاكهة واحدة ، كانت قيمة الحقيقة المستخدمة في السيرة الذاتية هي متوسط ​​الفاكهة المتعددة لكل نبات. نظرًا لاختلاف النباتات في عدد عينات الفاكهة التي تم أخذ عينات منها ، فقد اختبرنا استخدام الأوزان لحساب اختلاف الخطأ غير المتجانس. يمكن الحصول على الأوزان المناسبة لنموذج باستخدام متوسط ​​السجلات المكررة على النحو التالي: (5) حيث ر هي صفة التكرار ، هي التوريث ، ن يشير إلى عدد القياسات ، و ج هي نسبة التباين التي توضحها بيانات العلامة (Garrick وآخرون. 2009). عدة قيم ج تم اختبارها من 0.1 إلى 0.9. وجد أن استخدام الأوزان له تأثير ضئيل على نتائج التحقق المتقاطع ، لذلك يتم إعطاء نتائج فقط من التحليل غير المرجح. تم استخدام علاقة بيرسون بين GEBVs للأفراد ذوي قيم السمات المقنعة وقيمة الحقيقة المقابلة كتقدير لنموذج PA. تم اختبار ثلاثة سيناريوهات متميزة: السيرة الذاتية داخل المجموعة ، والسيرة الذاتية عبر مجموعة ، ونهج السيرة الذاتية الطبقية.

يتم الإبلاغ عن المناطق المحمية داخل المجموعة بشكل شائع كمؤشر لأداء النموذج (Heffner وآخرون. 2010). للتحقق من صحة المجموعة ، تم استخدام نهج اختبار التدريب. تم تقسيم البيانات بشكل عشوائي بحيث تم استخدام 80٪ من البيانات لتدريب نموذج التنبؤ واستخدام 20٪ المتبقية لاختبار النموذج. تكررت هذه العملية خمسين مرة لكل سمة في كل مجموعة (CVC0، السيرة الذاتيةC2، السيرة الذاتيةT1). تم استخدام نفس المجموعات الفرعية العشوائية عبر السمات لتمكين مقارنة PA لسمات مختلفة.

تمثل السيرة الذاتية عبر مجموعة سيناريو أكثر واقعية من السيرة الذاتية داخل المجموعة ، ويستخدم النموذج للتنبؤ إما بالنسل المشتق من مجموعة التدريب (Prog) أو الأفراد المرتبطين ارتباطًا وثيقًا بمجموعة التدريب ، وليس فقط الأفراد الذين يمثلون مجموعة فرعية من مجموعة التدريب (اختبار). تم اختبار كلتا الحالتين باستخدام نموذج تم تدريبه على C0 للتنبؤ بالنسل في C2 (Prog) والتنبؤ بالأقارب في T1 (اختبار).

تم التحقيق في تأثير حجم تدريب السكان على نموذج PA باستخدام نهج السيرة الذاتية الطبقية (CVسترات). باختصار ، تم دمج البيانات من C0 و C2 و T1 وتم تشكيل مجموعات تدريب مختلفة الحجم عن طريق رسم عدد متساوٍ من الأفراد من كل مجموعة من المجموعات الثلاث. تم استخدام المجموعة المركبة الناتجة للتدريب ثم للتنبؤ بمجموعة اختبار تم إنشاؤها عن طريق أخذ عينات عشوائية من خمسة وعشرين فردًا من الأفراد المتبقين من كل مجموعة. تم إجراء السيرة الذاتية خمسين مرة لكل مجموعة من سمات الحجم والسمات السكانية. أدى استخدام مخطط طبقي إلى منع أي خلل في مجموعة التدريب أو الاختبار والذي قد يؤدي بخلاف ذلك إلى التحيز في تقييم كيفية تغير السلطة الفلسطينية مع حجم تدريب السكان ، على سبيل المثال، إذا تم استخدام الأفراد من C0 فقط للتدريب وتم استخدام الأفراد في C2 فقط للاختبار.

نموذج للتحديد على مستوى الجينوم تم استخدام نموذج GBLUP متعدد السمات مع ثلاث سمات ، ∘Bx ،٪ DM ، و * ، لحساب GEBVs لمرشحي الاختيار. نموذج GBLUP متعدد السمات له الشكل: (6) حيث ذ, ميكرومتر، و ه تمثل النواقل ، وعلى التوالي. القيم في ذ تتوافق مع قياسات الفاكهة الفردية من كل نبات. لم يتم استخدام نموذج التكرار. من المفترض أن و. المصفوفتان G و R غير منظمتين وتحددان التباين الوراثي والخطأ بين السمات.

تم استخدام أوزان اقتصادية متساوية في مؤشر الاختيار. مع الأوزان المتساوية ، قيمة فهرس الاختيار أنا لكل مرشح يتم تقديمه بواسطة: (7) كسب من الاختيار تم تحديد المكسب المحقق من الاختيار في الفهرس وللسمات الأخرى باستخدام النموذج المختلط التالي المناسب مع برنامج ASReml المستقل (Gilmour وآخرون. 2015): (8) في هذا النموذج ، ميكرومتر هو متوسط ​​عام ، يشير إلى تأثير عشوائي للموقع (موقع فريد × سنة) ، هو تأثير كتلة عشوائي متداخل في الموقع أنا, ص هو تأثير عشوائي لقطعة الأرض المتداخلة داخل الكتلة ، ج هو متغير ذو تأثير ثابت لدورة الاختيار ، و ه هو مصطلح خطأ عشوائي. ب (كتلة) و ص (قطعة الأرض) تم نمذجتها كتأثيرات عشوائية غير متجانسة تسمح بتباينات مختلفة في كل موقع. تم تضمين المؤامرات داخل الكتل (ممثلين داخل الكتلة) فقط في عام 2017 وهكذا ص كان مناسبًا فقط على مستويات تلك المواقع. ج تم ترميزه كمتغير مشترك 1،2،3 أو ​​5 ، حيث 1 هو مجموعة الأساس ودورة الاختيار الأخيرة هي 5. تقدير ج هو منحدر يقابل متوسط ​​الكسب لكل دورة اختيار. تم تقييم أهمية هذا المنحدر (اختبار لغير الصفر) باستخدام القيمة p من إحصاء Wald F المحسوبة بالطريقة الافتراضية في ASReml.

نظرًا لأننا لم نقم بإدخالات النمط الجيني في المكسب من تجارب الاختيار ، لم نتمكن من ملاءمة نموذج MT-GBLUP لحساب الفهرس كما فعلنا أثناء الاختيار ، والذي كان مجموع BLUPs من النموذج متعدد السمات. بدلاً من ذلك ، قمنا بحساب قيمة المؤشر من خلال تطبيق أوزان على الأنماط الظاهرية وفقًا لمؤشر Smith-Hazel (Baker 1986): (9) حيث يشير P و G إلى مصفوفات النمط الظاهري والتغاير الجيني المحسوبة كما هو موضح في القسم الخاص بتقدير المعلمات ، أ هو متجه من تلك للدلالة على أوزان اقتصادية متساوية ، و ب هو متجه الأوزان المطبق على القيم المظهرية للحصول على قيمة المؤشر.

اختلفت ممارسات الحصاد إلى حد ما عبر المواقع اعتمادًا على ما إذا كان يمكن فصل الكروم قبل الحصاد. إما أنه تم حصاد جميع الفاكهة من قطعة أرض أو تم حصاد جميع النباتات داخل قطعة الأرض مع تتبع النباتات الفردية. في الحالة السابقة، ذق هي وسيلة لجميع الفاكهة في قطعة أرض ، وفي الأخير ذق هي وسيلة للقيم النباتية لقطعة الأرض ، والتي تؤخذ على أنها متوسط ​​جميع الفاكهة من النبات. لحساب هذا الاختلاف ، تم نمذجة تباين الخطأ على أنه غير متجانس مع الأقسام المقابلة لكل حالة. الموقع والسنة مرتبكان في هذا التصميم حيث لم يكن هناك موقع مستخدم في كلا العامين.

توافر البيانات

تتوفر بيانات التسلسل الخام من كل مجموعة على NCBI SRA. المعرّف المرجعي لـ BioProject هو PRJNA611090. تتوفر بيانات النمط الظاهري المستخدمة لتدريب نماذج الاختيار ، والبيانات من تجارب الكسب المحققة ، وجميع البيانات والرموز الأخرى المستخدمة في هذه الدراسة على GitHub (https://github.com/ch728/squash-gs). المواد التكميلية المتاحة في figshare: https://doi.org/10.25387/g3.11955216.


الملحق أ

مع النموذج A ، نشأ الخطأ بشكل أساسي من انحرافات أخذ العينات لترددات النمط الجيني من ترددات HWE المتوقعة () ، وبدرجة أقل من انحرافات أخذ العينات من ترددات الأليل (). بالنسبة لجميع RMSE كان أصغر في ترددات الأليل الوسيطة ، وزاد عندما ابتعد تردد الأليل عن 0.5 (الشكل 1). كانت هذه الزيادة بسبب زيادة احتمال أخذ عينات عدد أقل من الأفراد من فئة النمط الجيني النادر مما هو متوقع بناءً على HWE. انخفض RMSE مرة أخرى عند ترددات الأليل القصوى. كان هذا الانخفاض بسبب (1) زيادة احتمال عدم أخذ عينات من النمط الجيني متماثل الزيجوت النادر ، و (2) التغيير في عندما لا يتم أخذ عينات من أحد الأنماط الجينية متماثلة اللواقح ، يكون دائمًا مساويًا لمنحدر خط الانحدار بين متماثل الزيجوت المتعارض والمتغايرة الزيجوت (متى ومتى). مع اقتراب تردد الأليل من التثبيت ، يزداد احتمال فقدان النمط الوراثي المتماثل ، بينما في الوقت نفسه ، يصبح الصواب قريبًا من منحدر خط الانحدار الناتج (انظر المعادلة 1) (متى أو متى). ومن ثم ، كان RMSE نتيجة لفقدان فئة واحدة من النمط الجيني صغيرًا عند تردد الأليل الشديد وزاد مع زيادة تردد الأليل. من الجيد ملاحظة أنه مع أخذ عينة من فئة النمط الجيني واحدة فقط ، تم تجاهل العينة لأنه لا يمكن تقديرها.

مع نموذج AD ، نشأ الخطأ من فقط ، بشرط أن يتم أخذ عينات من فئات التركيب الوراثي الثلاثة. بالنسبة لجميع RMSE مع نموذج AD ، كان دائمًا أصغر من النموذج A ، وأظهر نمطًا مختلفًا عبر ترددات الأليل (الشكل 1). انخفض RMSE بشكل طفيف عندما ابتعد تردد الأليل عن 0.5 ، لأن احتمال سحب عينة ذات مستوى عالٍ جدًا انخفض. زاد RMSE مرة أخرى لترددات الأليل ∼0.1 أو 0.9. كانت هذه الزيادة بسبب زيادة احتمالية عدم أخذ عينات لأفراد من فئة النمط الجيني النادر ، وفي هذه الحالة تم تقليل نموذج AD إلى النموذج A. انخفض RMSE مرة أخرى عند ترددات أليل أكثر تطرفًا ، لنفس الأسباب الموضحة للنموذج A.


شكر وتقدير

هذه مساهمة لا. 1 من مجموعة أسس علم الوراثة والتطور (FOGEG). FOGEG هي رابطة غير رسمية بين SD و AJ و NGP و TNCV وهي تجتمع بشكل دوري للعمل على القضايا المفاهيمية في أسس علم الوراثة وعلم الأحياء التطوري. يتم اختيار تسلسل المؤلفين عشوائيًا لكل عملية إرسال. المؤلف الأخير يعمل كمؤلف مطابق لذلك الإرسال. نشكر Sachit Daniel و K. P. Mohanan على المناقشات المفيدة ، خاصة خلال المراحل الأولى من تبلور هذه الأفكار. نشكر أيضًا الأكاديمية الهندية للعلوم ، بنغالورو ، لدعم اجتماع مناقشة حول "أسس النظرية التطورية" في مقاطعة أورانج ، كورج ، في فبراير 2014 ، حيث تم إجراء العديد من المناقشات حول التوليف التطوري الموسع. يشكر AJ قسم العلوم والتكنولوجيا ، حكومة الهند ، على الدعم من خلال زمالة J.C.Bose. تشكر كل من SD و NGP و TNCV IISER Pune و IISER Mohali و JNCASR ، على التوالي ، على التمويل الداخلي.


شاهد الفيديو: ترتيب الدول العربية حسب المساحة 2021 - الموسوعة العربية الحرة (قد 2022).


تعليقات:

  1. Dillen

    من الواضح في رأيي. أوصي بالعثور على إجابة سؤالك على google.com



اكتب رسالة