معلومة

إخراج الانفجار - برنامج لحساب عدد الزيارات

إخراج الانفجار - برنامج لحساب عدد الزيارات


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لا بد لي من استخدام الإصدار القديم من Blast (وليس Blast +) لمقارنة تسلسل الحمض النووي ويجب أن أعرف عدد جميع الزيارات. لم يتم تقديمها في العنوان ويجب أن أعرفها للعديد من مخرجات الانفجار ومن المستحيل تقريبًا عدها (أو تصديرها في Excel). أعتقد أنه ربما يتعين علي كتابة "نص برل" وقد بذلت قصارى جهدي ولكني لست على دراية بالبرمجة ولا تعمل. علاوة على ذلك ، ألقيت نظرة على الإنترنت وهم دائمًا يقارنونها ببحث BIO. لديّ كود إلكتروني ، والذي يبدو جيدًا بالنسبة لي ، لكنه أجرى أيضًا مقارنة مع BIO Search ، وهو ما لا أحتاجه / أريده.

استخدام صارم استخدام التحذيرات استخدام Bio :: SearchIO ؛

معلومات الاستخدام

يموت "الاستخدام: 0 دولار    n "، if (ARGV! = 3)؛ my ($ infile، $ numHits، $ outfile) =ARGV؛ طباعة" تحليل نتيجة BLAST ... "؛ $ in = Bio :: SearchIO-> جديد (- format => 'blast'، -file => $ infile)؛ open (OUT، "> $ outfile") أو die "Cannot open $ outfile: $!"؛ # طباعة معلومات الرأس للأعمدة المحددة بعلامات جدولة طباعة OUT " query_name  tquery_length  taccession_number  tlength  tdescription  tE value  tbit Score  tframe  tquery_start  t "؛ print OUT" query_end  thit_start  thit_end  tpositives  tidentical  n "؛ # استخراج المعلومات لكل نتيجة بشكل متكرر أثناء (بلدي $ result = $ in-> next_result) {# اسم تسلسل الاستعلام print OUT $ result-> query_name. " t"؛ # طول تسلسل الاستعلام print OUT $ result-> query_length؛ # output "لا توجد زيارات تم العثور على "إذا لم تكن هناك نتائج إذا ($ result-> num_hits == 0) {print OUT"  t لم يتم العثور على نتائج  n "؛} وإلا {my $ count = 0؛ # معالجة كل ضربة بشكل متكرر أثناء (my $ hit = $ result-> next_hit) {print OUT " t" if ($ count> 0)؛ # احصل على أرقام الدخول من الضربات اطبع OUT " t". $ hit-> access أيون . " t" ؛ # احصل على أطوال متواليات النتائج اطبع OUT $ hit-> length. " t" ؛ # احصل على وصف لتسلسل النتائج اطبع وصفًا بقيمة $ hit->. " t" ؛ # احصل على القيمة E للضربة print OUT $ hit-> important. " t" ؛ # احصل على النتيجة النهائية للضربات المطبوعة OUT $ hit-> bits. " t" ؛ hspcount $ الخاص بي = 0 ؛ # معالجة HSP العلوي لأعلى نتيجة أثناء (my $ hsp = $ hit-> next_hsp) {print OUT " t  t  t  t  t  t  t"، if ($ hspcount> 0)؛ # احصل على إطار تسلسل الاستعلام اطبع OUT $ hsp-> query-> frame. " t" ؛ # احصل على بداية ونهاية تسلسل الاستعلام في المحاذاة print OUT $ hsp-> start ('query'). " t". $ hsp-> end ("استعلام"). " t" ؛ # احصل على بداية ونهاية تسلسل النتائج في المحاذاة اطبع OUT $ hsp-> start ('hit'). " t". $ hsp-> end ("hit"). " t" ؛ # احصل على قيمة التشابه printf OUT "٪ .1f"، ($ hsp-> frac_conserved * 100)؛ طباعة OUT "٪  t" ؛ # احصل على قيمة الهوية printf OUT "٪ .1f"، ($ hsp-> frac_identical * 100)؛ طباعة OUT "٪  n" ؛ hspcount ++ دولار ؛ } count ++ $؛ # التحكم في التدفق لعدد مرات الدخول المطلوبة أخيرًا إذا ($ count == $ numHits) ؛ } } } اغلق؛ طباعة "تم !!!  n" ؛

أتمنى أن يساعدني أحد من فضلك. أحتاج إلى برنامج يخبرني أولاً بالعنوان ثم عدد الزيارات. أنا يائس قليلاً وسأكون سعيدًا جدًا إذا كان بإمكان أحدهم مساعدتي. من شأنه أن يكون لطيفا. تحياتي تينا


هذا النص المسمى blast2table.pl مأخوذ من الكود المصاحب لكتاب Blast بواسطة Korf & Yandell (هناك مؤلف ثالث لم أقابله).

#! / usr / bin / perl -w use strict؛ استخدم Getopt :: Std ؛ استخدم vars qw ($ opt_p $ opt_b $ opt_e $ opt_m $ opt_n) ؛ getopts ('p: b: e: m: n:') ؛ PERCENT $ الخاص بي = $ opt_p؟ $ opt_p: 0 ؛ $ BITS الخاص بي = $ opt_b؟ $ opt_b: 0 ؛ EXPECT دولار الخاص بي = $ opt_e؟ $ opt_e: 1e30 ؛ $ START = $ opt_m الخاص بي؟ $ opt_m: 0 ؛ بلدي $ END = $ opt_n؟ $ opt_n: 1e30 ؛ ($ Query، $ Sbjct)؛ $ HSP الخاص بي = "" ؛ while (<>) {if (/ ^ Query =  s + ( S +) /) {outputHSP () ؛ $ Query = $ 1} elsif (/ ^> ( S +) /) {outputHSP () ؛ $ Sbjct = $ 1} elsif (/ ^ الدرجة = /) {outputHSP () ؛ my @ stat = ($ _) ؛ بينما (<>) {last ما لم /  S / ؛ pushstat، $ _} my $ stats = Join (""،stat)؛ (بتات دولار) = إحصائيات بالدولار = ~ / ( د  S +) بت / ؛ (توقع دولار) = إحصائيات دولار = ~ / توقع  S * = ([ د .  +  - هـ] +) / ؛ توقع الدولار = "توقع 1 دولار" إذا كان الدولار يتوقع = ~ / ^ ه /؛ بلدي (المباراة بالدولار ، الإجمالي بالدولار ، النسبة بالدولار) = الإحصائيات بالدولار = ~ / الهويات = ( د +)  / ( د +)  (( د +)٪ ) / ؛ عدم تطابق $ الخاص بي = $ total - $ match؛ $ HSP = {bits => $ بت ، توقع => $ متوقع ، عدم تطابق => $ غير متطابق ، النسبة المئوية => $ بالمائة ، q_begin => 0 ، q_end => 0 ، q_align => 0 ، s_begin => 0 ، s_end = > 0، s_align => ""}؛ } elsif (/ ^ Query:  s + ( d +)  s + ( S +)  s + ( d +) /) {$ HSP -> {q_begin} = $ 1 ما لم يكن $ HSP -> {q_begin}؛ HSP دولار -> {q_end} = 3 دولارات ؛ HSP دولار -> {q_align}. = 2 دولار ؛ } elsif (/ ^ Sbjct:  s + ( d +)  s + ( S +)  s + ( d +) /) {$ HSP -> {s_begin} = $ 1 ما لم يكن $ HSP -> {s_begin} ؛ دولار HSP -> {s_end} = 3 دولارات ؛ دولار HSP -> {s_align}. = 2 دولار ؛ }} outputHSP () ؛ الإخراج الفرعي HSP {الإرجاع ما لم $ HSP؛ العودة إذا $ HSP -> {percent} <$ PERCENT؛ العودة إذا $ HSP -> {bits} <$ BITS؛ إرجاع إذا $ HSP -> {نتوقع}> $ EXPECT؛ إرجاع إذا ($ HSP -> {q_begin} <$ START أو $ HSP -> {q_end} <$ START) ؛ إرجاع إذا ($ HSP -> {q_begin}> $ END أو $ HSP -> {q_end}> $ END) ؛ لكل حقلي $ ('بالمائة'، 'q_align'، 'عدم تطابق'، 's_align'، 'q_begin'، 'q_end'، 's_begin'، 's_end'، 'توقع'، 'بت') {print "$ field لم يتم تعريفه  n "إذا لم يتم تعريفه $ HSP -> {$ field}؛ } print Join (" t"، $ Query، $ Sbjct، $ HSP -> {percent}، length ($ HSP -> {q_align})، $ HSP -> {mismatch}، countGaps ($ HSP -> {q_align }) + countGaps ($ HSP -> {s_align}) ، $ HSP -> {q_begin} ، $ HSP -> {q_end} ، $ HSP -> {s_begin} ، $ HSP -> {s_end} ، $ HSP-> {توقع}، $ HSP -> {بت})، " n"؛ $ HSP = "" ؛ } sub countGaps {my ($ string) =_؛ عدد دولاراتي = 0 ؛ while ($ string = ~ /  - + / g) {$ count ++} إرجاع $ count؛ }

استكشاف الأخطاء وإصلاحها

خطأ: "لم يتم العثور على تشابه كبير"

  • تسلسلات الاستعلام القصيرة: قد تحتوي المحاذاة القصيرة على قيم توقع أعلى من الحد الافتراضي ، وهو 10 في معظم الصفحات ، وبالتالي لا يتم عرضها. حاول زيادة حد التوقع (ضمن "معلمات الخوارزمية"). راجع أيضًا الأسئلة الشائعة حول إرسال المواد الأولية أو التسلسلات القصيرة الأخرى.
  • الفلتره: تخفي بعض برامج بلاست المناطق ذات التعقيد المنخفض افتراضيًا. لا يُسمح لهذه المناطق ببدء المحاذاة ، لذلك إذا كان استعلامك منخفض التعقيد إلى حد كبير ، فقد يمنع عامل التصفية جميع مرات الوصول إلى قاعدة البيانات. في صفحات BLAST الأساسية ، اضبط إعدادات المرشح في قسم "عوامل التصفية والإخفاء" ، ضمن "معلمات الخوارزمية". للحصول على وصف لمرشحات التعقيد المنخفض ، راجع "ما هو التسلسل منخفض التعقيد؟"

خطأ: حدث خطأ على الخادم ، هناك عدد كبير جدًا من HSPs لحفظ الكل

  • 1.) قم بتمكين التكرارات الخاصة بالأنواع المحددة إن أمكن ، راجع كيفية تصفية التكرارات المتناثرة (الخاصة بالكائن الحي).
  • 2) في حالة استخدام tblastx ، جرب blastx بدلاً من ذلك. يعد برنامج tblastx مكثفًا جدًا لوحدة المعالجة المركزية لأنه لا يترجم الاستعلام في ستة إطارات قراءة فحسب ، بل يترجم أيضًا كل تسلسل قاعدة بيانات. في كثير من الأحيان ، يعد استخدام tblastx مقياسًا للملاذ الأخير ، وقد يوفر بحث blastx مقابل قاعدة بيانات للبروتينات المعروفة ما تحتاجه.
  • 3) ابحث في قاعدة بيانات أصغر ، مثل refseq_rna. من الواضح أن قواعد البيانات الأكبر تحتوي على مزيد من التسلسلات ، وبالنسبة لبعض الاستعلامات ، ينتج عن ذلك العديد من نتائج "الخلفية". إذا كنت تريد قاعدة بيانات mRNAs معروفة (وترجماتها) ، فإن refseq_rna يعد خيارًا جيدًا.
  • 4) قسّم الاستعلامات الكبيرة إلى أجزاء أصغر ، أرسل كل قطعة في بحث منفصل. أحد الأسباب الشائعة للأخطاء في بلاست هو البحث بتسلسل ضخم ، مثل كروموسوم كامل ، مقابل قاعدة بيانات كبيرة مثل nr. يتم تحقيق ذلك بشكل أفضل في أجزاء بدلاً من تسلسل واحد كبير ومتواصل.
  • 5) تحديد قاعدة البيانات حسب التصنيف. ابدأ بمجموعات كبيرة ، مثل الثدييات والبكتيريا وما إلى ذلك. يمكن استخدام أي عقدة تصنيفية أو رقم معرف ضريبي يمكنك العثور عليه في متصفح التصنيف في مربع النص "الكائن" ، راجع الأسئلة الشائعة حول بلاست ، كيفية تقييد البحث على كائن حي أو مجموعة تصنيفية. "راجع أيضًا متصفح التصنيف.
  • 5) قد تصل إلى عدد كبير من سجلات "التنبؤات" أو "البروتين الافتراضي". إذا كنت لا تريد هذه النتائج ، فاستخدم استعلام Entrez مثل: all [filter] NOT متنبأ [title].
  • 6) بالنسبة لعمليات البحث الضخمة و blastn ، حاول زيادة حجم الكلمة و / أو تقليل حد التوقع.

خطأ: حدث خطأ على الخادم ، [blastsrv4.REAL]: خطأ: تم تجاوز حد استخدام وحدة المعالجة المركزية ، مما أدى إلى SIGXCPU (24).

إذا حصلت على هذا الخطأ ، فلديك العديد من الخيارات حسب أهدافك. راجع الأسئلة المتداولة حول BLAST ، "خطأ: حدث خطأ على الخادم ، عدد كبير جدًا من HSPs لحفظ الكل".

لماذا أحصل على الرسالة "خطأ: BLASTSetUpSearch: غير قادر على حساب معلمات Karlin-Altschul ، تحقق من تسلسل الاستعلام"؟

لماذا قد تستغرق بعض عمليات البحث المجمعة على الويب وقتًا أطول من المتوقع.

يعد خادم NCBI WWW BLAST موردًا مشتركًا ، وسيكون من غير العدل أن يحتكره عدد قليل من المستخدمين. لمنع هذا ، يعطي الخادم الأولوية للمستخدمين التفاعليين الذين يقومون بإجراء عدد معتدل من عمليات البحث. يتتبع الخادم أيضًا عدد الاستعلامات الموجودة في قائمة الانتظار لكل مستخدم بالإضافة إلى عدد عمليات البحث التي أجراها المستخدم مؤخرًا ويعطي الأولوية لعمليات البحث وفقًا لذلك.

قد يوفر إرسال عمليات البحث في غير ساعات العمل (من 8 مساءً إلى 8 صباحًا بتوقيت شرق الولايات المتحدة) إنتاجية أفضل. يجب على المستخدمين الذين لديهم عدد كبير من الاستعلامات استخدام بلاست أو خدمات قائمة بذاتها في مزود خدمة سحابية. انظر هنا للحصول على التفاصيل.


إخراج الانفجار - برنامج لحساب عدد الزيارات - علم الأحياء

أداة لتحليل مخرجات البحث بلاست لتسلسل الحمض النووي الريبي.

rboAnalyzer هي أداة تكمل خوارزمية BLAST عند البحث عن تسلسل استعلام يكون RNA بهيكل ثانوي (والذي لا يجب أن يكون معروفًا).

غالبًا ما تكون الأزواج عالية الدرجات (HSPs) في إخراج بلاست غير مكتملة (أي أن المحاذاة في HSP لا تغطي تسلسل الاستعلام بالكامل). هذا عيب كبير عند محاولة وصف ncRNA المحتمل المشار إليه بواسطة HSP.

لذلك ، يحاول rboAnalyzer العثور على تسلسلات RNA كاملة الطول من HSPs غير المكتملة من إخراج BLAST والتنبؤ بهياكلها الثانوية بطريقة واحدة أو أكثر. يتم أيضًا حساب نقاط التشابه (كبديل للتماثل) بين تسلسل الطول الكامل المقدّر وتسلسل الاستعلام. يتم دمج إخراج بلاست مع البيانات المحسوبة ويتم تقديمه في شكل صفحة HTML تفاعلية.

لتحقيق ذلك ، يأخذ rboAnalyzer كإدخال:

  • تسلسل الاستعلام
  • خرج الانفجار
  • قاعدة بيانات بلاست التي تحتوي على تسلسلات داخل المخرجات

الورقة الخاصة بهذه الأداة متاحة هنا.

يمكنك أيضًا تجربة خادم الويب rboanalyzer الذي يقوم بتنفيذ تحليل HSP تفاعلي باستخدام طرق تنبؤ بالهيكل الثانوي المختار.

تم اختبار هذه الأداة على نظام لينكس 64 بت (Ubuntu 14 و 18 و Centos 7).

الطريقة الأكثر ملاءمة لتثبيت خط الأنابيب هذا هي استخدام مدير حزمة Conda.

إذا لم يكن لديك Conda for Python3 ، فقم بتثبيته. نوصي miniconda3.

حزمة rboanalyzer متاحة من قناة schwarz.marek. تحتاج أيضًا إلى تضمين قنوات bioconda و conda-forge عند تثبيت محلل rboanalyzer.

التثبيت على بيئة افتراضية جديدة

سيكون rboAnalyzer وتوابعه متاحين فقط في جلسة shell التي تم تنشيط البيئة الافتراضية لها. ستحتاج إلى تنشيط البيئة الافتراضية لكل جلسة.

سوف تقوم الأوامر التالية بتثبيت rboAnalyzer في بيئة conda جديدة تسمى "rbo". إذا كنت لا ترغب في تثبيت rboAnalyzer في بيئة جديدة ، فاحذف الأمرين 1) و 2).

المتطلبات الأساسية

python & gt = 3.4، & lt3.8 link تحقق من أن لديك أحدث نقطة متوافقة مع pip3. إذا حاولت استخدام EOL python ، فيرجى الاطلاع على البرنامج النصي setup.py على إصدارات pip3 و setuptools المتوافقة واستخدامها.

ncbi-blast + & gt = 2.8.1، & lt2.10 link (يمكن أن يستخدم خط الأنابيب انفجارًا من الإصدار 2.6.0 ، ولكن هذا الإصدار غير متوافق مع blast dbv5)

  • رابط viennarna & gt = 2.3.5، & lt3 (مع refold.pl في PATH) لا تنس إضافة refold.pl إلى PATH. يقع البرنامج النصي refold.pl في ViennaRNA- [الإصدار] / src / Utils /.
  • centroid_homfold & gt = 0.0.15 ، & lt0.1 link
  • RNAstructure & gt = 6.0، & lt7 (TurboFold - Text (Command Line) Interfaces) لا تنسى تعيين رابط متغير بيئة DATAPATH.

اختياري (لا تتوفر بعض طرق التنبؤ بدونها):

قم بتنزيل هذا المستودع (أو الإصدار) ، قم بفك ضغطه إذا لزم الأمر. انتقل إلى الدليل الذي يحتوي على الكود المصدري لـ rboAnalyzer وقم بتشغيله

لاحظ أن مفتاح التبديل --user يضع الملفات التنفيذية في $ HOME / .local / bin وقد تحتاج إلى إضافته إلى PATH.

يجب إنشاء ملف rboAnalyzer القابل للتنفيذ. لاختباره ، أعد تشغيل Terminal (أغلق وافتح جديدًا) وقم بالتشغيل

والذي يجب أن يعيد رقم الإصدار.

من أجل الوظيفة الصحيحة ، يحتاج rboAnalyzer إلى نسخة من قاعدة بيانات Rfam.

    قم بتشغيل rboAnalyzer بعلامة --download_rfam.

سيؤدي هذا إلى تنزيل نماذج التباين المشترك Rfam إلى الدليل الافتراضي ([INSTALL_LOCATION] / rna_blast_analyze / 3rd_party_source / rfam).

  1. بدلاً من ذلك ، قم بتنزيل ملف Rfam.cm.gz من Rfam CURRENT ، وقم بفك ضغطه وإضافة المسار إلى الدليل الذي يحتوي على ملف Rfam.cm إلى ملف config.txt الخاص بك. لاحظ أن تشغيل rboAnalyzer مع --download_rfam سيؤدي إلى الكتابة فوق هذا الملف المثبت يدويًا.

تثبيت UNAFold (اختياري)

طرق التنبؤ التي تستخدم الهياكل دون المستوى الأمثل تحتاج إلى برنامج UNAFold للعمل. وهي متاحة هنا http://www.unafold.org. اتبع تعليمات التثبيت. يستخدم خط الأنابيب برنامج hybrid-ss-min. قم إما بإضافته إلى PATH أو إضافة مسار إلى الدليل الذي يحتوي على الملف القابل للتنفيذ إلى ملف config.txt.

شل الإكمال التلقائي (اختياري)

تم تجهيز rboAnalyzer بإكمال وسيطة لـ bash shell. لتمكين هذه الميزة ، يجب تثبيت الحزمة argcomplete (الإصدار & gt1.6 ، & lt2) ، والبرنامج النصي المسجل مع shell الخاص بك. يتم تثبيته افتراضيًا في حزمة conda. لتثبيته يدويا تشغيل

لاحظ أن مفتاح التبديل --user يضع الملفات التنفيذية في $ HOME / .local / bin وقد تحتاج إلى إضافته إلى PATH.

لتسجيل البرنامج النصي في قوقعتك (مزيد من المعلومات هنا).

يحتاج rboAnalyzer إلى الحصول على مناطق 5 'و 3' ذات صلة من تسلسل الموضوع لـ HSPs ، ولهذا نستخدم قاعدة بيانات BLAST المستخدمة في بحث BLAST. لكل تحليل تحتاج إلى توفير قاعدة بيانات بلاست للنيوكليوتيدات التي تحتوي على تسلسلات كاملة (جينومات كاملة ، إلخ) لمعرفات التسلسل الموجودة في إخراج بلاست.

يتم وصف الإجراء الخاص بكيفية الحصول على قواعد بيانات بلاست للأمثلة في قسم المثال. للحصول على معلومات عامة ، يرجى الاطلاع على قسم قواعد بيانات بلاست.

يتم توفير أمثلة في مثال الدليل.

لتجربة الأمثلة ، ستحتاج إلى:

قم بتثبيت rboAnalyzer وتنزيل Rfam. كيف؟.

الحصول على نسخة من مثال الدليل. إذا قمت باستنساخ البرنامج أو تنزيله ، فيجب أن يكون لديك بالفعل. وإلا فهو هنا.

تحليل مجموعة فرعية من ضربات الانفجار NCBI لـ 6S RNA.

أنت الآن بحاجة إلى الحصول على نسخة من قاعدة بيانات بلاست مع جميع الملحقات الموجودة في إخراج بلاست. كما هو مذكور أعلاه ، يمكنك إما الحصول على قاعدة بيانات NCBI nt أو تنزيل التسلسلات (الجينومات) فقط من إخراج بلاست. هنا نصف المتغير مع تنزيل التسلسلات الضرورية فقط. يتم ذلك باستخدام genomes_from_blast عن طريق استدعاء:

يجب أن تكون المعلمة -e YOUR_EMAIL_ADDRESS هي عنوان بريدك الإلكتروني الصالح الذي يمكن لموظفي NCBI الاتصال بك من خلاله إذا احتاجوا إلى ذلك. لم يتم تسجيله بواسطة الأداة.

المعامل -in هو مسار الملف (في هذا المثال 6S_super_short.xml) يحتوي على ناتج BLAST.

المعلمة -o هي مسار ملف الإخراج. في هذا الأمر ، تم إنشاء قاعدة بيانات BLAST مع اسم genomes.bdb من أجلك إذا كان كل شيء ناجحًا. سوف تحتاجه في الخطوة التالية.

تم أيضًا إنشاء جينومات الملف الوسيط.bdb.fasta وتحتوي على جميع التسلسلات المضافة إلى قاعدة بيانات بلاست. عندما يتم تحليل إخراج BLAST آخر (وهناك حاجة إلى تسلسلات) ، يتم تنزيل التسلسلات غير الموجودة في ملف FASTA الوسيط (بافتراض استخدام نفس اسم BLAST db).

الآن يمكنك تشغيل خط الأنابيب نفسه:

الإخراج هو ملف html واحد. يمكنك التمرير عبر HSPs التي تم تحليلها ، وإظهار المواقع الجينية لـ HSP وتحديد البيانات المطلوب تصديرها.

تحليل المتماثلات البعيدة المحتملة لـ MS1 RNA. يستغرق هذا حوالي 10 دقائق على جهاز الكمبيوتر العادي.

تم تشغيل BLAST بقاعدة بيانات حيث تم استبعاد عائلات Streptomycetaceae و Mycobacteriaceae. نظرًا لأن الحمض النووي الريبي MS1 معروف بشكل أساسي من عائلة Mycobacteriaceae ، يمكننا أن نتوقع ضربات غير مكتملة والعديد من الإيجابيات الكاذبة.

يمكنك أيضًا ملاحظة أن إخراج BLAST كان بتنسيق نصي ، يقبل rboAnalyzer إخراج BLAST بنص عادي و xml.

يتم الحصول على قاعدة بيانات بلاست بأمر مشابه كما في المثال السابق. نظرًا لأن ملف قاعدة بيانات BLAST الناتج هو نفسه كما كان من قبل ، سيتحقق genomes_from_blast من ملف fasta الوسيط (genomes.bdb.fasta) وسوف يقوم بتنزيل التسلسلات غير الموجودة فقط.

يمكننا أن نتوقع أن يحتوي ناتج بلاست على العديد من HSPs الإيجابية الخاطئة ، لذلك اخترنا طرق التنبؤ من تلك التي لا تعتمد على المعلومات الموجودة في مخرجات بلاست نفسها. وهذه هي:

  • رنافولد
  • rfam- Rc
  • rfam النقطه الوسطى
  • Turbo-fast مع تعيين معلمة "max_seqs_in_prediction" على 2 (- علامة turbo_fast_preset)
  • centroid-fast مع تعيين معلمة "max_seqs_in_prediction" على 1 (علامة --centroid_fast_preset)
  • rfam-sub (إذا تم تثبيت UnaFold.)

لم يتم التعرف على إخراج بلاست TXT من WEB
السبب: قام NCBI بتغيير إخراج النص لـ WEB BLAST عندما تحولوا إلى تصميم جديد. محلل txt الخاص بنا متوافق مع إخراج سطر الأمر txt (-outfmt 0) والذي كان أيضًا ناتج txt لـ WEB BLAST.
الحل: قم بتنزيل إخراج xml أو قم بالتبديل إلى "صفحة النتائج التقليدية" وتنزيل النص هناك.

واحد أو أكثر من السجلات غير موجود
السبب: لم يكن blastdbcmd قادرًا على العثور على تسلسل (ق) مع المعرف (المعرفات) الخاص به في قاعدة البيانات المتوفرة. ويرجع ذلك إلى عدم الاتساق بين عمليات الدخول التسلسلية وقاعدة بيانات بلاست. قد ينشأ التضارب من:

  1. التسلسل ليس في قاعدة البيانات
    الحل: توفير قاعدة بيانات صحيحة للانفجار (تحديث الحالي أو إنشاء جديد باستخدام genomes_from_blast).
  2. لا يلتقط التقاط regexp رقم التعريف
    الحل: توفير التقاط التعبير العادي (بناء جملة python 3) لالتقاط معرف التسلسل من رأس Fasta (يجب أن يتطابق مع المعرف مع قاعدة بيانات BLAST المستخدمة)
  3. تم إنشاء قاعدة بيانات BLAST بدون علامة -parse_seqids
    الحل: أنشئ قاعدة بيانات جديدة من التسلسلات المستخدمة لإنشاء واحدة جديدة ، هذه المرة بعلامة -parse_seqids.

هناك خيار آخر وهو استدعاء خط الأنابيب بعلامة --skip_missing. سيؤدي هذا إلى تخطي التسلسلات المفقودة.

لاحظ أنه لن يتم تضمين HSP للتسلسل المفقود في إخراج خط الأنابيب وقد تتأثر بعض طرق التنبؤ بالتسلسل المفقود.

فشل genomes_from_blast
تم بناء البرنامج النصي genomes_from_blast في معالجة التنزيلات الفاشلة ، ولكنه يحاول افتراضيًا 10 مرات فقط. إذا كنت على اتصال غير مستقر ، فقد تحصل على نتائج أفضل من خلال تعيين - إعادة المحاولة على عدد أكبر. تحقق أيضًا مما إذا كانت خدمات NCBI entrez تعمل.

إذا استخدمت BLAST باستخدام خدمة الويب NCBI مقابل إحدى قواعد البيانات المنسقة مسبقًا ، فيمكنك تنزيل قاعدة البيانات بأكملها أو استخدام برنامج نصي genomes_from_blast لتنزيل التسلسلات في إخراج الانفجار فقط.

تنزيل قاعدة بيانات كاملة (

50 غيغابايت)
أحدث قواعد البيانات متوفرة هنا NCBI LATEST. لاحظ أن قواعد البيانات المضمنة في إصدارات قاعدة بيانات بلاست ليست الأحدث. يمكن استخدام مقتطف الشفرة هذا للحصول على قاعدة البيانات وتحديثها:

تنزيل التسلسلات ذات الصلة فقط
إذا كنت لا ترغب في تنزيل blastdb بالكامل ، فيمكنك استخدام البرنامج النصي genomes_from_blast المُعد ، والذي يقوم بتنزيل التسلسلات المطلوبة فقط (تلك الموجودة في إخراج BLAST) وبناء ملف blastdb منها. سيقوم هذا الأمر بتنزيل جميع الجينومات المطلوبة وإنشاء قاعدة بيانات BLAST لك.

إذا تم استخدام قاعدة بيانات مخصصة لبحث BLAST ، فأنت بحاجة إلى ضمان أشياء متعددة لـ rboAnalyzer للعثور على التسلسلات بشكل صحيح.

  1. قاعدة البيانات المخصصة هي nucleotide وتم إنشاؤها باستخدام -parse_seqids (وهذا يجعل التسلسلات قابلة للاسترداد بواسطة معرفاتهم).
  2. توفر تعبيرًا منتظمًا لالتقاط معرفات التسلسل. بشكل افتراضي ، يلتقط rboAnalyzer الإصدار Accession.Version كما هو موثق هنا.

وصف منطق خط الأنابيب متاح في المنشور.

يمكن أيضًا العثور على التفاصيل هنا.

هذا الملف التمهيدي والوثائق الموجودة في المستندات صالحة للإصدار الأخير 0.1.4 و dev 0.1.5a1.

  • ViennaRNA: Lorenz، Ronny and Bernhart، Stephan H. and Höner zu Siederdissen، Christian and Tafer، Hakim and Flamm، Christoph and Stadler، Peter F. and Hofacker، Ivo L. ViennaRNA Package 2.0. https://doi.org/10.1186/1748-7188-6-26. نقوم بتضمين نسخة من البرنامج النصي refold.pl مع ترخيص Viennarna هنا للراحة. موقع الكتروني
  • لوكارنا: سيباستيان ويل ، تيجال جوشي ، إيفو إل هوفاكير ، بيتر إف ستادلر ، ورولف باكوفن. LocARNA-P: تنبؤ دقيق بالحدود وكشف محسن عن الحمض النووي الريبي الهيكلي ، 18 لا. 5 ، الصفحات 900-14 ، 2012. https://doi.org/10.1261/rna.029041.111 ، موقع الويب
  • NCBI BLAST: Camacho C. ، Coulouris G. ، Avagyan V. ، Ma N. ، Papadopoulos J. ، Bealer K. ، & amp Madden T.L. (2008) "بلاست +: الهندسة المعمارية والتطبيقات." المعلوماتية الحيوية BMC 10:42. https://doi.org/10.1186/1471-2105-10-421 ، الموقع الإلكتروني
  • RSEARCH: البحث عن متماثلات من متواليات الحمض النووي الريبي الهيكلية المفردة. آر جيه كلاين ، إس آر إيدي. BMC Bioinformatics ، 4:44 ، 2003. https://doi.org/10.1186/1471-2105-4-44 ، الموقع الإلكتروني
  • الجهنمية: الجهنمية 1.1: 100 ضعف عمليات البحث عن تنادد الحمض النووي الريبي الأسرع. إي بي نوروكي ، إس آر إيدي. المعلوماتية الحيوية ، 29: 2933-2935 ، 2013. https://doi.org/10.1093/bioinformatics/btt509 ، موقع الويب
  • أوميغا كلوستال: Sievers F ، Wilm A ، Dineen DG ، Gibson TJ ، Karplus K ، Li W ، Lopez R ، McWilliam H ، Remmert M ، Söding J ، Thompson JD ، Higgins DG (2011). توليد سريع وقابل للتطوير من محاذاة تسلسل متعدد البروتين عالي الجودة باستخدام Clustal Omega. بيولوجيا الأنظمة الجزيئية 7: 539. https://doi.org/10.1038/msb.2011.75 ، الموقع الإلكتروني
  • العضلات: إدغار ، أر. (2004) MUSCLE: محاذاة تسلسل متعدد بدقة عالية وإنتاجية عالية من الأحماض النووية Res. 32 (5): 1792-1797. https://doi.org/10.1093/nar/gkh340 ، الموقع الإلكتروني
  • Centroid homfold: Michiaki Hamada ، Koichiro Yamada ، Kengo Sato ، Martin C. Frith ، Kiyoshi Asai CentroidHomfold-LAST: التنبؤ الدقيق للهيكل الثانوي للحمض النووي الريبي باستخدام متواليات متجانسة تم جمعها تلقائيًا ، أبحاث الأحماض النووية ، المجلد 39 ، العدد الإضافي_2 ، 1 يوليو 2011 ، الصفحات W100 – W106. https://doi.org/10.1093/nar/gkr290، جيثب
  • TurboFold (RNAstructure): Tan، Z.، Fu، Y.، Sharma، G.، & amp Mathews، D.H (2017). TurboFold II: المحاذاة الهيكلية للـ RNA والتنبؤ بالهيكل الثانوي المستنير بواسطة متماثلات متعددة. بحوث الأحماض النووية. 45: 11570-11581. https://doi.org/10.1093/nar/gkx815 ، الموقع الإلكتروني
  • UNAFold: Markham N.R.، Zuker M. (2008) UNAFold. في: كيث جي إم (محرران) المعلوماتية الحيوية. طرق في علم الأحياء الجزيئي ™ ، المجلد 453. مطبعة هيومانا. https://doi.org/10.1007/978-1-60327-429-6_1 ، الموقع الإلكتروني
  • Biopython: الديك ، P.J.A. وآخرون. Biopython: أدوات بايثون متاحة مجانًا للبيولوجيا الجزيئية والمعلوماتية الحيوية. المعلوماتية الحيوية 2009 1 25 (11) 1422-3. http://dx.doi.org/10.1093/bioinformatics/btp163 ، موقع الويب
  • موقع ويب NumPy
  • موقع الباندا
  • موقع Jinja2
  • موقع Matplotlib

إذا وجدت هذا البرنامج مفيدًا ، فيرجى الاستشهاد بهذه الورقة.

Schwarz، M.، Vohradský، J.، Modrák، M. and Pánek، J.، 2020. rboAnalyzer: برنامج لتحسين توصيف الحمض النووي الريبي غير المشفر من مخرجات البحث في قاعدة بيانات التسلسل. الحدود في علم الوراثة ، 11 ، ص 675.

إصدار rboAnalyzer المستخدم للورق هو 0.1.4.

تم دعم هذا العمل من خلال مشروع البنية التحتية البحثية ELIXIR CZ (MEYS Grant No: LM2015047) بما في ذلك الوصول إلى مرافق الحوسبة والتخزين.

تم دعم هذا العمل من صندوق التنمية الإقليمية الأوروبية - مشروع "ELIXIR-CZ: Budování kapacit" (رقم CZ.02.1.01 / 0.0 / 0.0 / 16_013 / 0001777).


مراجع

Altschul SF و Madden TL و Schaffer AA و Zhang J و Zhang Z و Miller W و Lipman DJ: Gapped BLAST و PSI-BLAST: جيل جديد من برامج البحث في قواعد بيانات البروتين. الدقة الأحماض النووية. 1997 ، 25 (17): 3389-3402. 10.1093 / nar / 25.17.3389.

Ashburner M ، Ball CA ، Blake JA ، Botstein D ، Butler H ، Cherry JM ، Davis AP ، Dolinski K ، Dwight SS ، Eppig JT: Gene ontology: أداة لتوحيد علم الأحياء. اتحاد علم الوجود الجيني. نات جينيه. 2000 ، 25 (1): 25-29. 10.1038 / 75556.

Liang C و Wang G و Liu L و Ji G و Liu Y و Chen J و Webb JS و Reese G و Dean JF: WebTraceMiner: خدمة ويب لمعالجة ملفات تتبع تسلسل EST وتعدينها. الدقة الأحماض النووية. 2007 ، W137-142. 10.1093 / نار / gkm299. 35 خادم الويب

Nagaraj SH ، Deshpande N ، Gasser RB ، Ranganathan S: ESTExplorer: منصة تجميع علامات التسلسل المعبر عنها (EST) ومنصة التعليقات التوضيحية. الدقة الأحماض النووية. 2007 ، W143-147. 10.1093 / نار / جيكم 378. 35 خادم الويب

Pirooznia M و Gong P و Guan X و Inouye LS و Yang K و Perkins EJ و Deng Y: الاستنساخ والتحليل والتعليق التوضيحي الوظيفي لعلامات التسلسل المعبر عنها من دودة الأرض Eisenia fetida. المعلوماتية الحيوية BMC. 2007 ، 8 (ملحق 7): S7-10.1186 / 1471-2105-8-S7-S7.

Mangalam H: مجموعة أدوات Bio * - نظرة عامة موجزة. موجز Bioinform. 2002 ، 3 (3): 296-302. 10.1093 / بيب / 3.3.296.

Stajich JE، Block D، Boulez K، Brenner SE، Chervitz SA، Dagdigian C، Fuellen G، Gilbert JG، Korf I، Lapp H: The Bioperl toolkit: Perl modules for the life sciences. الدقة الجينوم. 2002 ، 12 (10): 1611-1618. 10.1101 / غرام 361602.


الخلاصة والمناقشة

نقترح نهجًا من خطوتين للتخصيص التصنيفي ، حيث نحصل على أكبر قدر ممكن من المعلومات بقدر ما نستطيع بشكل موثوق من مخرجات BLAST قبل استخدام طرق شجرة النشوء والتطور باهظة الثمن حسابيًا على التسلسلات التي يصعب تصنيفها. في هذا البحث ، قمنا بتطوير طريقة كشف خارجية لتعيين التصنيف باستخدام نتائج بلاست التي تفصل التطابقات الصحيحة نسبيًا من التطابقات إلى التسلسلات من كائنات متشابهة ولكن أكثر بُعدًا من الناحية التطورية. وبالتالي يمكن استخدام هذه الطريقة للخطوة الأولى من نهج من خطوتين ، لتحديد التسلسلات التي يمكن تعيين تسميات دقيقة باستخدام بحث BLAST فقط في قاعدة بيانات مرجعية.

نظرًا لأن جميع متواليات الرنا الريباسي 16S مرتبطة ببعضها البعض ، فإن الإحصائيات مثل القيمة E أو درجة البت الخاصة بـ BLAST لا توفر معلومات جاهزة لفصل التسلسلات من فئات مختلفة من النشوء والتطور. تُظهر تجاربنا أيضًا أنه لا يوجد أي قطع منفرد يمكن استخدامه لتحديد نتائج BLAST لتعيين التصنيفات التصنيفية بشكل صحيح. لقد جربنا العثور على القيم المتطرفة باستخدام توزيعات نقاط البت ، ولكن وجدنا أنها توفر معلومات غير كافية لاكتشاف التطابقات الصحيحة من الناحية التطورية (البيانات غير معروضة). تُظهر تجاربنا أيضًا أنه على الرغم من أن هوية النسبة المئوية لأفضل نتيجة BLAST مرتبطة بتسمية تصنيف تصنيفية لسلسلة ما ، فلا يمكن فصل التسلسلات التي يمكن تصنيفها عن تلك التي لا يمكن تصنيفها. وقد حفز هذا تطويرنا لطريقة قائمة على النقاط BILD لتحديد متى ستنتج أفضل نتائج بلاست تسميات تصنيفية دقيقة.

نظرًا لاستخدام طريقتنا كخطوة تصفية ، فإننا نسعى لتصنيف أكبر عدد ممكن من تسلسلات الاستعلام بدقة مع إجراء بعض التصنيفات الخاطئة. يتم بعد ذلك التعامل مع التسلسلات التي نتركها غير مصنفة بطريقة النشوء والتطور. تظهر نتائجنا على مجموعات البيانات الميتاجينومية 16S rRNA المحاكية والحقيقية أن طريقتنا تتمتع بدقة عالية على جميع المستويات التصنيفية ، وتعيين تسميات صحيحة بمستويات أعلى لغالبية التسلسلات ، وأنها فعالة من الناحية الحسابية مقارنة بأساليب التخصيص التصنيفية القائمة على شجرة النشوء والتطور. يوضح هذا الوعد باتباع نهج التخصيص التصنيفي المكون من خطوتين ، وذلك باستخدام طريقتنا كخطوة تصفية.

في المستقبل ، نخطط لدراسة التسلسلات التي تم تصنيفها بشكل صحيح عن طريق أساليب النشوء والتطور ولكن ليس من خلال طريقتنا ، لاكتساب نظرة ثاقبة للتحسينات الممكنة. نخطط أيضًا لدراسة فعالية تقييد الأساليب القائمة على شجرة النشوء والتطور على الشجرة الفرعية الممتدة من خلال القيم المتطرفة لطريقتنا. أخيرًا ، لاحظ أن طريقتنا قد تم تطويرها واختبارها على بيانات 16S rRNA ، وهي غير قابلة للتطبيق لأنها تمثل مجموعات بيانات تسلسل الجينوم الكامل (WGS). ومع ذلك ، فإن فكرة استخدام نهج من خطوتين لتعيين التصنيف في مجموعات بيانات WGS هي وسيلة مثيرة للاهتمام للبحث.


  • يبدأ بـ انفجار البحث (الاستعلام عن البروتين مقابل قاعدة بيانات البروتين)
  • يستخدم أفضل النتائج فوق عتبة (E -10 ^ 5) لإنشاء محاذاة وحساب ملف تعريف البروتين
  • يستخدم ملف تعريف البروتين لإجراء التكرارات التالية للبحث ، مضيفًا أفضل النتائج الجديدة إلى الملف الشخصي
  • جيد جدًا في اختيار العلاقات البعيدة بين البروتينات
  • قم بتشغيل البحث باستخدام التفجير المنتظم ، ولاحظ الضربات
  • كرر serch باستخدام PSI-BLAST ، وقم بتشغيل 3 تكرارات ، ولاحظ نجاحات الرواية

تحقق أولاً من تعيين $ BLASTDB و $ BLASTMAT (يجب أن تعرض هذه الأسماء بلا علامات $ ومسارات أمبير):

إذا حصلت على فراغ ولم يتم تعيين هذه في "

أو اتبع التعليمات لإنشاء "

لإنشاء قاعدة بيانات من ملف Fasta الخاص بك:

لمزيد من الخيارات ، اكتب "formatdb -h"


شكر وتقدير

S.A.R.، S.M.C. و ج. الاعتراف بالتمويل من EMBL. ن. و S.A.R. الاعتراف بالتمويل من Wellcome Trust (المنحة رقم 081989 / Z / 07 / A). نشكر L. Baldacci و F. Fenninger و G. Torrance و S. Choudhary و N. Gopal و S. وليامز لمساهماتهم الفنية. نشكر D. Schomburg و J. Mitchell و C. Steinbeck على دعمهم للجنة IUBMB-EC لدعمهم وتشجيعهم J. May لتحسين مكتبة الكشف عن الاستريو و E. Willighagen وغيره من مطوري مجموعة أدوات الكيمياء (CDK) للمساعدة الخروج بمكتبة CDK ومراجعة التصحيحات في الوقت المناسب.


كيفية حساب قواعد غير الحمض النووي في تسلسل باستخدام بايثون

لقد لاحظت مؤخرًا أن سؤالين معينين يظهران بشكل منتظم في سجلات البحث: "كيفية حساب القواعد غير DNA في تسلسل" و "كيفية معرفة ما إذا كان التسلسل يحتوي على DNA" (على عكس البروتين على الأرجح). لقد صدمني أن السؤال الثاني هو حقًا حالة خاصة من السؤال الأول - بمجرد أن يكون لدينا طريقة لحساب عدد قواعد الحمض النووي في تسلسل ، يمكننا ببساطة تطبيق قاعدة أنه إذا كان هناك أكثر من 80٪ (أو أي رقم آخر) اختر) القواعد في تسلسل هي A أو T أو G أو C ، فمن المحتمل أن يكون DNA.

لنبدأ بأبسط شيء نعتقد أنه سينجح - سنقوم ببساطة بحساب عدد أحرف A و T و G و C في تسلسل ، ثم نقسم على الطول ونضرب في 100 للحصول على نسبة مئوية. في هذا المثال ، أستخدم تسلسل الحمض النووي الذي يحتوي على ثلاثة أحرف غير ATGC: واحد من كل من N و Y و R. لقد قمت بتضمين إصلاح القسمة في بداية الكود في حالة رغبتك في تشغيل هذا على Python 2 :

يُظهر الإخراج من هذا الجزء من التعليمات البرمجية أنه يعمل كما هو متوقع:

ومع ذلك ، في بعض الظروف ، قد نرغب في السماح بأحرف أخرى غير A و T و G و C في تسلسل الحمض النووي لدينا. ألق نظرة على هذا الجدول الذي يوضح مجموعة رموز الغموض القياسية IUPAC:

اعتمادًا على المجموعة الفرعية التي نريد السماح بها ، قد نرغب في حساب ما يصل إلى ستة عشر حرفًا مختلفًا. بدلاً من حشر ستة عشر مكالمة مختلفة للعد () في سطر واحد ، ربما يكون من الأفضل تكرار الأحرف المسموح بها وبناء العدد واحدًا تلو الآخر. إليك القليل من التعليمات البرمجية للقيام بذلك ، باستخدام قائمة لتحديد مجموعة الأحرف المسموح بها. في هذا المثال ، أسمح بالقواعد القياسية الأربعة بالإضافة إلى البيورينات (R) والبيريميدينات (Y):

كما هو متوقع ، الإجابة أعلى مما كانت عليه في مثالنا الأول لأننا نحسب الآن R و Y كقواعد DNA:

هذا يبدو وكأنه جزء مثالي من التعليمات البرمجية لتحويلها إلى وظيفة. سنقوم بتحويل تسلسل الحمض النووي وقائمة القواعد المسموح بها إلى وسيطات وظيفية ، واستخدام افتراضي معقول لحساب أحرف ATGC فقط.

لاحظ كيف قمنا بتغيير كل من تسلسل الإدخال والقواعد المسموح بها إلى الأحرف الكبيرة ، للتأكد من أن الوظيفة ستعمل بغض النظر عن حالة المدخلات. فيما يلي بعض الاختبارات السريعة:

بعد كتابة هذه الوظيفة ، من السهل جدًا تحديد وظيفة لاختبار ما إذا كان التسلسل عبارة عن DNA. لجعل الوظيفة مرنة قدر الإمكان ، سنقوم بتعيين افتراضيات معقولة لكل من القواعد المسموح بها والحد الأدنى من النسبة المئوية للقواعد التي يجب أن تتطابق. سنقوم بتمرير تسلسل الإدخال وقائمة القواعد المسموح بها إلى الدالة count_dna () ، ثم نقارن نتيجة هذا الاستدعاء إلى الحد الأدنى. إليك الوظيفة جنبًا إلى جنب مع سطرين لاختبارها:

As you can see, the function is very concise – we simply ask whether the percentage of DNA bases returned by our earlier function is greater than the minimum, and return the result. As the output shows, we can make the test more stringent by increasing the minimum, or more lenient by allowing some ambiguous bases:

Another, much more concise way to write the counting function would be to use a list comprehension to select just the characters that are in some group:


To adapt the bioinformatics activities to a classroom context properly integrated in the high school curricula, the exercises were designed in collaboration with the teachers who took part in the pilot trial. Taking into account teachers’ suggestions, we propose a class workflow comprising four parts (I–IV), as schematically represented in Figure 1 and detailed below. To further assist teachers in implementing the class workflow, a tutorial video detailing the four parts was produced (see the online version of the journal to view the supplemental video). The estimated times correspond to the average time required by teachers to implement the full set of activities described below with their students. Regardless of the suggested timeline, it is important to emphasize that each teacher may easily reschedule the class workflow according to their teaching agenda either by cutting one or more of the four parts or, alternatively, by stimulating the students’ discussion after each exercise.

Setting up the theoretical background (estimated time: 60 minutes): The teacher emphasizes the importance of identifying genes from a genomic sequence. Besides recalling basic concepts such as genome, chromosomes, genes (structural, operator, repressor, regulator, promotor), and operons, students are introduced to important notions, namely start and stop codons, open reading frames (ORFs), synteny, and comparative genomics.

Introduction to bioinformatics databases and tools (estimated time: 30 minutes): The teacher highlights the importance of bioinformatics by explaining the exercises and introducing students to the bioinformatics resources and tools they will use, namely NCBI database, NCBI ORF finder, NCBI BLAST, and Microscope (MaGe). The tutorial video (Supplemental Material) should help teachers in this task and assist students throughout the exercises.

Bioinformatics exercises (estimated time: 70 minutes): Students carry out the exercises autonomously with the teacher's supervision to identify difficulties and answer questions.

Discussion of the results (estimated time: 20 minutes): The class discusses the results obtained in each exercise and assay to draw conclusions. Ultimately, the teacher might challenge the students to explore other case studies and study different genomic regions. In addition, we should not neglect students’ endeavor to explore autonomously the bioinformatics resources, particularly taking into account their user-friendly and intuitive interfaces. In fact, during the pilot trial, we observed that some students took the initiative to extend their في السيليكو experiments beyond the assigned activities by pursuing their own research queries, as, for instance: “What is the size of the genome of a spider?” “Are virus genomes such as HIV also available at this database?” or “Let's search for the gene coding for insulin.”


شاهد الفيديو: لن تصدق كيفية إنشاء مترو الأنفاق. مشاهد تحبس الأنفاس (يونيو 2022).


تعليقات:

  1. Mauramar

    The very excellent idea

  2. Taunos

    هذا هراء.

  3. Keifer

    وداعا ... نوع من الغباء



اكتب رسالة