ہاڈوپ جینوم تسلسل کے لئے ایک بہترین میچ کیوں ہے

مصنف: Roger Morrison
تخلیق کی تاریخ: 19 ستمبر 2021
تازہ کاری کی تاریخ: 5 مئی 2024
Anonim
ایک قابل اعتماد وسیلہ جو آپ کے IT ماحول کو جانتا ہے۔
ویڈیو: ایک قابل اعتماد وسیلہ جو آپ کے IT ماحول کو جانتا ہے۔

مواد


ماخذ: A3701027 / ڈریم ٹائم ڈاٹ کام

ٹیکا وے:

جینوم کی ترتیب کو اپنے تمام اعداد و شمار کو سنبھالنے کے ل technology طاقتور ٹکنالوجی ٹولز کی ضرورت ہے ، اور ہڈوپ کام پر منحصر ہے۔

کلینیکل جینومکس ایک دلچسپ موضوع ہے ، جہاں لوگ تیز اور درست نتائج پر کارروائی کرنے کے لئے جدید ٹیکنالوجی پر کام کر رہے ہیں۔ مارکیٹ میں بہت سارے جینوم سیکوینسرز دستیاب ہیں ، اور وہ ترتیب کے اعداد و شمار کے پیٹا بائٹس تیار کررہے ہیں ، اور تسلسل میں اضافہ مستقبل قریب میں ڈیٹا کی ایکسبی بائٹس تیار کرنے جارہا ہے۔ یہاں ، ہڈوپ پیچیدہ جینومکس کے کام کے بہاؤ پر کارروائی کرنے کا بہترین پلیٹ فارم ہے۔ ہڈوپ بڑے پیمانے پر معلومات کو اسٹور اور چھانٹ سکتا ہے اور معنی خیز تجزیہ بھی پیش کرسکتا ہے۔ (اس میں واقعی کتنا اعداد و شمار شامل ہیں اس کا اندازہ حاصل کرنے کے لئے ، تفہیم بٹس ، بائٹس اور ان کے ضوابط پڑھیں۔)

جینومکس کا حال اور مستقبل

آج ، جینوم میپنگ ترقی کے عروج پر پہنچ چکی ہے۔ جینومکس انڈسٹری سے وابستہ بہت سارے لوگ تجسس کے ساتھ پھیل رہے ہیں ، اور چونکہ نئے مواقع خود پیش کر رہے ہیں ، بہتر ٹکنالوجی وقت کی ضرورت ہے۔ جینوم کی ترتیب ایک بہت بار بار اور وسائل سے وابستہ کام ہے۔ صرف 2013 میں ، تقریبا 15 پیٹا بائٹس ڈیٹا تیار کیا گیا تھا ، اور صرف 2،000 تسلسلوں کے ذریعہ۔ جبڑے کے گرنے کی اس رقم میں 300 انسانوں کی ترتیب انسانی جینوم کے اعداد و شمار شامل ہیں۔ اعداد و شمار کی تیاری کی اس شرح پر ، اس بات کا اندازہ لگایا جاسکتا ہے کہ 2018 تک ، تقریبا ایک ایبابائٹ ڈیٹا تیار کیا جائے گا۔ اس کی وجہ تسلسل سازوں کی نشوونما ہوگی ، جو فی رن سے زیادہ سے زیادہ ڈیٹا تیار کرے گی۔ ایک اور وجہ انتہائی طاقتور اور کم لاگت والی جینوم سیکویننسنگ مشینوں کی آمد ہے۔ 2008 کے بعد سے ، ان مشینوں کی قیمتوں میں مسلسل کمی آ رہی ہے۔ اس کی وجہ اگلی نسل کی طاقتور مشینیں ہیں جو مارکیٹ میں داخل ہوچکی ہیں۔


جینوم میپنگ انڈسٹری کی ضروریات

پیچیدہ الگورتھم ڈیٹا پروسیسنگ کے لئے استعمال ہوتے ہیں جو انسانی جینوم سے جمع کیا جاتا ہے۔ پھر ، اس معلومات کو ذخیرہ کرنے کی ضرورت ہے۔ مستقبل میں اصل اعداد و شمار کے مقابلے کے لئے اس کا جائزہ لیا جاسکتا ہے۔ 100 جی بی ڈیٹا پر کارروائی اور ذخیرہ کرنے کا کام زیادہ مشکل نہیں ہے ، خاص طور پر جب آپ یہ ترتیب دینے والے مراکز میں استعمال شدہ طاقتور مشینوں کے ساتھ کر رہے ہیں۔ مطالعات سے پتہ چلتا ہے کہ ڈیٹا کی اس مقدار پر صرف 1،000 CPU گھنٹے میں کارروائی کی جاسکتی ہے ، لہذا یہ بہت آسان ہے۔ تکنیکی ترقی کی اس شرح پر ، یہ ظاہر ہے کہ جینوم انڈسٹری جلد ہی چند سیکنڈ میں ہزاروں گیگا بائٹس پر کارروائی کرے گی۔

تاہم ، ڈیٹا مینجمنٹ اور اسٹوریج کی تکنیک اتنی تیزی سے تیار نہیں ہورہی ہیں ، جس کی وجہ سے ، قیمتی ڈیٹا کے بڑے نقصان کی توقع کی جاسکتی ہے۔ یہ واقعی ناپسندیدہ ہے ، کیونکہ یہ انسانی جینومکس میں ہونے والی پیشرفت کو سنجیدگی سے رکاوٹ بنائے گا۔ لہذا ، ایک موثر ڈیٹا مینجمنٹ تکنیک کی ضرورت ہے ، جسے آسانی سے اپ ڈیٹ کیا جاسکتا ہے ، بہت زیادہ ہے۔ یہ خاص طور پر مستقبل قریب میں موثر ثابت ہوسکتا ہے ، جہاں جینوم میپنگ طاقت ور کمپیوٹرز والی بڑی لیبز سے چھوٹے اسپتالوں اور لیبز میں منتقل ہوجائے گی۔


حل میں کیا امید ہے؟

جس رفتار سے جینومک ترتیب دینے کی نئی تکنیکیں دریافت کی جارہی ہیں اور تیار کی جارہی ہیں اس کی رفتار انتہائی اونچی ہے۔ یہ رفتار طبی بیماریوں کے خاتمے کی طرف ایک طاقتور اقدام کی صورت میں میڈیکل سائنس کے لئے بہت فائدہ مند ثابت ہوسکتی ہے۔ تاہم ، یہ رفتار بہت مشکل بھی ہوسکتی ہے۔

چیلنج تسلسل منصوبوں کے ذریعہ تیار کردہ بڑی مقدار میں ڈیٹا کو سنبھالنے کی شکل میں سامنے آیا ہے۔ لہذا ، ایک موثر حل کی ضرورت ہے جو بڑے اعداد و شمار کو ذخیرہ کرنے اور پروسیسنگ کرنے میں مدد دے گی۔ یہ حل سستا اور تیز ہونا ضروری ہے ، جبکہ انکولی بھی۔ اس حل کے ذریعہ فراہم کردہ تجزیہ بھی قطعی اور مستحکم ہونا چاہئے۔ تو ، اس مسئلے کا حل کیا ہے؟ بلا شبہ ، یہ ہڈوپ ہے۔ (ہڈوپ کے استعمال سے متعلق مزید معلومات کے ل Big ، بطور خدمت کے 5 بصیرت (ہڈوپ) ملاحظہ کریں۔)

جینوم تسلسل کے لئے ہڈوپ بہترین حل کیوں ہے

جینومکس انڈسٹری کو جو چیز درکار ہے وہ ایک اعلی حل ہے جو ان کو اعداد و شمار کو موثر طریقے سے منظم کرنے ، اس پر کارروائی کرنے اور اسے مستقبل کے استعمال کے ل store ذخیرہ کرنے میں مدد کرسکتا ہے۔ ایسا لگتا ہے کہ یہ حل ہڈوپ سافٹ ویئر کے ساتھ ایک کامل میچ ہے۔ لہذا ، ہڈوپ کو کامل بگ ڈیٹا مینجمنٹ سوفٹ ویئر سمجھا جاسکتا ہے جو جینومکس انڈسٹری کی موجودہ ڈیٹا اسٹوریج تکنیک کو بہت بہتر بناسکتا ہے۔

ہڈوپ کی اصل وقت کی صلاحیتیں جینوم کی ترتیب دینے والوں کے لئے حقیقی وقت میں ایک بار میں بڑی مقدار میں ڈیٹا کا تجزیہ اور ذخیرہ کرنا ممکن بناتی ہیں۔ اس سے ڈیٹا کے مستقبل کے استعمال کو بھی قابل بناتا ہے۔ ہڈوپ بہت سے میراثی نظاموں کو مات دے سکتا ہے ، کیونکہ یہ ان سے کہیں زیادہ تیز اور قابل اعتماد ہے۔

کوئی کیڑے نہیں ، کوئی تناؤ نہیں - آپ کی زندگی کو تباہ کیے بغیر زندگی کو تبدیل کرنے والے سافٹ ویئر تخلیق کرنے کے لئے مرحلہ وار گائیڈ

جب آپ سافٹ ویئر کے معیار کی پرواہ نہیں کرتے ہیں تو آپ اپنی پروگرامنگ کی مہارت کو بہتر نہیں کرسکتے ہیں۔

ہاڈوپ اور کیا کرسکتا ہے؟

ہیدوپ کی وجہ سے ، جینومکس اور جین کی ترتیب کے میدان میں بڑی تعداد میں امکانات اور مواقع کھل گئے ہیں۔ ہڈوپ متوازی کمپیوٹنگ کے اختیارات پیش کرتا ہے جس کی وجہ سے تیز رفتار ترتیب ممکن ہے۔ نیز ، ہڈوپ کے میپریڈس فنکشن کا استعمال کرتے ہوئے ، بڑی تعداد میں جینز کو بہت آسانی سے نقشہ بنایا جاسکتا ہے۔ اس کی وجہ سے ، ہڈوپ کے ساتھ ملحقہ واقعی "اگلی نسل" بن جائے گا اور یہ بہت کم پیچیدہ ہوگا۔

ہڈوپ کے لئے مواقع

ہڈوپ کو جینوم انڈسٹری میں متعدد مواقع موجود ہیں ، لیکن جینس اینڈ ڈویلپمنٹ جریدے میں لنڈا چن کے مضمون "کینسر کے جینومک ڈیٹا کا احساس دلانا" سے اخذ کیا گیا ہے۔ اس مضمون میں ، انہوں نے اس بات پر تبادلہ خیال کیا کہ جدید جینومکس نے کس طرح نئے دروازے کھولے ہیں ، اور اس سے کینسر کے بارے میں جینومک معلومات کی دریافت جیسے بہت سارے مثبت نتائج برآمد ہوئے ہیں۔ اس کی وجہ سے ، ہم خود ہی کینسر کا علاج دریافت کرنے کے قریب ہیں۔ تاہم ، اس میدان میں بہتر تحقیق کی صلاحیت کے ل data تھوڑی زیادہ توجہ اور ایک طاقتور ڈیٹا مینجمنٹ ایپلی کیشن کی ضرورت ہے۔ ہڈوپ کے لئے اپنی رفتار ، طاقت اور درستگی کو ثابت کرنے کا یہ بہترین موقع ہوسکتا ہے۔

کراسبو: نیکسٹ جنریشن ڈیٹا مینجمنٹ پلیٹ فارم

کراسبو ، جو ایک سافٹ ویئر پائپ لائن ہے جس کا مقصد جینوم کی دوبارہ ترتیب دینے کے تجزیہ کے لئے ہے ، ایک بہترین حل ہے۔ یہ ہڈوپ میں تسلسل والے اعداد و شمار کی سیدھ میں لانے کے ل for ایک تیز الگورتھم کے مابین انضمام کا نتیجہ تھا ، جسے بوٹی کہا جاتا ہے ، اور ایک طاقتور الگورتھم جو تسلسل والے اعداد و شمار کا موازنہ اور اس کی جانچ کرتا ہے ، یعنی ایک جونو ٹائپر جس کا نام صابن ایس این پی ہے۔ یہ اپاچی ہڈوپ پر بنایا گیا ہے اور میپریڈس فریم ورک کے نفاذ پر مبنی ہے۔ کراسبو پورٹیبل ، توسیع پزیر ہے اور کلاؤڈ کمپیوٹنگ ٹول کے طور پر بھی موزوں ہے۔

اس طاقتور انضمام کے ساتھ ، 10 نوڈس والے مقامی کلسٹر میں صرف ایک دن میں ایک مکمل جینوم کی جانچ کی جاسکتی ہے۔ 40 نوڈ کلسٹر کے ساتھ ، یہ عمل مزید تیز تر ہے اور صرف تین گھنٹوں میں مکمل ہوتا ہے جس کی کل لاگت $ 100 سے کم ہے! کراسبو کی درستگی کو جانچنے کے لئے کی جانے والی ایک تحقیق میں بتایا گیا ہے کہ وہ ہر جینوم کا موازنہ 99 فیصد درستگی کے ساتھ کرسکتا ہے۔ کراسبو کی ایک اور مددگار خصوصیت یہ ہے کہ یہ بادل پر چلتی ہے۔ اس طرح ، کراسبو ہزاروں مستقبل کے تسلسل مراکز ، جیسے اسپتالوں کی طرح ، کسی بھی طاقت ور ، مہنگے کمپیوٹرز اور ٹکنالوجی کی ضرورت کے بغیر بڑی مقدار میں جینوم ڈیٹا کو ترتیب دینے میں مدد دے گا۔

دیگر ہڈوپ پر مبنی جینومکس سافٹ ویئر

بہت سی کمپنیوں نے جینومکس کی دنیا کو تبدیل کرنے میں ہڈوپ کی طاقت کو تسلیم کیا ہے۔ جدید جینوم کی ترتیب کے ل its اس کی صلاحیت کو بہتر بنانے کے ل They انہوں نے ہڈوپ میں مناسب ترمیم کی ہے۔ مشہور ہڈوپ پر مبنی جینوم تسلسل حل کی کچھ مثالیں ذیل میں دی گئی ہیں۔

  • ہڈوپ - بام: یہ ایک طاقتور ڈیٹا مینجمنٹ ٹول ہے جو جینومکس سے متعلق مختلف سرگرمیوں جیسے جینو ٹائپنگ کے لئے ہڈوپ کے میپریڈس فنکشن کو استعمال کرتا ہے۔ یہ ثنائی سیدھ / نقشہ کی شکل میں کام کرتا ہے۔
  • کلاؤڈ برسٹ: یہ ہڈوپ پر مبنی حل 2009 میں تشکیل دیا گیا تھا۔ یہ جینوم کی ترتیبوں کا موازنہ کرنے اور انفرادی جینوں کی نقشہ سازی میں انتہائی موثر ہے۔ یہ اس مقصد کے لئے ڈیزائن کی گئی ہڈوپ پر مبنی پہلی درخواستوں میں سے ایک ہے۔

نتیجہ اخذ کرنا

بڑے اعداد و شمار اور جینومکس انڈسٹری کے مابین انضمام جدید دور میں ایک ورن ثابت ہورہا ہے۔ یہ پلیٹ فارم کینسر جیسی متعدد بیماریوں کے علاج کی دریافت میں کارگر ہیں۔ جینوم میپنگ کے ذریعہ پائے جانے والے اعداد و شمار کو ایسی بیماریوں سے بچاؤ کے بارے میں معلومات کی تشکیل کے لئے استعمال کیا جاسکتا ہے۔ بڑے اعداد و شمار کی آمد کو جینومکس کی دنیا میں ایک اہم مقام سمجھا جاسکتا ہے ، اور اگر معلومات کو دانشمندی سے استعمال کیا جائے تو ممکنہ طور پر صحت کی دیکھ بھال کے وسیع میدان میں بھی۔ اس فیلڈ کو آگے بڑھنے کا واحد راستہ ہڈوپ جیسے مناسب ڈیٹا مینجمنٹ ٹولز کا استعمال ہے۔