ڈیٹا سائنس سیکھنے کے 12 اہم نکات

مصنف: Laura McKinney
تخلیق کی تاریخ: 3 اپریل 2021
تازہ کاری کی تاریخ: 1 جولائی 2024
Anonim
High Density 2022
ویڈیو: High Density 2022

مواد


ماخذ: آرٹ اسپاسنگ / ڈریم ٹائم ڈاٹ کام

ٹیکا وے:

ڈیٹا سائنسدانوں کو واضح طور پر مضبوط ریاضی اور کوڈنگ کی مہارت کی ضرورت ہے ، لیکن مواصلات اور دیگر نرم مہارتیں بھی کامیابی کے ل for ضروری ہیں۔

گلاسڈور پر امریکہ میں 2019 کے لئے ڈیٹا سائنسدان بہترین ملازمت میں شامل ہے۔ درمیانی بنیاد کی تنخواہ $ 108،000 اور 5 میں سے 4.3 کی ملازمت اطمینان کی درجہ بندی ، نیز مناسب پیش گوئی کی گئی پیش گوئی ، یہ حیرت کی بات نہیں ہے۔ سوال یہ ہے کہ: اس کام کے لئے کوالیفائی کرنے کیلئے کسی کو ٹریک پر جانے کے لئے کیا کرنا ہے؟

معلوم کرنے کے ل we ، ہم نے ان کیریئر کے راستے پر جانے کی کوشش کرنے والوں کو دی جانے والی نصیحت کی تلاش کی۔ کوڈنگ اور ریاضی میں سخت مہارتیں آتی ہیں۔ لیکن اکیلے ہی اس کی مضبوطی کا حساب نہیں آتا ہے۔ کامیاب ڈیٹا سائنس دانوں کو بھی کاروباری افراد سے اپنی شرائط پر بات کرنے کے قابل ہونے کی ضرورت ہے ، جو نرم مہارت اور قیادت سے وابستہ صلاحیتوں کا مطالبہ کرتے ہیں۔ (ڈیٹا سائنس دان کے فرائض کے بارے میں مزید معلومات کے ل Job ، جاب رول: ڈیٹا سائنسدان دیکھیں۔)

ایجوکیشنل فاؤنڈیشن کی تعمیر: تین بنیادی اشارے

NYC ڈیٹا سائنس اکیڈمی کے ڈیٹا سائنس دان ، ڈریس ژان نے ایک ایسی تعلیمی فاؤنڈیشن کی ضرورت پر زور دیا جس میں کوڈنگ اور ریاضی کی اہلیت کے لوازمات شامل ہیں:


  1. آر / ازگر + ایس کیو ایل۔ اگر آپ کے پاس کوڈنگ کی مہارت نہیں ہے تو ، اس خسارے کو پورا کرنے کے ل you آپ کو بہت سی نیٹ ورکنگ پاور اور دیگر شعبوں کی ضرورت ہے۔ میں نے اعداد و شمار کے سائنس دانوں کو ریاضی اور کم ڈومین کے کمزور تجربے کے ساتھ دیکھا ہے لیکن ان کے پاس ہمیشہ کوڈ کرنے کی مضبوط قابلیت موجود ہے۔ ازگر مثالی ہے لیکن آر گرنے کا ایک بہترین آلہ ہے۔ اپنے ہتھیاروں میں دونوں رکھنا بہتر ہے۔ ایس کیو ایل ڈیٹا تجزیہ کار کے لئے بھی بہت اہم ہے۔

  2. مضبوط ریاضی کی مہارتیں۔ عام طور پر استعمال ہونے والے چند طریقوں کی بہت اچھی تفہیم رکھنا: عام لکیری ماڈل ، فیصل ٹری ، کے ذرائع اور شماریاتی ٹیسٹ مختلف ماڈلز یا اسپیشلائزیشن جیسے RNN کی وسیع تصویر رکھنے سے بہتر ہے۔

یہ تعمیر کرنے کی مرکزی صلاحیتیں ہیں ، حالانکہ کچھ ماہرین ان میں اضافہ کرتے ہیں۔ مثال کے طور پر ، KDnuggets کی فہرست میں کوڈنگ اجزاء زان کا ذکر ہے اور تکنیکی پہلو پر جاننے کے لئے کچھ دیگر مفید چیزوں پر اضافہ کرتا ہے ، جس میں ہڈوپ پلیٹ فارم اپاچی چنگاری ، ڈیٹا بصیرت ، غیر ساختہ اعداد و شمار ، مشین لرننگ اور اے آئی شامل ہیں۔


لیکن اگر ہم کاگل سروے کے ذریعہ حقیقی زندگی میں استعمال کے ل identified استعمال شدہ عام طور پر استعمال شدہ ٹولز کے بارے میں ایک سروے سے اپنے اشارے لیں تو ہمیں کچھ مختلف نتائج ملتے ہیں۔ جیسا کہ آپ نیچے دیئے گئے اوپر کے 15 انتخابوں کے گراف سے دیکھ سکتے ہیں ، ازگر ، آر اور ایس کیو ایل آسانی سے ٹاپ تین بناتے ہیں ، لیکن چوتھا جوپٹر نوٹ بک ہے ، اس کے بعد ٹینسورفلو ، ایمیزون ویب سروسز ، یونکس شیل ، ٹیبلو ، C / C ++ ، NoSQL ہے۔ ، میٹلیب / اوکٹاوا اور جاوا ، ہڈوپ اور چنگاری سے آگے۔ ایک اور اضافہ جو لوگوں کو حیرت میں ڈال سکتا ہے ، وہ ہے مائیکروسافٹ کا ایکسل ڈیٹا مائننگ۔

تصویر بشکریہ کاگل

KDnuggets کی فہرست میں باضابطہ تعلیم سے متعلق ایک نکات بھی شامل ہے۔ زیادہ تر ڈیٹا سائنس دان اعلی درجے کی ڈگری رکھتے ہیں: 46 فیصد پی ایچ ڈی کرتے ہیں ، اور 88 فیصد کم سے کم ماسٹر کی سطح کی ڈگری رکھتے ہیں۔ ان کے پاس انڈرگریجویٹ ڈگری عام طور پر متعلقہ علاقوں میں تقسیم ہوجاتی ہیں۔ تقریبا About ایک تہائی ریاضی اور اعدادوشمار میں ہیں ، جو اس کیریئر ٹریک کے لئے سب سے زیادہ مقبول ہے۔ اگلی سب سے مشہور کمپیوٹر سائنس ڈگری ہے ، جس کی 19 فیصد آبادی ہے ، اور انجینئرنگ ، 16 فیصد کا انتخاب۔ یقینا، ، ڈیٹا سائنس کے لئے مخصوص تکنیکی اوزار اکثر ڈگری پروگراموں میں نہیں بلکہ خصوصی بوٹ کیمپوں میں یا آن لائن کورسز کے ذریعے پڑھتے ہیں۔

کورسز سے زیادہ: دو مزید نکات

ہنک یون ، جو وِیل کارنیل میڈیسن کے پلمونری ڈیپارٹمنٹ میں ریسرچ اسسٹنٹ اور NYC ڈیٹا سائنس اکیڈمی کے طالب علم ہیں ، کوائف کے خواہشمند سائنس دانوں کو مشورہ دیتے ہیں کہ وہ اس بارے میں منصوبہ بندی کریں کہ وہ کس کام کریں گے اور ایک مشیر تلاش کریں۔ انہوں نے کہا:

کوئی کیڑے نہیں ، کوئی تناؤ نہیں - آپ کی زندگی کو تباہ کیے بغیر زندگی کو تبدیل کرنے والے سافٹ ویئر تخلیق کرنے کے لئے مرحلہ وار گائیڈ

جب آپ سافٹ ویئر کے معیار کی پرواہ نہیں کرتے ہیں تو آپ اپنی پروگرامنگ کی مہارت کو بہتر نہیں کرسکتے ہیں۔

غلطی کو اپنے آپ کو یہ بتانے سے نہ کریں کہ آپ ڈیٹا سائنس جانتے ہیں کیونکہ آپ نے کورس لیا اور سرٹیفکیٹ حاصل کیا۔ یہ ایک عمدہ آغاز ہے ، لیکن جب آپ تعلیم حاصل کرنا شروع کرتے ہیں تو ، ایک پروجیکٹ کو ذہن میں رکھیں۔ پھر فیلڈ میں ایک مشیر ڈھونڈیں اور ابھی جذبہ پروجیکٹ کا آغاز کریں! جب آپ تازہ ہوں ، آپ نہیں جانتے کہ آپ کیا نہیں جانتے لہذا جب کوئی آپ کے لئے اہم ہے اور کیا نہیں ہے اس کی رہنمائی کرنے میں آپ کی مدد ہوتی ہے۔ آپ نہیں چاہتے ہیں کہ اس میں کچھ بھی نہیں دکھائے جانے کے لئے زیادہ وقت پڑھائی میں گزارنا نہیں ہے!

اپنے ٹول باکس کو کس ٹول سے نکالنا ہے یہ جاننا: منحنی سے آگے رہیں

ڈیٹا سائنس ٹولز کی درجہ بندی میں تفاوت کے پیش نظر ، کچھ لوگ اس بات پر حیرت زدہ ہو سکتے ہیں کہ اس پر کیا توجہ دی جائے۔ سیکیورٹی سافٹ ویئر کمپنی مکافی کے چیف ڈیٹا سائنس دان سیلسٹ فرالک نے اس معاملے کو ایک سی آئی او آرٹیکل میں نشاندہی کرتے ہوئے کہا ہے کہ اعداد و شمار کے ایک سائنس دان کے لئے ضروری صلاحیتوں کو دیکھتے ہوئے ، انہوں نے اعلان کیا ، “ڈیٹا سائنسدان کو تحقیق میں منحنی خطوط کے سامنے ہی رہنے کی ضرورت ہے ، اسی طرح سمجھئے کہ کون سی ٹکنالوجی لاگو کی جائے۔ "اس کا مطلب ہے کہ '' سیکسی '' اور نئے مسئلے کی طرف راغب نہیں ہوں گے ، جب اصل مسئلہ '' میں مل کو چلانے کے لئے کچھ زیادہ کی ضرورت ہوتی ہے۔ "ماحولیاتی نظام ، تشریحی ، تاخیر ، بینڈوڈتھ ، اور دوسرے نظام کی حدود کی شرائط - نیز صارف کی پختگی کے بارے میں کمپیوٹیشنل لاگت کے بارے میں آگاہ ہونا ، خود ڈیٹا سائنسدان کو یہ سمجھنے میں مدد کرتا ہے کہ کون سی ٹکنالوجی لاگو کی جائے۔"

ضروری نرم ہنر: ایک اور چھ ٹپس

فرالک جس نکتے کو سامنے لاتا ہے اس کا تعلق نان ٹیکنیکل مہارت سے ہے جو ڈیٹا سائنسدان کی ملازمت کی ضرورت ہے۔ یہی وجہ ہے کہ کے ڈنوگیٹس کی فہرست میں یہ چار شامل ہیں: دانشورانہ تجسس ، ٹیم ورک ، مواصلات کی مہارت اور کاروباری صلاحیت۔ زان نے ڈیٹا سائنسدانوں کے لئے اپنی تجاویز میں کلیدی نرم مہارتیں بھی شامل کیں ، کے ڈی ڈونگیٹس جیسے "مواصلات کی مہارت" کی نشاندہی کی ، لیکن "بزنس حکمت" کی جگہ "ڈومین مہارت" کا استعمال کیا۔ اسے جو بھی کہا جاتا ہے ، اس سے ڈیٹا سائنس کے عملی اطلاق سے مراد ہے کاروبار (مواصلات کی مہارت کے بارے میں مزید معلومات کے ل Technical ، تکنیکی پیشہ ور افراد کے لئے مواصلات کی صلاحیتوں کی اہمیت دیکھیں۔)

اولیویا پارر روڈ نے اس پر اپنی اپنی اسپن کی پیش کش کی ، اور تخلیقی صلاحیتوں کے کردار پر زور دیتے ہوئے مزید دو نرم مہارتوں کو شامل کیا ، انہوں نے زور دیتے ہوئے کہا ، "میں ڈیٹا سائنس کو ایک آرٹ کے طور پر جتنا سائنس سمجھتا ہوں ،" جس پر ڈرائنگ کی ضرورت ہوتی ہے۔ دماغ کے دونوں اطراف کی طاقتیں۔ "بہت سے لوگ ڈیٹا سائنس کے بارے میں کیریئر کے طور پر بات کرتے ہیں جو بنیادی طور پر بائیں دماغ کا استعمال کرتے ہیں۔ میں نے پایا ہے کہ کامیاب ہونے کے لئے ، ڈیٹا سائنسدانوں کو اپنا پورا دماغ استعمال کرنا چاہئے۔

انہوں نے وضاحت کی کہ اس میدان میں ترقی کے لئے نہ صرف تکنیکی قابلیت کی ضرورت ہے بلکہ تخلیقی صلاحیتوں اور قیادت کے لئے درکار وژن کی بھی ضرورت ہے۔

زیادہ تر بائیں دماغ / خطوطی کاموں کو خود کار طریقے سے بنایا جاسکتا ہے۔ ڈیٹا سائنسدانوں کی حیثیت سے مسابقتی کنارے کی پیش کش کرنے کے ل To ، ہمیں اپنے دماغ کے دونوں اطراف کا استعمال کرتے ہوئے پیٹرن کو پہچاننے اور بڑی مقدار میں معلومات کو ترکیب کرنے کے قابل ہونا چاہئے۔ اور ہمیں جدید سوچنے والے ہونے چاہ.۔ بائیں اور دائیں دماغ کے انضمام سے بہت سارے بہترین نتائج برآمد ہوتے ہیں۔

انہوں نے اس بات پر بھی زور دیا کہ ایک وژن کو واضح طور پر بات چیت کرنا کیوں ضروری ہے:

بحیثیت ڈیٹا سائنس دان ، ہمارا مقصد یہ ہے کہ ہم اپنے مؤکلوں کو اپنے منافع میں اضافے میں مدد کے لئے ڈیٹا کا استعمال کریں۔ زیادہ تر ایگزیکٹوز کو سمجھ نہیں آتی ہے کہ ہم کیا کرتے ہیں یا ہم اسے کیسے کرتے ہیں۔ لہذا ہمیں رہنماؤں کی طرح سوچنے کی ضرورت ہے اور زبان میں اپنی تلاش اور سفارشات کو بات چیت کرنے کی ضرورت ہے جس پر ہمارے اسٹیک ہولڈرز کو سمجھنا اور اعتماد کرنا چاہئے۔

ڈیٹا درجن

کلیدی نکات میں تخلیقی صلاحیتوں اور قائدت کی استعداد جیسی تکنیکی وسائل ، مہارت اور صلاحیتوں کی ایک بڑی تعداد شامل ہے ، نیز کم مقدار میں قابل خصوصیات بھی شامل ہیں۔ آخر میں ، یہ صرف اعداد کا کھیل نہیں ہے۔ چونکہ ڈیٹا سائنس صرف ویکیوم میں ماڈل بنانے کے بارے میں نہیں ہے بلکہ کاروباریوں کے لئے حقیقی زندگی کے مسائل حل کرنے کے لئے عملی استعمال کے ساتھ آرہا ہے ، اس شعبے میں کامیابی حاصل کرنے والے افراد کو صرف ماسٹر ٹکنالوجی کی ضرورت نہیں بلکہ اپنے کاروباری ڈومین کو جاننے اور ان کی ضروریات کو سمجھنے کی ضرورت ہے۔ کام پر ٹیم کے مختلف ممبران۔