ڈیٹا کیٹلاگ اور مشین لرننگ مارکیٹ کی پختگی

مصنف: Roger Morrison
تخلیق کی تاریخ: 28 ستمبر 2021
تازہ کاری کی تاریخ: 21 جون 2024
Anonim
مشین لرننگ اور AI کے لیے ڈیٹا کیسے تیار کریں۔
ویڈیو: مشین لرننگ اور AI کے لیے ڈیٹا کیسے تیار کریں۔

مواد


ماخذ: نیمیا / ڈریم ٹائم ڈاٹ کام

ٹیکا وے:

ایم ایل ڈی سی مارکیٹ میں اضافہ ہورہا ہے ، اور مشینری لرننگ کے ذریعہ بڑے اعداد و شمار کو مؤثر طریقے سے فائدہ اٹھانے کی کوشش کرنے والے کاروباری اداروں کو فیلڈ میں سرفہرست ناموں اور ان کی انفرادی درجہ بندی سے آگاہ ہونا چاہئے۔

یہ بڑے اعداد و شمار کی عمر ہے۔ ہم معلومات سے دوچار ہوجاتے ہیں ، اور کاروباری اداروں کو اس سے اس کی قیمت کو سنبھالنا اور اس کو نکالنا ایک چیلنج لگتا ہے۔

آج کل کے بڑے اعداد و شمار میں نہ صرف حجم ، مختلف قسم اور رفتار ، بلکہ پیچیدگی بھی ہے۔ جیسا کہ ایس اے ایس کے ذریعہ بگ ڈیٹا ہسٹری اور موجودہ تحفظات کی نشاندہی کی گئی ہے "ایک سے زیادہ ذرائع سے ، ندیوں کا ایک عنصر بناتا ہے جس کی وجہ سے سسٹم میں ڈیٹا کو جوڑنا ، میچ کرنا ، صاف کرنا اور اسے تبدیل کرنا مشکل بنا دیتا ہے۔" (بڑے ڈیٹا کے بارے میں مزید معلومات حاصل کرنا چاہتے ہیں؟ چیک کریں (بڑا) ڈیٹا بگ فیوچر۔)

قیمتی بصیرت کا حصول زیادہ سے زیادہ اعداد و شمار جمع کرنے کا سوال نہیں ہے ، بلکہ صحیح اعداد و شمار کو تلاش کرنا ہے۔ دستی عمل کے ساتھ اس کے ذریعے کام کرنا ناممکن ہے۔ یہی وجہ ہے کہ زیادہ سے زیادہ کاروبار "ڈیٹا تک رسائی کو جمہوری بنانے ، قبائلی اعداد و شمار کے علم کو معلومات کو درست کرنے ، ڈیٹا پالیسیاں نافذ کرنے اور کاروباری قدر کے ل value تمام ڈیٹا کو تیزی سے متحرک کرنے کے ل to ڈیٹا کیٹلاگ کا رخ کرتے ہیں۔"


یہ وہ جگہ ہے جہاں تصویر میں ڈیٹا کیٹلاگ (بعض اوقات انفارمیشن کیٹلاگ کے نام سے بھی جانا جاتا ہے) داخل ہوتا ہے۔ جیسا کہ یہاں بیان کیا گیا ہے ، وہ "صارفین کو اپنے مطلوبہ ڈیٹا ذرائع کو دریافت کرنے اور دریافت کردہ ڈیٹا ذرائع کو سمجھنے کے لئے بااختیار بناتے ہیں ، اور ساتھ ہی تنظیموں کو ان کی موجودہ سرمایہ کاری سے زیادہ قدر حاصل کرنے میں مدد دیتے ہیں۔" اس کے طریقوں میں سے ایک یہ ہے کہ اعداد و شمار تک زیادہ سے زیادہ رسائی کو قابل بنانا ، مختلف قسم کے صارفین میں سے جو اس کا استعمال کرسکتے ہیں یا اس میں حصہ ڈال سکتے ہیں۔

انفونکومکس لازمی

2017 کے آخر میں ڈیٹا کیٹلاگ کی ڈرامائی طور پر بڑھتی ہوئی طلب کو نوٹ کرتے ہوئے ، گارٹنر نے انہیں "نیا سیاہ" قرار دیا۔ وہ تیزی سے اور معاشی حل کے طور پر پہچانتے جارہے تھے کہ "انوینٹری کو اور ان تنظیموں کی درجہ بندی کرنے کے لئے جو تیزی سے تقسیم اور غیر منظم شدہ ڈیٹا اثاثوں اور ان کی معلومات کی فراہمی کی زنجیروں کا نقشہ بناتے ہیں۔" اس کی ضرورت "انفومومکس" کے عروج کی وجہ سے پیدا ہوئی ہے جس میں معلومات سے باخبر رہنے کے لئے اسی طرح کی پیچیدگی کا اطلاق کرنے کا مطالبہ کیا گیا ہے جیسا کہ دوسرے کاروباری اثاثوں کا انتظام کرنا ہے۔ (فراہمی کی زنجیروں کے بارے میں مزید معلومات کے ل see دیکھیں کہ مشین لرننگ کس طرح سپلائی چین کی اہلیت کو بہتر بنا سکتی ہے۔)


گارٹنرز دی فوریسٹر ویو j: مشین لرننگ ڈیٹا کیٹلاگس ، کیو 2 ، 2018 کے ساتھ جیب لے رہے ہیں۔ اس رپورٹ میں سروے کے نصف سے زیادہ شرکاء نے کہا ہے کہ وہ اپنے ڈیٹا کیٹلوگ پر عمل درآمد کی منصوبہ بندی کر رہے ہیں۔ ممکن ہے کہ وہ بڑی حد تک اس حقیقت سے متاثر ہوئے ہوں کہ ہر ایک کو اپنی تنظیم میں کم سے کم سات ڈیٹا لیکس موجود تھے۔ جیسا کہ گارٹنر ڈیٹا کیٹلاگ کی وضاحت کرتا ہے ، اعداد و شمار کے کیٹلاگ خاص طور پر "کون ، معنی اور اعداد و شمار کی قدر" کو باہر نکالنے کے لئے مفید ہیں جو عام طور پر ڈیٹا جھیل میں غیر طبقاتی شکل میں رہ جاتا ہے۔

فوریسٹر نے اطلاع دی ہے کہ ڈیٹا اور تجزیاتی فیصلے کرنے والوں کی ایک تہائی سے زیادہ تعداد 2017 میں 1،000TB یا اس سے زیادہ ڈیٹا سے نمٹ رہی ہے ، اس رقم کی اطلاع صرف ایک سال پہلے صرف 10 اور 14 فیصد کے درمیان تھی۔ اس پیمانے پر ڈیٹا کا انتظام ایک بڑھتا ہوا چیلنج ہے ، یا خاص طور پر ، دو چیلنج:

"1) موجودہ کاروباری عمل کو ماخذ ڈیٹا میں ضم کرنے اور اس کا تجزیہ کرنے اور بصیرت کو عملی جامہ پہنانا اور 2) ڈیٹا کو بڑھنے کے ساتھ ساتھ اسے جمع کرنا ، ان کا انتظام کرنا اور ان پر حکمرانی کرنا۔"

کوئی کیڑے نہیں ، کوئی تناؤ نہیں - آپ کی زندگی کو تباہ کیے بغیر زندگی کو تبدیل کرنے والے سافٹ ویئر تخلیق کرنے کے لئے مرحلہ وار گائیڈ

جب آپ سافٹ ویئر کے معیار کی پرواہ نہیں کرتے ہیں تو آپ اپنی پروگرامنگ کی مہارت کو بہتر نہیں کرسکتے ہیں۔

کاروباری اداروں کے لئے ڈیٹا کیٹلاگس کیا کرسکتا ہے

گارٹنر مخصوص طریقوں کی نشاندہی کرتا ہے جس میں اعداد و شمار کی کیٹلاگ تنظیموں کے معلومات اور پیداواری صلاحیت کو بہتر بناسکتے ہیں۔

  • تنظیم کے لئے دستیاب تازہ ترین معلومات کے اثاثہ کی انوینٹری کو کولٹ اور بات چیت کرنا۔

  • کاروباری اصطلاحات کی مشترکہ لغت تیار کرنا جو تنظیموں کے اعداد و شمار کی اصطلاحی تشریح اور معنی کی وضاحت کرتی ہے ، اس طرح تعریفی عدم توازن کو ثالثی اور حل کرنے کے ذرائع فراہم کرتی ہے۔

  • کاروباری اور آئی ٹی ساتھیوں پر تبصرہ کرنے ، دستاویز کرنے اور ڈیٹا کا اشتراک کرنے کے اہل بنانے کے لئے متحرک اور فرتیلی تعاون کا ماحول قابل بنانا۔

  • نسب اور اثر تجزیہ کے ساتھ ڈیٹا کے استعمال میں شفافیت فراہم کرنا۔

  • انفارمیشن گورننس کے عمل کی حمایت میں ڈیٹا کی نگرانی ، آڈٹ اور ٹریسنگ۔

  • ڈیٹا کے استعمال اور دوبارہ استعمال ، استفسار کی اصلاح اور ڈیٹا سرٹیفیکیشن کے اندرونی تجزیے کو بڑھانے کے ل met میٹا ڈیٹا پر قبضہ کرنا۔

  • اس کے کاروباری استعمال کے اندر معلومات کو حراست میں لے کر ، گفتگو کرتے ہوئے اور اس کا تجزیہ کرکے کہ کون سا ڈیٹا موجود ہے ، وہ کہاں سے آیا ہے ، اس میں کون سے استعمال کیا جاتا ہے ، اس کی ضرورت کیوں ہے ، یہ کس طرح عمل اور نظام کے مابین بہتا ہے ، کون اس کا جوابدہ ہے ، اس کا کیا مطلب ہے۔ اور اس کی کیا اہمیت ہے۔

گارٹنر کی رپورٹ کے مطابق ، اعداد و شمار کو مناسب طریقے سے شناخت کرنے اور تنظیم کے کلیدی افراد تک ان تک رسائی حاصل کرنا ضروری ہے ، صرف "ڈیجیٹل کاروباری نتائج کے لئے ڈیٹا اثاثوں سے رقم کمانے کے لئے" راستہ تلاش کرنے کے لئے نہیں ، بلکہ قواعد و ضوابط پر عمل کرنا ، چاہے وہ انڈسٹری ہوں۔ ہیلتھ انشورنس پورٹیبلٹی اینڈ احتساب ایکٹ (HIPAA) کی طرح مخصوص یا عام ڈیٹا پروٹیکشن ریگولیشن (جی ڈی پی آر) جیسے زیادہ عام نوعیت کا۔

مشین لرننگ میں شامل کرنا

لیکن کچھ بھی اس کی کوتاہیوں کے بغیر نہیں ہے۔ ڈیٹا کیٹلاگوں کے ل the ، یہ مسئلہ سست اور تکلیف دہ عمل رہا ہے جس کو دستی طور پر ان تمام میٹا ڈیٹا کے ساتھ تشکیل دینے میں شامل کیا گیا ہے جن کو جگہ میں رکھنے کی ضرورت ہے۔ مشین سیکھنے کا جزو اسی جگہ آتا ہے۔

ڈیٹا کیٹلاگوں کا جن کا اندازہ فاریسٹر نے لیا ان کو ایم ایل ڈی سی کہا جاتا ہے کیونکہ وہ مشین لرننگ کی طاقت کو استعمال کرتے ہیں ، جو اے آئی کے اجزاء میں سے ایک ہے۔ جیسا کہ پوڈیم ڈیٹا بلاگ نے وضاحت کی ، اس سے "میٹا ڈیٹا کا مستقل ذخیرہ بنانا اور پھر ایم ایل / اے کا اطلاق بنیادی ڈیٹا اثاثوں کے ارد گرد ممکنہ طور پر مفید بصیرت کو سامنے لانے اور بے نقاب کرنے کو ممکن بناتا ہے۔"

کیسے منتخب کریں

تنظیموں کو یہ اندازہ کرنے میں مدد کرنے کے لئے کہ کون سے کون سے کاروبار کو منتخب کرنا چاہئے ، فوریسٹر نے اعلی 12 ایم ایل ڈی سی پر تشخیص کے 29 نکات کا اطلاق کیا۔ اس نے اس مارکیٹ میں رہنماؤں کی نشاندہی کی: IBM ، Relito ، Unifi سافٹ ویئر ، اییلیشن اور کولیبرا۔ انھوں نے جس مضبوط اداکاروں کو پایا انفارمٹیکا ، اوریکل ، واٹر لائن ڈیٹا ، انفوگکس ، کیمبرج سیمنٹکس اور کلڈیرا ہیں۔ ہارٹن ورکس "دعویدار" کے درجے میں تنہا کھڑا ہے۔

تاہم ، کسی کو بھی مجموعی درجہ بندی کے مطابق نہیں جانا چاہئے۔ اس رپورٹ میں ہر ایک کی خاص طاقتوں اور کمزوریوں کو ختم کیا گیا ہے۔ اس کے مطابق ، اگر کسی خاص خصوصیت ، جیسے تحقیق اور ترقی ، کسی تنظیم کے لئے انتہائی اہمیت کا حامل ہے ، تو وہ اس پہلو کے لئے ہارٹن ورکس کو آئی بی ایم اور کولبرا کے برابر سمجھ سکتا ہے کیونکہ وہ تینوں اس معیار کے ل five پانچ کے اعلی اسکور کا اشتراک کرتے ہیں ، جو تھا اییلیشن اور کولیڈرا سے دو پوائنٹس اور کیمبرج سیمنٹکس سے چار پوائنٹس بہتر ہیں۔

اس کے مطابق ، فوریسٹر رپورٹ ہدایت دینے کے لئے اپنی رپورٹ کو استعمال کرنے والوں کو مشورہ دیتا ہے کہ وہ یہ نہ سمجھے کہ اعلی درجہ والی کمپنی ہر ایک کے لئے بہترین انتخاب ہے۔ انھیں یہ معلوم کرنے کے لئے کہ ان کی مخصوص ضروریات کو پورا کرنے کے لئے اس جائزے کی خرابی پر کڑی توجہ دینی چاہئے۔