5 کلیدی علاقے جہاں بڑا ڈیٹا بڑا اثر مرتب کررہا ہے

مصنف: Eugene Taylor
تخلیق کی تاریخ: 9 اگست 2021
تازہ کاری کی تاریخ: 10 مئی 2024
Anonim
Senior Americans Listen to Amazing Facts about ★ISLAM and MUSLIMS★ - ✔ NEW 2021
ویڈیو: Senior Americans Listen to Amazing Facts about ★ISLAM and MUSLIMS★ - ✔ NEW 2021

مواد


ماخذ: نمیڈیا / ڈریم ٹائم ڈاٹ کام

ٹیکا وے:

بگ ڈیٹا ہر جگہ بڑا کاروبار ہوتا ہے ، لیکن اس ٹکنالوجی کا سب سے زیادہ فائدہ اٹھانے والے چند مخصوص شعبے۔

جب میں نے یہ مضمون شروع کیا تو ، میں مختلف قسم کے بڑے ڈیٹا پلیٹ فارم کی فہرست بنانے کا منصوبہ بنا رہا تھا۔ لیکن ، تین دن تک تمام مختلف بڑے اعداد و شمار کی پیش کشوں کو درست کرنے کی کوشش کرنے کے بعد - غیر متعلقہ بمقابلہ ، ایس کیو ایل بمقابلہ نو ایس کیو ایل اور ڈیٹا بیس بمقابلہ فریم ورک۔ کچھ نظم و ضوابط میں ، میں نے اس گندگی سے بچنے کا فیصلہ کیا۔

چوٹ کی توہین میں اضافہ کرنے کے ل I ، میں نے اس مضمون سے اس شخص کو متعارف کرانے کی امید کی تھی جس نے مضمون کے حصے کے طور پر "بگ ڈیٹا" کی اصطلاح تیار کی تھی۔ لیکن ، میں یہ بھی نہیں کرسکتا۔ اس پر متفقہ جواب نہیں ہے۔ در حقیقت ، ایک مکمل اڑنے والا تحقیقی پروجیکٹ موجود ہے جس میں معلوم کیا گیا ہے کہ اصل میں کون بڑا ڈیٹا لے کر آیا ہے۔ اس کے بجائے ، میں کچھ اہم طریقوں پر ایک نظر ڈالنے جا رہا ہوں جس میں ڈیٹا کو استعمال کیا جاتا ہے۔ اس سے کہیں زیادہ اہم بات۔ اور یہ آپ کے سوچنے سے کہیں زیادہ دلچسپ اور حیرت انگیز ہے۔


یہ کیسے ہوا

روایتی ڈیٹا مائننگ کو استعمال کرنے والے تجزیہ کار برسوں سے ڈیٹا میں ہیرا پھیری کر رہے ہیں۔ ان ہی تجزیہ کاروں کو اب کاروباری اداروں ، نجی تنظیموں اور سرکاری اداروں کے ذریعہ رقم اور مختلف اعداد و شمار کو بچانے میں مشکل پیش آرہی ہے۔

بڑا ڈیٹا درج کریں ، ڈیٹا مائننگ کا اگلا ارتقائی اقدام۔ آج کی ڈیجیٹل دنیا میں وسیع پیمانے پر ڈیٹا بیس اور ہزاروں قسم کے ڈیٹا بنائے جارہے ہیں جو بڑے اعداد و شمار کو تیار کیا گیا تھا۔ اگر آپ "بڑے پیمانے پر" گوگل اور اس کے ذریعہ جمع کردہ تمام ڈیٹا کے بارے میں سوچ رہے ہیں تو آپ بالپارک میں ہوں گے۔ آپ کو کیا حیرت ہوسکتی ہے کہ گوگل دنیا کے سب سے بڑے ڈیٹا بیس کی ٹاپ ٹین لسٹ میں صرف چوتھے نمبر پر ہے۔ جنوری 2014 تک ، ورلڈ ڈیٹا سینٹر برائے آب و ہوا 220 ٹیرابائٹ ڈیٹا کے ساتھ اس فہرست میں سرفہرست ہے ، اور یہ کسی کا بھی اندازہ ہے کہ کچھ سرکاری ایجنسیوں کے زیر کنٹرول ڈیٹا بیس کے سائز کا بھی اندازہ نہیں ہے۔

یقینا big ، بڑے اعداد و شمار نے اس کا آغاز کیا کیونکہ اس سے مختلف اعداد و شمار کی کثیر مقدار میں ہیرا پھیری کرنا اور حیرت انگیز - اور حیرت انگیز طور پر تفصیلی اور ذاتی چیزیں دریافت کرنا ممکن ہوتا ہے۔ ایچ آر انڈسٹری کے تجزیہ کار جان سمسیر مندرجہ ذیل مثال فراہم کرتے ہیں۔


"آج ہم مفروضے تخلیق کرتے ہیں اور ڈیٹا اکٹھا کرتے ہیں۔ کل ہم الٹا کام کرتے رہیں گے۔ اعداد و شمار کی مستقل اور مستحکم جمعیت ہمارے سوالوں کو تشکیل دینے سے پہلے ڈیٹا کو دیکھنے کے قابل بنائے گی۔ اس کا مطلب ہے کہ ہمیں ان سوالوں کے جواب ملیں گے جو ہم نہیں کرتے تھے۔ ' پوچھنا نہیں جانتے۔ ہم حقائق ماننے والی چیزوں کے پورے جتنے کو بھی نہیں سوچیں گے۔

یقینا، ، ہم سب نے اس اعداد و شمار کو استعمال کرنے کے لئے استعمال کیے جانے والے کچھ عجیب و غریب طریقوں کے بارے میں سنا ہے ، جیسے اہلیان کی اہلیہ کسی نوجوان عورت کی حمل کی تفہیم کرنے کی اہلیت سے پہلے کہ اس کے اہل خانہ کو پتہ چل سکے۔ لیکن بڑے اعداد و شمار کو بھی بہت کم مذموم مقاصد کے لئے استعمال کیا جا رہا ہے۔ یہاں کچھ تنظیمیں یہ سب سے زیادہ فائدہ اٹھا رہی ہیں۔

جب آپ سافٹ ویئر کے معیار کی پرواہ نہیں کرتے ہیں تو آپ اپنی پروگرامنگ کی مہارت کو بہتر نہیں کرسکتے ہیں۔

ایک واضح شعبہ جس میں بڑا اعداد و شمار مددگار ثابت ہوں گے وہ طبی اداروں میں الیکٹرانک صحت کے ریکارڈوں کو محفوظ طریقے سے اور درست طریقے سے سنبھالنا ہے۔ درست ریکارڈ رکھنے سے مریضوں کو بہتر خدمات اور غلطیاں کم ہونے کی سہولت ملے گی۔ صحت کی دیکھ بھال کا فیلڈ ، واضح وجوہات کی بناء پر ، مریضوں کی رازداری سے متعلق سرکاری ضوابط کے مطابق ہونے کے ل big ، ایک بڑی سست رفتار کو بڑے اعداد و شمار میں ڈھال رہا ہے۔

جیسا کہ پہلے ذکر کیا گیا ہے ، بڑا ڈیٹا غیر سوالوں کے جوابات فراہم کرنے کے لئے جانا جاتا ہے۔ صحت کی دیکھ بھال کے شعبے میں ، اس کا مطلب ہوسکتا ہے کہ کوئی نئی دوائی یا علاج تلاش کیا جائے جو دوسری صورت میں نہ مل پائے۔ مک کینسی اینڈ کمپنی کے مطابق ، بڑے ڈیٹا سے دور دراز مستقبل میں مندرجہ ذیل چیزوں کو ممکن بنایا جاسکتا ہے۔

  • حیاتیاتی عمل اور منشیات کی پیش گوئی کرنے والی ماڈلنگ زیادہ نفیس اور وسیع تر ہوجاتی ہے۔
  • مریضوں کی شناخت کلینیکل ٹرائلز میں معلومات کے زیادہ وسائل ، جیسے سوشل میڈیا پر مبنی ہے۔
  • حفاظت یا آپریشنل امور کو تیزی سے شناخت کرنے کے لئے حقیقی وقت پر ٹرائلز کی نگرانی کی جاتی ہے۔
  • سخت اعداد و شمار کے سیلوں کے بجائے جن کا استحصال کرنا مشکل ہے ، اعداد و شمار کو الیکٹرانک طریقے سے پکڑا جاتا ہے اور مختلف یونٹوں کے مابین آسانی سے بہہ جاتا ہے۔

بڑا ڈیٹا ، بڑا موقع

اگرچہ کچھ مخصوص علاقوں میں بڑے اعداد و شمار کا فائدہ اٹھایا جارہا ہے ، لیکن یہ مندرجہ ذیل علاقوں میں تمام تنظیموں کو موقع فراہم کرتا ہے۔

کسی بھی کمپیوٹنگ اور نیٹ ورکنگ ڈیوائس کے بارے میں ڈیٹا لاگ۔ جلد لاگ ان ہونے والے ڈیٹا کی مقدار ناجائز ہوجاتی ہے۔ بڑے اعداد و شمار آسانی سے اس ڈیٹا کو منظم کرسکتے ہیں ، جس سے منتظمین کو نیٹ ورک کی سرگرمی کی نگرانی کرنے ، مسائل کی تشخیص کرنے کی اجازت مل سکتی ہے ، یا مثال کے طور پر روبین نے مجھے کچھ نیٹ ورک ٹریفک کے نمونوں کی تلاش کی ہے جو میلویئر کی سرگرمی کی نشاندہی کرے گی۔

اگر آپ یہ مضمون پڑھ رہے ہیں تو ، یہ کافی حد تک محفوظ شرط ہے کہ آپ اوپن ایس ایل کے آس پاس دل کی باتوں سے واقف ہوں گے۔ تکنیکی پریشانی کے علاوہ ، یہ تشویش موجود ہے کہ یہ خطرہ کئی سالوں سے موجود ہے۔ روبین نے ذکر کیا کہ ڈیٹا تجزیہ کاروں کے ساتھ مل کر نیٹ ورک ایڈمنسٹریٹرز کو ایک ایسا پروگرام بنانے کی اجازت دی گئی ہے جو دل کی دھڑکنوں کے لئے تمام نیٹ ورک لاگ کو تلاش کرے گا۔ اس EFF پوسٹ میں ذکر ہے:

"کسی بھی نیٹ ورک آپریٹرز کے پاس جس کے پاس وسیع پیمانے پر پیکٹ لاگ ہیں وہ بدنیتی پر مشتمل دل کی دھڑکنوں کی جانچ کر سکتے ہیں ، جن میں زیادہ تر عام طور پر 18 03 02 00 03 01 یا 18 03 01 00 03 01 (یا شاید 18 بھی 03 03 00 03 01 01) کا ٹی سی پی پے لوڈ ہوتا ہے۔"

مندرجہ ذیل مثال شو آڈٹ کمانڈ سے نمونہ آؤٹ پٹ ہے۔

راؤٹر # شو آڈٹ

* ستمبر 14 18: 37: 31.535:٪ آڈٹ-1-رن_ویشن: ہیش:

24D98B13B87D106E7E6A7E5D1B3CE0AD صارف:

* ستمبر 14 18: 37: 31.583:٪ آڈٹ-1-رن_کونفیگ: ہیش:

4AC2D776AA6FCA8FD7653CEB8969B695 صارف:

* ستمبر 14 18: 37: 31.595:٪ آڈٹ-1-STARTUP_CONFIG: ہیش:

95DD497B1BB61AB33A629124CBFEC0FC صارف:

* ستمبر 14 18: 37: 32.107:٪ آڈٹ 1-فائل سسٹم: ہیش:

330E7111F2B526F0B850C24ED5774EDE صارف:

* ستمبر 14 18: 37: 32.107:٪ آڈٹ 1-ہارڈورE_CONFIG: ہیش:

32F66463DDA802CC9171AF6386663D20 صارف:


اگر آپ ٹائم ڈاک ٹکٹوں کی پیروی کرتے ہیں تو ، ان تمام اندراجات کا وقت وقفہ ایک سیکنڈ سے بھی کم تھا۔ میں اس کو ایک دن کے لئے بھی باہر نہیں رکھنا چاہتا ہوں ، دو سال چھوڑ دو!

دیکھنا کچھ ہے

اگر آپ نوکری کے اشتہارات چیک کرتے ہیں تو ، ڈیٹا کے بڑے ماہرین کی اشد ضرورت ہوتی ہے۔ میں نے روبن سے اس بارے میں پوچھا۔ انہوں نے اس بات پر اتفاق کیا ، اس کا ذکر کرتے ہوئے طلباء ان کے امکانات سے پرجوش ہیں۔ تب میں نے محسوس کیا کہ بڑے اعداد و شمار کے پلیٹ فارم ، خاص طور پر اوپن سورس سمجھے جانے والے ، ایک ٹائم لائن کی پیروی کر رہے ہیں جس طرح لینکس مرکزی دھارے میں آیا۔

یونیورسٹیاں خاص طور پر ہڈوپ کے بڑے اعداد و شمار کے پلیٹ فارم کے اوپن سورس ورژنز کو گلے لگاتی ہیں ، کیونکہ وہ مفت ہیں ، اور طلباء سورس کوڈ میں ہیرا پھیری کرسکتے ہیں۔ لہذا فارغ التحصیل جو نوکری کے تمام مواقع کو پُر کرتے ہیں ، اوپن سورس پلیٹ فارم کے ساتھ کام کرنے کو ترجیح دیتے ہیں ، کیونکہ یہی وہی بہتر جانتا ہے۔ دیکھنا دلچسپ ہوگا۔