ڈسک ڈسٹری بیوٹڈ کمپیوٹنگ کے لیے ایک اوپن سورس پائتھون لائبریری ہے جو صارفین کو بہتر کارکردگی اور اسکیل ایبلٹی کے لیے اپنی کمپیوٹیشن کی پیمائش کرنے کی اجازت دیتی ہے۔ یہ سب سے پہلے اگست 2016 میں جاری کیا گیا تھا اور کمیونٹی کے اندر متعدد ڈویلپرز کے ذریعہ اس کی دیکھ بھال کی جاتی ہے۔
Dask کو موجودہ Python ٹولز جیسے NumPy، pandas، اور scikit-learn کے ساتھ کام کرنے کے لیے ڈیزائن کیا گیا ہے، جو اسے ڈیٹا سائنسدانوں، انجینئروں اور محققین کے لیے ایک ورسٹائل ٹول بناتا ہے۔ یہ ڈیٹا کے تجزیہ، مشین لرننگ، گہری سیکھنے، اور گراف کے تجزیات کے لیے استعمال ہوتا ہے۔
Dask دو اجزاء پر مشتمل ہے: ایک شیڈولر اور کارکن۔ شیڈولر ایک کام کو بہت سے کارکنوں کے درمیان تقسیم کرنے اور اس عمل میں ہر کارکن کی پیشرفت کی نگرانی کے لیے ذمہ دار ہے۔ جب ورکرز مکمل ہو جاتے ہیں، تو شیڈیولر ایک آؤٹ پٹ فراہم کرتا ہے جسے اگلے کام تک پہنچایا جا سکتا ہے۔
Dask کو مختلف سیاق و سباق میں استعمال کیا جا سکتا ہے، جیسے کہ صرف چند کارکنوں کے ساتھ لیپ ٹاپ پر، یا ڈیٹا سینٹر میں کمپیوٹرز کے جھرمٹ میں۔ متعدد مشینوں پر ایک ہی کمپیوٹیشن کو متوازی طور پر چلا کر، دستیاب وسائل کو موثر طریقے سے استعمال کرنے کے لیے اسے بہتر بنایا گیا ہے۔
Dask کے پاس ڈیٹا کو سٹریم کرنے کے لیے لائبریریاں ہیں اور دیگر ڈیٹا انیلیسیس لائبریریوں، جیسے Xarray، Scikit-Learn، اور TensorFlow کے لیے توسیعی تعاون ہے۔ اس میں تقسیم شدہ فائل سسٹم جیسے HDFS اور Amazon S3 پر کمپیوٹیشن چلانے کی صلاحیت بھی ہے۔
مجموعی طور پر، ڈسک ڈسٹری بیوٹڈ کمپیوٹنگ کے لیے ایک طاقتور لائبریری ہے اور اس کا استعمال مختلف قسم کے ایپلیکیشن ایریاز میں ہوتا ہے۔ یہ انتہائی قابل توسیع ہے اور کاموں کو موثر طریقے سے چلانے کے لیے لچک فراہم کرتا ہے یہاں تک کہ جب مشینیں کلسٹر سے شامل یا ہٹا دی جائیں۔ یہ ڈیٹا سائنسدانوں، انجینئروں اور محققین کے لیے ایک بہترین ٹول ہے جنہیں بڑے پیمانے پر ڈیٹا سیٹس کے ساتھ کام کرنے کی ضرورت ہے۔