Dask ialah perpustakaan Python sumber terbuka untuk pengkomputeran teragih yang membolehkan pengguna menskalakan pengiraan mereka untuk prestasi dan kebolehskalaan yang lebih baik. Ia pertama kali dikeluarkan pada Ogos 2016 dan diselenggara oleh banyak pembangun dalam komuniti.
Dask direka bentuk untuk berfungsi dengan alat Python sedia ada seperti NumPy, panda, dan scikit-learn, menjadikannya alat serba boleh untuk saintis data, jurutera dan penyelidik. Ia digunakan untuk analisis data, pembelajaran mesin, pembelajaran mendalam dan analisis graf.
Dask terdiri daripada dua komponen: penjadual dan pekerja. Penjadual bertanggungjawab untuk membahagikan tugas di kalangan ramai pekerja dan memantau kemajuan setiap pekerja dalam proses tersebut. Apabila pekerja selesai, penjadual menyediakan output yang boleh dihantar ke tugas seterusnya.
Dask boleh digunakan dalam pelbagai konteks, seperti pada komputer riba dengan hanya beberapa pekerja, atau dalam kelompok komputer dalam pusat data. Ia dioptimumkan untuk menggunakan sumber yang tersedia dengan cekap, dengan menjalankan pengiraan yang sama secara selari pada berbilang mesin.
Dask mempunyai perpustakaan untuk penstriman data dan sokongan lanjutan untuk perpustakaan analisis data lain, seperti Xarray, Scikit-Learn dan TensorFlow. Ia juga mempunyai keupayaan untuk menjalankan pengiraan pada sistem fail yang diedarkan seperti HDFS dan Amazon S3.
Secara keseluruhan, Dask ialah perpustakaan yang berkuasa untuk pengkomputeran teragih dan digunakan dalam pelbagai bidang aplikasi. Ia sangat berskala dan memberikan fleksibiliti untuk menjalankan tugas dengan cekap walaupun mesin ditambah atau dialih keluar daripada kluster. Ia adalah alat yang hebat untuk saintis data, jurutera dan penyelidik yang perlu bekerja dengan set data berskala besar.