علوم داده ها در مورد ایجاد نتیجه های مفید از مجموعه داده های متنوع و وسیع از طریق اکتشاف، پیش بینی و استنتاج است. اکتشاف شامل شناسایی الگوها در اطلاعات است. پیش بینی شامل استفاده از اطلاعاتی است که ما می دانیم برای تهیه حدس های آگاهانه درباره ارزش هایی که می خواهیم بدانیم. استنتاج شامل تعیین میزان درجه اطمینان ما می شود: آیا این الگوهایی که یافتیم نیز در مشاهدات جدید ظاهر می شوند؟ پیش بینی های ما دقیق است؟ ابزار اصلی ما برای اکتشاف، تصویربرداری و آمار توصیفی است، برای پیش بینی، یادگیری ماشین و بهینه سازی است و برای استنتاج آزمون ها و مدل های آماری است.
آمار یکی از مولفه های اصلی علوم داده است؛ زیرا آمارها چگونگی نتیجه گیری قوی با اطلاعات ناقص را بررسی می کند. محاسبات جزء مرکزی است زیرا برنامه نویسی به ما امکان می دهد تکنیک های تجزیه و تحلیل را به مجموعه های داده های متنوع و گسترده ای که در برنامه های دنیای واقعی بوجود می آیند، اعمال کنیم: نه تنها اعداد، بلکه متن، تصاویر، فیلم ها و خواندن از حسگر. علم داده ها همه این موارد است، اما بیشتر از مجموع قطعات آن به دلیل برنامه های کاربردی است. از طریق درک یک دامنه خاص، دانشمندان داده یاد می گیرند از سوالات مناسب در مورد داده های خود بپرسند و پاسخ های ارائه شده توسط ابزار استنتاجی و محاسباتی ما را به درستی تفسیر کنند.