تا این اواخر گردآوری، تحلیل و ذخیرهسازی دادهها کاری زمانبر و پرهزینه بود. برای همین، برای پاسخ دادن به پرسشهایمان، تا جایی که امکان داشت، دادههای کمی گردآوری میکردیم. درواقع، در عصر خُردهدادهها، نمادها و فرایندها و نیز نحوۀ حصول نتیجه از دل دادهها همگی بر این پیشفرض بنا شده بود که دادهها کمیاباند. بنابراین، برای هر کاری، از کنترل کیفیت گرفته تا نظرسنجیِ پیش از رأیگیری، نمونههایی از دادهها را به کار میگرفتیم، نه همۀ آنها را. بدینترتیب، بهندرت میتوانستیم نگاه عمیقتری به اموری داشته باشیم که جالب توجه اما پیچیده به نظر میرسیدند.، به این دلیل ساده که دادۀ کافی در اختیار نداشتیم.
امروزه، بسیاری از موانع موجود پیشِ پای گردآوری، تحلیل و ذخیرۀ مقادیر عظیم داده بهشدت کاهش یافته است. این تحولْ گردآوری تمامی دادهها و درک پیچیدگی جهانمان را بسیار سادهتر کرده است و دیگر نیازی نیست تنها با نمونۀ کوچکی از واقعیت کنار بیاییم. در موارد متعدد، میتوانیم دادههایی بیشتر، اگرچه آشفتهتر، گرد آوریم، بهجای آنکه به مقادیری محدود از دادهها بسنده کنیم. درنتیجه، میتوانیم با در دست داشتن حجمی بیسابقه از جزئیات به جهان بنگریم.
اما تحلیلهای مبتنی بر کلانداده پرسشهای جدیدی نیز پدید آوردهاند. در بخش بزرگی از این تحلیلها نمیتوانیم از تحلیلِ معلولها به علت آنها پی ببریم. تحلیل دادهها معمولاً نمیتواند به ما بگوید «چرا»، بلکه تنها میگوید «چگونه». اما این تحلیلها بهشکلی شگفتانگیز در اغلب موارد بهاندازۀ کافی خوباند و میتوانند تصمیمگیریهای ما را بهبود ببخشند.