L'expression « Big Data » est apparue en octobre 1997 aux États-Unis dans un article de la NASA, sur les défis technologiques à relever pour visualiser les « grands ensembles de données ». La naissance du Big Data est liée aux progrès des systèmes de stockage et des outils d'analyse de l'information numérisée depuis la fin des années 1990.
En 2001, Gartner en donne une définition, basée sur la règle dite « des 3 V » (volume, variété, vélocité) : il s'agit d'un volume considérable de données à traiter, d'une grande variété (brutes, non structurées ou semi-structurées) et devant atteindre un certain niveau de vélocité, c'est-à-dire de fréquence de création, collecte, traitement et partage.
Grâce aux géants du web, notamment à Google, le marché mondial du Big Data n'a cessé de croître, pour atteindre, en 2020, un chiffre d'affaires annuel estimé à 210 milliards de dollars et une génération de données estimée à 43 trillions de gigabytes, soit 300 fois plus qu'en 2002.