El uso generalizado de ordenadores y tecnologías digitales en Humanidades ha conllevado una explosión tanto en el volumen de datos como en la variedad de estos, siendo su producción más rápida que su gestión y tratamiento (Gattiglia, 2015: 1). Así, podemos decir que estamos en la era del big data (Levi, 2013), donde los investigadores de todas las disciplinas reconocen “the inherent research potential of datasets that dwarf in size and complexity those traditionally employed in their respective fields” (Wesson y Cottier, 2014, 1).
Restringido en sus inicios a ciertas disciplinas como la Economía, la Publicidad o la Biología, donde el volumen de datos y la necesidad de crear patrones hacían necesaria una evolución en la forma de tratar y gestionar los datos, el big data entró de lleno en las disciplinas humanísticas hace poco más de una década (Gattiglia, 2015; Halevi y Moed, 2012; Turcotte, 2019). El big data se caracteriza por lo que se denomina en la bibliografía especializada las “tres V”: Volumen, Velocidad y Variedad (“Las Tres V Del Big Data: Todo Un Reto Por Su Volumen, Variedad y Velocidad” 2020). Algunos autores han ampliado esas propiedades del big data a cinco: Volumen, Velocidad, Valor, Variedad y Veracidad (Kalbandi y Anuradha, 2015: 320–21). Y algunos aumentan las tradicionales “tres V” hasta siete: Volumen, Velocidad, Variedad, Veracidad, Visibilidad, Visualización y Valor (“Las 7 V Del Big Data: Características Más Importantes” 2019).
En Arqueología, la introducción en los años setenta de la New Archaeology (Hodder y Orton, 1976) conllevó una revolución en los análisis arqueológicos, fomentando la inclusión en las investigaciones de grandes cantidades de datos y tratarlos de forma cuantitativa siguiendo principios matemáticos y estadísticos que hiciesen de la Arqueología una ciencia “más pura”. Además, este cambio de paradigma conllevó la realización de un mayor número de intervenciones arqueológicas y la consideración en los estudios de todo tipo de restos arqueológicos. La prospección arqueológica empezó a cobrar fuerza y, con ello, la cantidad de datos comenzó a aumentar exponencialmente.
Una de las principales consecuencias fue el incremento del volumen de datos; la segunda, la variedad de los datos pues estos procedían ya no solo de excavaciones, sino de prospecciones, de catas, sondeos, etc. y las técnicas empleadas eran cada vez más variadas. Como ya hemos señalado, tanto el volumen de los datos como su variedad son dos de las propiedades de los denominados big data, siendo su gestión esencial en cualquier investigación que pretenda analizar los datos arqueológicos de manera global. Así, a día de hoy, la generalización del denominado big data en Arqueología, un conjunto de datos “so huge and complex that is impossible for traditional systems and traditional datawarehousing to process and work on them” (Kalbandi y Anuradha, 2015: 320), es una realidad. Sin embargo, conviene pararse a reflexionar acerca del uso que está haciendo del big data y de cómo este se emplea en la investigación arqueológica.
En otro post en las próximas semanas, profundizaremos en el uso que está haciendo del big data en los proyectos arqueológicos y si realmente podemos hablar de “big data” en arqueología o no.
¡Esperamos que os haya gustado el post y os deseamos un buen fin de semana!
Bibliografía
Halevi, Gali, Moed, Henk. F. (2012). “The Evolution of Big Data as Research and Scientific Topic: Overview of the Literature.” Research Trends 30.
Hodder, Ian, Orton, Clive. (1976). Spatial Analysis in Archaeology. Cambrigde: Cambridge University Press.
Kalbandi, Ishwarappa, Anuradha, J. (2015). “A Brief Introduction on Big Data 5Vs Characteristics and Hadoop Technology.” Procedia Computer Science 48: 319–24.
“Las 7 V Del Big Data: Características Más Importantes.” (2019).
“Las Tres V Del Big Data: Todo Un Reto Por Su Volumen, Variedad y Velocidad.” (2020).
Levi, Amalia S. (2013). “Humanities ‘Big Data’: Myths, Challenges, and Lessons.” Proceedings – 2013 IEEE International Conference on Big Data, Big Data 2013, 33–36. https://doi.org/10.1109/BIGDATA.2013.6691667.