Seguramente has visto y escuchado hablar de Big Data por todos lados, pero se usa en tantos contextos diferentes, que se hace bastante difícil saber si estamos usando el término correctamente.
Entonces, ¿de qué hablamos cuando hablamos de Big Data?
Doug Laney, analista de Gartner (2001), una de las compañías líderes mundiales en tecnologías de la información, fue pionero en definir «Big Data» usando «3 V» como «activos de información de gran VOLUMEN, VELOCIDAD y VARIEDAD que requieren formas innovadoras y rentables de procesamiento de la información para permitir su comprensión y la toma de decisiones». Esta definición aún sigue vigente y es utilizada en todos los reportes sobre el tema hasta el día de hoy.
Asimismo, McKinsey Global Institute (2011) se refiere a “Big data» como «conjuntos de datos cuyo tamaño supera la habilidad de un software de base de datos típico para capturarlo, almacenarlo, gestionarlo y analizarlo» e incorpora una «cuarta V» para indicar el VALOR que pueden generar las compañías y los gobiernos al explotar el potencial del Big Data.
Las fuentes del Big Data son tan múltiples como variadas y solo para mencionar algunas:
- Redes sociales como Twitter y Facebook
- Imágenes digitales y videos
- Información geo-espacial de los teléfonos celulares
- Información personal recopilada por las distintas agencias de gobierno
- Sensores de temperatura, viales, eléctricos, etc.
- Logs de búsquedas en buscadores y bases de datos
En todo caso, el Big Data ha llegado para quedarse y los bibliotecarios no podemos dejar pasar esta oportunidad. En su nuevo libro The Accidental Data Scientist (2015), Amy Affelt describe distintas aplicaciones para comprender concretamente de qué se trata el Big Data y específicamente su libro tiene la misión de asegurarse que los bibliotecarios y profesionales de la información aprovechen las oportunidades y tengan su lugar en el mundo del Big Data.
Como siempre, toda nueva variación de nuestras tradicionales habilidades para encontrar, organizar, analizar y hacer accesible la información para la toma de decisiones, lleva a una crisis terminológica que trata de alejarnos de, como dicen los anglófonos, «the L word» (librarian) o «la palabra que empieza con B» (bibliotecario):
- Analista de datos
- Científico de datos
- Curador de datos
- Especialista de datos
- Gestor de datos
- o, Bibliotecario de Datos
Son algunos de los títulos que podemos utilizar para llamar al bibliotecario o profesional de la información que ha decidido incursionar en lo que Davenport (2012) ha dado en llamar «el trabajo más sexy del siglo 21«. Para Davenport, el científico de datos o data scientist es un «profesional con la formación y la curiosidad para hacer descubrimientos en el mundo del Big Data».
¿Suena conocido?
Ya algunas escuelas de Bibliotecología en Estados Unidos han comenzado a actualizar su currícula incorporando las competencias específicas necesarias para el análisis de datos, como: programación, estadística, técnicas analíticas, visualización de datos, almacenamiento en la nube, privacidad y seguridad de datos. Por ejemplo, el nuevo Master of Information and Data Science (En línea) de la Universidad de California en Berkeley (Escuela de Información) es un buen ejemplo de este cambio sustancial en los programas de estudio de los bibliotecarios.
¿Te interesa? ¿Querés conocer más sobre este tema?
Esta línea de tiempo te mostrará de dónde proviene el Big Data: Historia cronológica del Big Data
Y a continuación algunos recursos útiles para comenzar a investigar:
Twitter, Blogs y otros recursos en línea:
- Databrarians: by Data Librarians for Data Librarians
- Data Science Central @DataScienceCtrl
- Data Scientist Training for Librarians
- The Open Source Data Science Masters
- What are the best blogs for data miners and data scientists to read? (Quora)
Bibliografía:
- Affelt, Amy (2015). The Accidental Data Scientist: Big Data Applications and Opportunities for Librarians and Information Professionals. Information Today.
- Davenport, Thomas (2012). Data Scientist: The Sexiest Job of the 21st Century. Harvard Business Review, October 2012.
- Gartner. IT Glossary (Big Data).
- Laney, Doug (2001). 3D Data Management: Controlling Data Volume, Velocity, and Variety.
- McKinsey Global Institute (2011). Big data: The next frontier for innovation, competition, and productivity.
- McKinsey Global Institute (2013). Open data: Unlocking innovation and performance with liquid information.
- Waller, Nikki (2014). Get Familiar With Big Data Now—or Face ‘Permanent Pink Slip’: Demand Rises for Analytics Professionals, Data Scientists. The Wall Street Journal, 9 April 2014.
Imagen: By Camelia.boban (Own work) [CC BY-SA 3.0], via Wikimedia Commons