Cada vez más frecuentemente escuchamos hablar de la ciencia de datos, o «data science». Esta disciplina consiste esencialmente en «transformar datos desordenados y sin procesar en conocimiento accionable que pueda ser usado por tomadores de decisión» (Stanton, 2012). Los científicos de datos «hacen descubrimientos mientras navegan en los datos (…) identifican fuentes ricas de datos, las juntan con otras fuentes, potencialmente incompletas, y limpian el resultado (…) En un entorno competitivo donde los desafíos van cambiando y los datos nunca dejan de fluir, los científicos de datos ayudan a los tomadores de decisiones a pasar de un análisis ad hoc a una conversación continua con datos.»(Davenport y Patil, 2012).
Esta nueva disciplina se generalizó especialmente entre 2011 y 2012 cuando explotó la demanda de científicos de datos y se comenzó a prever una falta de científicos de datos en el futuro. En 2011, la consultora McKinsey anticipó que habría una «escasez del talento necesario para que las organizaciones saquen provecho de Big Data» y que «para el 2018 en Estados Unidos solamente se podría enfrentar una escasez de 140.000 a 190.000 personas con habilidades analíticas profundas, así como 1.5 millones de gestores y analistas con el know-how de cómo usar el análisis de big data para tomar decisiones efectivas» (McKinsey, 2011).
Cada vez hay más cursos de posgrado específicos sobre estos temas, para mencionar solo algunos:
- Master of Information and Data Science (University of California-Berkley)
- Máster Universitario Oficial en Ciencia de Datos e Ingeniería de Computadores (Universidad de Granada)
- Máster Universitario en Ciencia de Datos (Universidad de Valencia)
- Máster Universitario en Métodos Analíticos para Datos Masivos: Big Data (Universidad Carlos III de Madrid)
- Maestría en Ciencia de Datos (Instituto Tecnológico Autónomo de México)
- Certificado en Big Data (San José State University)
Sin embargo, la ciencia de datos aún se encuentra en desarrollo y muchos afirman que no es necesario tener una carrera universitaria para ser científico de datos (Levine, 2015), sino que es una disciplina que podría estudiarse en forma autodidacta e incluso en el mismo puesto de trabajo (Pensig, 2015).
Es interesante ver también el debate que se genera entre aquellos que dicen que la ciencia de datos está destinada a perecer, que ya ha pasado de moda, o que nuevas disciplinas han venido a reemplazarla (Matsumura, 2014), pero la gran cantidad de programas universitarios y la alta demanda laboral existente nos demuestran que muy probablemente esto recién empieza y, aunque seguramente con algunos cambios, seguirá siendo una salida laboral muy promisoria.
6 cursos o webinars en línea sobre la ciencia de datos
Teniendo en cuenta que no necesariamente tienes que estudiar una carrera universitaria para comenzar a incursionar en los aspectos esenciales de la ciencia de datos, en YouTube puedes encontrar una gran cantidad de videos en inglés y en español sobre distintos aspectos de la ciencia de datos para darte un panorama general de la disciplina.
En este blog post, quisiera especialmente recomendarte algunos cursos online y webinars que puedes explorar para comenzar a adquirir nuevas habilidades y herramientas para el análisis de datos:
WEBINAR: “Big Data: Nuevos roles y oportunidades para nuevos bibliotecarios” (inglés)
Co-organizado por el Grupo de Interés Especial de Nuevos Profesionales de IFLA (NPSIG), la Sección sobre el Desarrollo Profesional Continuo y la Formación en el Lugar de Trabajo de IFLA (CPDWL), y la American Library Association (ALA) el 15 de junio de 2016.
Se habla constantemente sobre la ciencia de datos, la gestión de datos, el análisis de datos, la visualización de datos… ¿Cómo están los bibliotecarios tomando ventaja de sus habilidades y aprendiendo otras nuevas para este nuevo reto? ¿Cómo los nuevos bibliotecarios se están convirtiendo en bibliotecarios de datos, o incluso en científicos de datos?, lo que Davenport y Patil (2012) han llamado: «El empleo más atractivo del siglo 21»? ¿Cuál es la ventaja de la nueva generación de los bibliotecarios en el mundo del big data?
Las presentaciones de los expositores y la grabación están disponibles en línea:
- Introducción al webinar por el NPSIG
- “Clothes don’t make people”: New opportunities for the new librarians por Glòria Pérez-Salmerón
- Big Data: definition, limitations and examples from everyday life por Dr. Martin Hilbert
- Data Visualizations Meet Libraries: New Opportunities por Dr. Michelle Chen
- The Library (Big) Data scientist por Wouter Klapwijk
Definitivamente ya debes haber escuchado acerca de la ciencia de datos y big data. En esta clase de una semana, se ofrece un curso intensivo sobre lo que significan estos términos y cómo juegan un rol exitoso en las organizaciones. Esta clase es para cualquiera que quiera aprender de qué se trata la ciencia de datos, incluyendo aquellas personas que eventualmente deberán gestionar a científicos de datos. El objetivo es poner al día rápidamente en los aspectos principales de la ciencia de datos. El curso se ha diseñado para ser lo más conveniente posible, sin sacrificar los puntos esenciales.
MOOC: «La caja de herramientas del científico de datos» (inglés), en Coursera.
Este curso ofrece una introducción a las ideas y herramientas principales en la «caja de herramientas» del científico de datos. Se ofrece un panorama general de los datos, las preguntas y las herramientas con las cuales los científicos de datos trabajan. El curso incluye dos componentes principales. El primero es una introducción conceptual a las ideas que hay detrás de convertir datos en conocimiento. El segundo es una introducción práctica a las herramientas que se usan en el Programa de Ciencia de Datos como el control de versiones, Markdown, Git, GitHub, R, y RStudio.
MOOC: «Datología: La toma de decisiones basada en datos» (español) en edX.
Este curso ayuda a tomar el control sobre los datos, a darles sentido y, de esta manera, usarlos para mejorar las decisiones. En este curso se aprende: la importancia de la relación entre el análisis e interpretación de datos y la toma de decisiones, cómo identificar tu problema de estudio y las variables para su análisis, qué metodologías de análisis de datos son más adecuadas para ciertos tipos de estudios, qué tipos de visualización existen y cómo interpretarlas y la aplicación de los datos en la planificación estratégica y la evaluación de políticas.
MOOC: «Introducción a la ciencia de datos» (inglés), en Udacity.
Este curso estudia los temas fundamentales de la ciencia de datos: manipulación de datos, análisis de datos con estadísticas y machine learning, comunicación de datos con visualización de información, y datos a escala-trabajar con grandes volúmenes de datos. La clase es amplia y presenta los temas brevemente en lugar de centrarse en un solo tema en profundidad. Esto da la oportunidad de probar y aplicar las técnicas básicas de la ciencia de datos.
Si conoces otros cursos o recursos de interés, ¡no dejes de recomendarlos más abajo!
Para saber más:
- Augur, Hannah (2016). Beginner’s guide to the history of data science. Dataconomy.
- Bertolini, Maria Violeta (2015). Bibliotecario de datos o #DataLibrarian y el mundo del Big Data. Infotecarios.
- Bertolini, Maria Violeta (2016). #Open Data Day: 5 herramientas para hacer análisis y crear visualizaciones con #DatosAbiertos. Infotecarios.
- Davenport, Thomas H. y Patil, D.J. (2012). Data Scientist: The Sexiest Job of the 21st Century. Harvard Business Review, October 2012.
- Levine, Daniel (2015). 5 Things You Should Know Before Getting a Degree in Data Science. RJMetrics.
- Matsumura, Miko (2014). Data Science is Dead. Insights Dice.
- Manyika, James; Chui, Michael; Brown,Brad; Bughin, Jacques; Dobbs, Richard; Roxburgh, Charles; Hung Byers, Angela (2011). Big data: The next frontier for innovation, competition, and productivity. McKinsey Institute.
- Nevins, Todd (2015). Hard and Soft Skills of a Data Scientist. icrunchdata News.
- Patil, D.J. (2015). Data Science: Where are We Going?. O’Reilly (Video de YouTube)
- Pensig, Charles (2015). Why I Left My Data Science Master’s Program. Linkedin Pulse.
- Stanton, Jeffrey (2012). Data Science: What’s in it for the New Librarian?. Information Space.
- 23 Great Schools with Master’s Programs in Data Science. Master’s in Data Science.
Imagen: CC0 Public Domain by GraphicMama-team.