La importancia de la comprensión del usuario en las diferentes unidades de información, es esencial para ofrecer servicios bibliotecarios de calidad. Es por demás mencionar que el eje de toda actividad bibliotecaria es el usuario, por ello, la trascendencia de conocerlo a fondo.
La minería de datos es entendida también como el descubrimiento de conocimiento a partir de datos, en otras palabras, es la exploración y análisis de grandes volúmenes de datos almacenados en las bases de datos existentes de una institución, una organización, o en repositorios, tales como archivos de datos y almacenes de datos, con la finalidad de descubrir correlaciones significativas, nuevos patrones y tendencias. El proceso utiliza técnicas estadísticas y las tecnologías de reconocimiento de patrones para extraer la información. Es esencialmente un mecanismo para la identificación de datos (Data mining, 2003, p. 122).
En cuanto a las fuentes especializadas en ciencias computacionales, consideran a la minería de datos como la extracción automatizada de los patrones que representan el conocimiento implícitamente almacenado o para su captura en grandes conjuntos de datos, almacenes de datos, la web y otros repositorios de información masivos (Ghoting, 2011, p. 518).
Ante la gran cantidad de información que manejan las instituciones o cualquier tipo de organización ligada esencialmente a la prestación de servicios o diseño de productos, surge la necesidad de analizar esa gran cantidad de datos para su utilización y beneficio. En este sentido, la minería de datos, juega un papel de gran trascendencia, pues permite (Bissantz y Hagedorn, 2009, p. 118):
- Identificar los tipos de patrones,
- Utilizarlos para derivar reglas,
- Encontrar grupos entre los conjuntos de datos,
- Dar a estos grupos atributos descriptivos,
- Encontrar ejemplos representativos,
- Construir funciones aplicablesa variables numéricas
Su aplicación práctica, fundamentalmente en las ciencias computacionales, ha dado pauta para su utilización en otros campos del conocimiento, como por ejemplo en las ciencias de la información y en sus diferentes subcampos, como podrían ser la recuperación de información y la bibliometría.
Su aplicabilidad a las bibliotecas puede hacerse desde muchas perspectivas, desde el análisis del comportamiento en la búsqueda de información de los usuarios hasta la identificación de los índices de circulación de las colecciones. En realidad, existe una expresión para representar las técnicas de la minería de datos utilizadas en las bibliotecas: bibliominería.
La bibliominería es un término que utilizó por primera vez Nicholson y Staton (2003), para explicar el uso de la minería de datos en el análisis de los registros de datos en las bibliotecas. La palabra bibliominería deriva de los términos bibliometría y minería de datos, ya que el objetivo es tomar ventaja de las redes sociales que dan poder, tanto a la bibliometría como a la minería de datos basada en el usuario, a través de un almacén de datos único (Nicholson, 2006, p. 786).
En palabras de Nicholson (2003, p. 146) “la bibliominería es la aplicación de herramientas estadísticas y de reconocimiento de patrones a una gran cantidad de datos relacionados con los sistemas bibliotecarios, con la finalidad de ayudar en la toma de decisiones o para justificar los servicios.”
Nicholson, S. (2003, p. 146), señala que el proceso de bibliominería consta de los siguientes elementos:
- Determinación de las áreas de interés.
- Identificación de las fuentes de datos internas y externas.
- Recolección, limpieza, y ocultamiento de los datos en un almacén de datos.
- Selección de las herramientas adecuadas para el análisis.
- Descubrimiento de patrones a través de la minería de datos y creación de informes con las herramientas tradicionales de análisis.
- Análisis y aplicación de los resultados.
La bibliominería, puede ser aplicada en varias áreas de las bibliotecas, entre las cuales se encuentran:
- Administración y la toma de decisiones.
- Adquisiciones y el desarrollo de colecciones.
- Análisis en redes sociales.
- Bibliometría.
- Creación de bibliotecas digitales.
- Estudios de usuarios.
- Evaluación de los servicios.
- Recuperación de información y el almacenamiento de datos.
- Servicios de referencia.
Actualmente el usuario de los servicios bibliotecarios y de información se ha vuelto más complejo, extenso y heterogéneo, y por ende, sus necesidades de información también. Esto ha llevado a cuestionarse constantemente sobre si los servicios que ofrecen las unidades de información son suficientes para satisfacer las demandas. Se puede afirmar que el estudio de usuarios y la evaluación bibliotecaria se han vuelto cada vez más importantes.
Y a pesar que desde siempre ha existido una preocupación por parte de los bibliotecarios sobre el conocimiento de cómo están conformados sus usuarios y qué requerimientos manifiestan o podrían presentar, hoy su comportamiento en la búsqueda de información es más diverso, pues tiene acceso a infinidad de recursos electrónicos, bases de datos en texto completo, consulta de catálogos remotos y también a las fuentes de información tradicionales.
Bajo este contexto, la bibliominería o las técnicas de la minería de datos aplicadas a las bibliotecas, pueden ofrecer una gran ayuda el momento de estudiar a nuestros usuarios, por ejemplo, se puede transformar los datos recolectados en las encuestas de servicio, que parecieran no tener ninguna correlación, y transformarlos en información utilizable para la toma de decisiones sobre mantener, rediseñar u ofrecer un nuevo servicio.
El documento presentado por Zhu y Zhang (2011) en la 6th International Conference on Computer Science and Education, manifiesta precisamente la utilidad de la minería de datos para conocer el comportamiento de los usuarios, pues recalca que permite al bibliotecario conocer las diferentes necesidades de los usuarios sobre la utilización de los recursos de información de la biblioteca, ya que proporciona índices de referencia científica para un posible desarrollo o reforma en la biblioteca, suministra además, datos suficientes y creíbles para el seguimiento y mejoramiento del servicio.
Los beneficios de la bibliominería para las bibliotecas invariablemente estarán enfocados a conocer mejor al usuario, y con ello, mejorar los servicios bibliotecarios. Pal (2011, p. 12) señala que la bibliominería revela siempre un patrón de actividad dentro de la biblioteca, pero además, estos patrones pueden tener beneficios potenciales en tres diferentes niveles:
- Para los usuarios a través de la mejora de los servicios bibliotecarios.
- Para la gestión bibliotecaria a través de proveer información para una mejor toma de decisiones.
- Para la institución a la cual sirve la biblioteca a través de informes de los patrones relevantes sobre el comportamiento de los usuarios.
Hay que tener presenta la delicadeza de manejar información personal del usuario. Esto es uno de los elementos a los cuales hay que prestar mayor atención, pues no por tratar de resolver problemas específicos en las bibliotecas con ayuda de la minería de datos, estemos dejando a un lado la privacidad de la información. Nicholson (2003, p. 149) propone dos soluciones con el fin de proteger adecuadamente la privacidad del usuario. La primera es que sólo se debe conservar la información sobre el elemento de acceso y el tiempo de acceso, y borrar toda la demás información sobre el usuario. La segunda opción es crear un sustituto demográfico, el cual es un conjunto de valores de los campos predeterminados, seleccionados para representar un usuario en el almacén de datos, por lo que este conjunto de variables sustituirá a la información personal del usuario en el almacén de datos.
La utilización de la bibliominería representa una de tantas soluciones para conocer a nuestros usuarios, quienes son a final de cuentas, el eje motor de toda actividad bibliotecaria. Nuestra labor es y siempre será, ofrecer servicios bibliotecarios de calidad y acordes a las necesidades de las personas.
Referencias
- Bissantz, N. & Hagedorn, J. (2009). Data mining. Business and Information Systems Engineering, 51(1), 118 – 122.
- Data mining (2003). En Feather, J. & Sturges, P. (eds.). International Encyclopedia of Information and Library Science. 2a ed. London: Routledge.
- Ghoting, A. (2011). Data mining. En Padua, D. (ed.). Encyclopedia of Parallel Computing (518 – 523). New York: Springer.
- Nicholson, S. & Stanton, J. (2003). Gaining strategic advantage through bibliomining: data mining for management decisions in corporate, special, digital, and traditional libraries. En Nemati, H. &Barko, C. (eds.). Organizational data mining: Leveraging enterprise data resources for optimal performance (pp. 247 – 262). Hershey, PA: Idea Group Publishing.
- Nicholson, S. (2003). The bibliomining process: data warehousing and data mining for library decision making. Information Technology and Libraries, 22(4), 146 – 151.
- Nicholson, S. (2006). The basis for bibliomining: frameworks for bringing together usage-based data mining and bibliometrics through data warehousing in digital library services. Information Processing & Management, 42(3), 785 – 804.
- Pal, J. K. (2011). Usefulness and applications of data mining in extracting information from different perspectives. Annals of Library and Information Studies, 58(1), 7 – 16.
- Zhu, T. & Zhang, L. (2011). Application of data mining in the analysis of needs of university library users. En ICCSE 2011 – 6th International Conference on Computer Science and Education, Final Program and Proceedings, art. no. 6028662, (pp. 391 – 394).
Samuel Castro Ponce. Lic. en Bibliotecología por la Facultad de Filosofía y Letras de la UNAM. Estoy cursando la Maestría en Bibliotecología y Estudios de la Información en la misma institución. He trabajado para el sector público y privado como catalogador, referencista, bibliotecario de atención a usuarios y de adquisiciones. Actualmente laboro en una biblioteca especializada. Mis intereses son diversos, pero me oriento más a la búsqueda y recuperación de información, el desarrollo de colecciones y por el desarrollo de una bibliotecología progresista.