martes, 9 de agosto de 2016

Aprendiz habla sobre... Big Data

Antes que nada, quiero explicar la nueva dinámica que tienen las entradas de la Aprendiz de la Información. Con el fin de promover publicaciones y lograr un contenido mucho más completo, al hablar de una corporación, página web o de un libro, en el título del mismo se incorporan los enlaces. Esto se debe a prestar a los lectores la facilidad de consultar las fuentes de las que proviene la información que se utiliza en dicha entrada y también proveer una vinculación en caso de que deseen adquirir dicho material.
Sin más, los dejo con la entrada: "Aprendiz habla sobre...Big Data."
La información es la gasolina del siglo XXI, y la analítica de datos el motor de combustión”. Peter Sondergaard.
Todos los días producimos información. Esos compañeros de clase que vemos pegados al celular; los usuarios del metro que visitan Facebook y Twitter mientras realizan el recorrido, entre otros. Cada día y a cada minuto, miles y miles de personas desde computadoras o dispositivos que producen y envían grandes cantidades de información.
Muchos de estos paquetes de datos, pueden resultar irrelevantes para un individuo. Sin embargo, existen empresas, instituciones y grupos que recolectan esta gran cantidad de información, la analizan y sintetizan de tal forma que el producto revela factores importantes que permiten una mejor toma de decisiones para estas organizaciones. A esta gran cantidad de información se le conoce como Big Data.
Ahora, existen distintos mitos alrededor de este término y el más común es que son grupos de datos bastante voluminosos que no tienen un orden o estructura. Que son datos que navegan en la web de forma aleatoria y que no poseen un fin, hasta que una empresa o persona los analiza. Sin embargo, en esta entrada vamos a desglosar y explicar de forma concreta lo siguiente: ¿Qué es Big Data?, ¿cuáles son sus aplicaciones y uso?, y por último ¿cómo puede ayudar a las profesiones de la información y cómo éstas pueden contribuir al proceso de Big Data?
Una vez explicados los conceptos, ¿qué sigue? ¿Cómo podemos proveer nuestra mayor contribución como profesionales de la información con o gracias a Big Data? El siguiente paso se encuentra en la entrada: "De la Información al Conocimiento: Presentando a Big Data", que se va a desarrollar como ésta puede apoyarnos en nuestra tarea de llegar a lo que se conoce como una Sociedad del Conocimiento.
  Y así, comenzamos.

¿Qué es Big Data?

En su libro "Big Data: Análisis de grandes volúmenes de datos en organizaciones.", Joyanes Aguilar explica que aunque no existe unanimidad, sí hay un consenso en la fuerza disruptiva que suponen los grandes volúmenes de datos y la necesidad de su captura, almacenamiento y análisis. Aunque presentan varias definiciones que recogen varias características de Big Data, de las cuales algunas le dan prioridad al volumen, otras a la velocidad y una más a la variabilidad de las fuentes, para esta entrada me incliné más por la definición de la consultora International Data Corporation.
“Big Data es una nueva generación de tecnologías, arquitecturas y estrategias diseñadas para capturar y analizar grandes volúmenes de datos provenientes de múltiples fuentes heterogéneas a una alta velocidad con el objeto de extraer valor económico de ellos.[1]
Destaco mucho el hecho de que Big Data no sólo son los  grandes volúmenes de datos, sino el conjunto de tecnologías, arquitecturas, estrategias y procesos que trabajan estos paquetes de datos y de los cuales se obtiene un valor diferente que permite la creación de algo nuevo. Me viene a la cabeza el siguiente ejemplo: ¿Han visto como la joyería transforma un par de piedras preciosas y después de ciertos procesos metalúrgicos y de tratamiento artesanal obtienes joyas que tienen un nuevo y único valor en el mercado?.
Esos procesos que transformaron las piedras extraídas de la tierra o de las cuevas y ríos, son Big Data y las joyas que se venden en las vitrinas son los productos finales después de un arduo análisis y proceso de dichos paquetes. De esta forma, el primer mito se transforma, y con ello continuamos.
Las herramientas de manipulación de Big Data, nos hablan de tres tipos de datos en los que se dividen:
  • Datos estructurados (campos fijos, con formato. Ej.: hojas de cálculo, archivos, bases de datos relacionales),
  • Datos semiestructurados (sin formato fijo, pero contienen etiquetas que permiten separar elementos dato. Ej: XML y HTML)
  • Datos no estructurados (Sin campos fijos, archivos multimedia, formatos de texto como emails, sms, libros, servicios de mensajería).
¿Qué pasa cuándo integramos todos estos datos que ofrece Big Data con los datos tradicionales que obtenemos a través de las estadísticas (o medios cuantitativos en general). Pues resulta que pueden crear grandes oportunidades de desarrollo de nuevos proyectos y la toma de decisiones.
Otras características de Big Data que  menciona Doug Laney es que se utilizan las “3V” como activos de información y estos activos son: Volumen, Velocidad y Variedad. Ésto requieren formas innovadoras y rentables de procesamiento de la información que permiten su comprensión y la toma de decisiones.

¿Aplicaciones y uso de Big Data?

Esta pregunta resulta interesante. Hemos hablado de lo que es Big Data, pero ¿el hecho de conocer la naturaleza y origen de un concepto nos permite entender su uso? Es aquí donde abordo el mito #2: "Big Data es una innovación del Siglo XXI", lo cual es incorrecto y esto lo explico a continuación.
Para lograr que la Big Data trabaje en pos del crecimiento y desarrollo de distintas áreas se analizan por ejemplo: palabras, localizaciones, elementos de la naturaleza, comportamiento humano, actividad económica, entre otros elementos. En sí, existe la extracción de conocimiento de bases de datos desde el siglo XIX y un claro ejemplo son los el uso de cómputo temprano a escala masivo (un ejemplo de esto son los censos que se realizan desde 1890 en Estados Unidos) hasta la aparición de sistemas paralelos e interconexión de incontables bases de datos (que son sistemas que utilizan empresas como Google, Facebook, Amazon, entre otros).
Es decir, a partir del análisis de elementos tan simples como los que se mencionaron en el párrafo anterior, se produce información que puede tener un efecto positivo en la eficiencia y productividad que han tenido las TIC en los últimos años. Algunos ejemplos que menciona Hilbert que demuestran la aplicación de Big Data en aras del desarrollo van desde el rastreo de palabras para la predicción de acciones o actividad, como el utilizar las localizaciones para obtener información sobre el flujo de tránsito, condiciones de rutas o reportes del clima. Incluso el permitir obtener datos importantes del comportamiento humano y su actividad económica, además de obtener datos de la propia naturaleza.
En sí, las aplicaciones de Big Data son diversas y de acuerdo a los objetivos que uno persiga los resultados de dichos análisis y uso de estas herramientas serán tan útiles como importantes para la toma de decisiones.  Y a continuación, se presentan ejemplos de las  variadas fuentes que utilizadas por Big Data:
o          Redes sociales como Twitter y Facebook
o          Imágenes digitales y videos
o          Información geo-espacial de los teléfonos celulares
o          Información personal recopilada por las distintas agencias de gobierno
o          Sensores de temperatura, viales, eléctricos, etc.
o          Logs de búsquedas en buscadores y bases de datos
Quisiera aquí, realizar una ligera intervención, ya que nuestro siguiente apartado que relaciona a los profesionales de la información con Big Data, toca una temática que considero importante resaltar. ¿Qué pasa con el ámbito educativo?. Acaso el uso de estas bases de datos de las cuales se extrae información sobre el comportamiento humano ¿no nos puede ser útil para los planes de estudio o siquiera para desarrollar nuevos métodos didácticos? ¿qué tal programas de fomento de lectura?. Es aquí donde tomó la frase de Jeff Jaffe, presidente ejecutivo del W3C el cual menciona:
“Lo primero que tienen que hacer los gobiernos es hacer más datos abiertos. El futuro social de la educación está en los datos, en la calidad de los mismos, los datos abiertos (open data), la libertad de los datos, que éstos puedan fluir para el acceso de cualquier persona y que, a su vez, puedan ser aprovechados.”
Es aquí donde Jeff habla del movimiento Open Data que se define como una “filosofía y práctica que requiere que ciertos datos estén disponibles libremente para cualquier persona sin restricciones de copyright, patentes y otros mecanismos de control”. En esta práctica, las grandes cantidades de datos procedentes de diferentes organizaciones estén a disposición de la sociedad y hay que destacar que estos datos se refieren a distintas temáticas, pueden ser médicas, geográficas, meteorológicas o incluso datos de proyectos de investigación investigados con fondos públicos o libros digitalizados de las bibliotecas.

¿Cómo Big Data puede ayudar a las profesiones de la información y cómo éstas pueden contribuir a la misma?

Esta es una pregunta truculenta, porque muchas veces consideramos que al ser tecnología, se requiere más de informáticos, ingenieros y otras profesiones relacionadas al campo tecnológico. Pero en este caso, quiero traer a colación una plática que tuve con un compañero de trabajo, que es ingeniero en sistemas.
Él considera que Big Data se enfoca desde su ramo a tres acciones: Captura, Almacenamiento y Análisis de datos. Pequeño detalle, desde la perspectiva de las profesiones de la información podemos ampliar más estas acciones, puesto que nuestras profesiones nos llevan a tomar en cuenta: Uso, Contexto, Aplicación, Objetivos, Efectividad y Eficacia. En sí, no sólo vamos hacia la parte de la preservación y cuidado  de los datos, sino de su administración, difusión y sobre todo de su uso.
El ejemplo más claro que puedo ofrecer para explicar la relación de las profesiones de la información con Big Data, es la propia Sociedad de la Información en la que algunos países nos encontramos involucrados. Y todo esto es gracias a Martin Hilbert que presenta un argumento en donde considera que Big Data  se entrega como un prospecto de costo-efectivo en la toma de decisiones en el desarrollo crítico de áreas como la salud, el área laboral, productividad económica, seguridad, desastres naturales y administración de recursos. Lo que provee oportunidades para las ciudades en desarrollo.
Este cubo, el propio Hilbert lo denomina como el Cubo de desarrollo TIC. Y es muy importante porque revela de forma simple como llegar de la Sociedad de la Información a la Sociedad de Conocimiento a través de la regulación e incentivos que se propongan y realicen a la hora de trabajar con grandes cantidades de datos y diferentes tecnologías (como Big Data).
CUBE ICT Hilbert En la parte superior, se observa lo que se conoce como la Sociedad de Información, en dónde se involucra la Infraestructura, servicios genéricos de software y las capacidades y habilidades humanas que son las que utilizan y crean dichos servicios e infraestructura, pero como tal no hay una producción de conocimiento, sólo uso de herramientas y producción y masificación de lo que ya existe. Del lado izquierdo, están los recuadros "Regulación" que se reconoce como retroalimentación negativa y los "Incentivos" que son las retroalimentaciones positivas.
Dichos términos se refieren a políticas, normativas, etc., las cuales marcan un contexto social que le da forma a las diferentes circunstancias y estrategias que afectan los análisis de Big Data, así como también el cómo dichos análisis nos afectan a nosotros como sociedad.
Por último, se presenta la cara frontal, que tiene aplicaciones que están enfocadas a mejorar diferentes ámbitos de la sociedad y que al tener un impacto y desarrollo, éstas se ven afectadas ya sea de forma positiva o negativa y producen algo nuevo, distinto, en sí son aplicaciones que nos llevan a una Sociedad de Conocimiento que aprovecha esta información en beneficio de proyectos, programas y sistemas que la sociedad utiliza cada día.
En este punto quiero hablar un poco sobre un referente profesional bibliotecólogico y que trabaja con Big Data. Su nombre es Amy Affelt quien es directora de Database Research Worldwide, en Compass Lexecon, la cual es una consultoría global económica. Es aquí donde Amy, busca, analiza y transforma información y datos en conocimiento viable para Doctores economistas que testifican ser expertos en litigación. Es una frecuente escritora y conferencista sobre Big Data, Internet de las cosas, entre otras temáticas. Y tiene un grado Master en Bibliotecología y Ciencias de la Información por parte de Dominican University.
Ella describe distintas aplicaciones para comprender concretamente con las cuales los bibliotecarios y profesionales de la información aprovechen las oportunidades que ofrecen estas herramientas y tengan su lugar en el mundo del Big Data. Además, cabe destacar que toda nueva variación de nuestras tradicionales habilidades para encontrar, organizar, analizar y hacer accesible la información para la toma de decisiones, lleva a una crisis terminológica que trata de alejarnos de, como dicen los anglófonos, y por lo tanto se les reconoce como:
o          Analista de datos
o          Científico de datos
o          Especialista de datos
o          Gestor de datos
o        Bibliotecario de Datos
En sí, son algunos de los títulos que podemos utilizar para llamar al bibliotecario o profesional de la información que ha decidido incursionar en lo que Davenport menciona como el científico de datos que es como un “profesional con la formación y la curiosidad para hacer descubrimientos en el mundo del Big Data”. Y aunque hay algunas escuelas de profesiones de la información en Estados Unidos que han comenzado a actualizar su currícula incorporando las competencias específicas necesarias para el análisis de datos como: programación, estadística, técnicas analíticas, visualización de datos, almacenamiento en la nube, privacidad y seguridad de datos, entre otros (por ejemplo, el nuevo Master of Information and Data Science (En línea) de la Universidad de California en Berkeley). Aún no hay programas de estudio serios que trabajen con este tipo de tecnologías. No hablemos del caso de México hasta dentro de otra ocasión.

¿Y ahora, qué sigue?

Reflexionar. En esta entrada quiero destacar tres aspectos que considero importantes:
  • Necesidad de entender como Big Data nos afecta como sociedad y profesionales.

  • Reflexionar sobre la falta de aplicación y uso de estas tecnologías en ámbitos más humanistas y sociales, no sólo en cuestiones económicas o administrativas.

  • La falta de preparación, entendimiento y sobre todo de involucrarse en este mundo Big Data por parte de los profesionales de la información.

En sí todas están relacionadas. Y con esto, quiero traer a colación la conversación con mi compañero ingeniero en sistemas. Cuando hablamos de Big Data, la mayoría lo relaciona con cuestiones económicas, productivas, beneficiosas o costosas... pero de nuevo olvidamos la parte social y humana que conllevan este tipo de herramientas y sobre todo los objetivos que se pueden adquirir en dichos campos. En el caso de mi compañero, sólo veía la parte de almacenamiento, pero nosotros que conocemos que existe un ciclo de información y cómo se desarrolla, sabemos que es sólo una ínfima parte de lo que ésta significa.

¿Es necesario involucrarnos en este mundo de grandes volúmenes de datos?

Considero que sí, y no para olvidar lo que hemos hecho hasta ahora, sino para fomentarlo, mantenerlo, promoverlo y mejorarlo. Lo que hacemos es organizar y administrar información para que se pueda crear nuevo conocimiento. Preservar para conocer. Difundir para utilizar. Informar para crear.

¿Nosotros podemos dar el enfoque social y humanista que necesita Big Data para trabajar en pos del crecimiento?

Sí, porque tenemos el acercamiento a comunidades y usuarios. Tenemos los estudios y las capacidades. Sólo nos hace falta un interés, un empujoncito, siquiera detenerse a pensar el cómo utilizar estas herramientas para preservar y dar a conocer lo que le interesa a mis usuarios o a mí como profesional.
Tan sólo es ponerse a pensar en las posibilidades, trabajar y alcanzar una meta. En sí, es aprovechar recursos e innovar.
Con esto último me despido.
Muchas gracias por leer a esta Aprendiz.
REFERENCIAS
[1] Joyanes Aguilar, L. (2014). Big Data: Análisis de grandes volúmenes de datos en organizaciones. México: AlfaOmega.
[2] Hilbert, Martin (2013). Big Data for Development. From Information to Knowledge Societies. Pág 1.  Disponible en: http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2205145

No hay comentarios:

Publicar un comentario