Big Data y Data Science: ¿Cuál es la diferencia?

Algunas de sus principales aplicaciones prácticas se enmarcan en la realización de clúster de documentos, recomendaciones y organización de contenidos [32]. El machine learning o aprendizaje máquina es el trasfondo principal de Mahout y corresponde a un subcampo de la inteligencia artificial que se centra en el mejoramiento de procesamientos computacionales a partir del análisis de experiencias previas. Grant Ingersoll en [33] presenta una descripción de algunos de los más recientes algoritmos implementados en Mahout, resumiéndolos en la Tabla 3, la cual se presenta a continuación. El crecimiento en el volumen de datos generados por diferentes sistemas y actividades cotidianas en la sociedad ha forjado la necesidad de modificar, optimizar y generar métodos y modelos de almacenamiento y tratamiento de datos que suplan las falencias que presentan las bases de datos y los sistemas de gestión de datos tradicionales. Respondiendo a esto aparece Big Data, término que incluye diferentes tecnologías asociadas a la administración de grandes volúmenes de datos provenientes de diferentes fuentes y que se generan con rapidez [1]. Como mencionamos anteriormente, gran parte de la capacidad analítica desarrollada en los últimos años ha ocurrido en el seno de grandes empresas, plataformas que operan como intermediarios que registran y producen los grandes volúmenes de datos.

Por ejemplo, ¿cómo cambia la comunicación política y cuál es su relación con antiguas formas de comunicación de masas? Organizando la literatura, podemos encontrar al menos tres ejes principales sobre los cuales se aglutinan importantes agendas de investigación empírica, sin desmedro de que esto no agota la creciente literatura que ha ido consolidándose en la última década. ¿Qué agenda de investigación surge del bootcamp de programación análisis de la relación entre política y redes sociales y qué herramientas disponen las ciencias sociales dar cuenta de estas nuevas realidades? Dada la naturaleza del objeto, este tipo de preguntas han sido abordadas de manera multidisciplinaria, conectando las ciencias de análisis de datos y programación, con ciencias del comportamiento humano como la sociología, la ciencia política y la psicología social.

IA, Big Data y ciberseguridad, claves en Navidad

La diversidad de fuentes de donde provienen estas herramientas ha dado origen a un nuevo campo científico interdisciplinario cuyo fin es desarrollar técnicas para extraer información a partir de datos. Esta disciplina, conocida como Ciencia de Datos (Data Science en inglés) es la segunda componente en la metodología de análisis de datos a gran escala. Este último punto es uno de los argumentos prevalentes en la discusión de los potenciales riesgos de Big Data en el contexto clínico.

articulos cientificos de big data

Otro tipo de aplicación del aprendizaje automático ronda entorno a la predicción de riesgos de infección, basado en características específicas de una persona, tales como edad, ubicación geográfica, nivel socioeconómico, hábitos sociales y de higiene, condiciones preexistentes e interacción humana, entre otros. Con estos datos se puede establecer un modelo predictivo sobre el riesgo que puede traer consigo un individuo o grupo de personas https://futuroelectrico.com/el-bootcamp-de-programacion/ de contraer COVID-19 y factores asociados a desarrollar complicaciones (Jiang et al., 2020) e incluso, predecir los resultados de un tratamiento. Independientemente de la denominación, una sociedad en la que aumenta la información y en la que crece la necesidad de transparencia se postula como el marco ideal para que los periodistas utilicen y expliquen los datos, aunque sean complejos, por técnicas como la visualización.

Rev. Bioética y Derecho  no.50 Barcelona  2020

Metcalf y Crawford, por su parte, resaltan los riesgos en el uso del big data al mencionar que la serie de datos que se presentan en los resultados de investigaciones científicas, sean estos parciales o finales, parecería tener un mínimo de riesgo al ser compartidos. Por este tipo de situaciones es que hoy las discusiones, estudios y reflexiones invitan al desarrollo de estudios éticos utilizando el big data (2016, p. 1). Los retos que surgen de esta herramienta de análisis incluyen las responsabilidades tanto de las empresas privadas, como lo ha puesto de manifiesto la Organización de Naciones Unidas a través de los Principios rectores sobre las empresas y los derechos humanos. Puesta en práctica del marco de las Naciones Unidas para «proteger, respetar y remediar», en los que se especifica que es responsabilidad de las empresas «abstenerse de infringir los derechos de terceros y hacer frente a las consecuencias negativas sobre los derechos humanos en las que tengan alguna participación» (2011, p. 15). Las empresas que realizan análisis de big data tienen la obligación y responsabilidad de proteger «los derechos humanos internacionalmente reconocidos que abarcan, como mínimo, los derechos enunciados en la Carta Internacional de Derechos Humanos» (2011, p. 15).

Las e-alertas se han usado para la definición y estadificación de la insuficiencia renal aguda (IRA), sobre la base de los RES y los sistemas integrados de cuidados intensivos26. En pacientes pediátricos hospitalizados, sin enfermedades críticas, las e-alertas han sido usadas en sistemas de vigilancia de nefrotoxina relacionadas con IRA, lo cual ha permitido reducir la intensidad de IRA en 42% de los casos27, aunque hay autores que ad vierten que la evidencia científica es aún limitada como para establecer con certeza que las e-alarmas sean de utilidad clínica28. Sin embargo, se acepta que se trata del “estudio científico de la creación, validación y transformación de datos para crear significado”, es decir, la ciencia que permite extraer valor y conocimiento de los datos.