1.- Fundamentals Module

El presente módulo tiene como objetivo proporcionar al estudiante una visión de global de lo que se conoce como Data Science, (o Ciencia de Datos), de los problemas de Big Data, y del contexto de Open Science (o Ciencia Abierta).

Este módulo es de realización obligatoria para el máster y consta de 3 partes:


M01 - Introduction to Big Data and Open Science

M02 - Data Science Methods

M03 - Data Management

Módulos

M01 - Introducción a los datos masivos y a la ciencia en abierto

ECTS: 6 Créditos
Nivel: Básico
Idioma: Castellano / Inglés
Objetivo

La presente materia tiene como objetivo proporcionar al estudiante una visión de global de lo que se conoce como Data Science, (o Ciencia de Datos), de los problemas de Big Data, y del contexto de Open Science (o Ciencia Abierta).

Contenido

1. Introducción al contexto de Open Science (Ciencia en Abierto).

2. Relevancia de los problemas de Big Data en Open Science

3. El enfoque desde Ciencia de Datos

4. Ejemplos relevantes de la aplicación de Ciencia de Datos en Open Science

5. Arquitectura de las soluciones.

6. Descripción de las e-Infraestructuras y el correspondiente Middleware

7. Panorámica de casos de uso en las áreas de Salud, Medio Ambiente, Urbanismo, Economía, Astrofísica, Ciencias Sociales, Humanidades, Gestión Pública.

8. Problemas y desafíos.

9. Perfiles profesionales en el ecosistema de la Ciencia de datos.

10. Nuevas tendencias y desarrollos.

11. Proyectos e iniciativas, instituciones y empresas implicadas.

M02 - Métodos en Ciencia de Datos

ECTS: 12 Créditos
Nivel: Básico
Idioma: Castellano / Inglés
Objetivo

Esta materia tiene como objetivo proporcionar a los estudiantes conocimientos básicos sobre los métodos estadísticos para la descripción, presentación y análisis de datos, así como los principios generales para la aplicación práctica de las principales técnicas automáticas de modelización y predicción de minería de datos para el tratamiento de grandes masas de datos.

Contenido

1. Estadística descriptiva.

2. Muestreo y Monte Carlo.

3. Fundamentos de inferencia estadística: una y varias variables.

4. Contrastes paramétricos y no paramétricos para una y varias muestras.

5. Técnicas de remuestreo (bootstrap).

6. Modelos de regresión. Estimación de máxima verosimilitud.

7. Regularización. Regresión contraída (ridge regression)

8. Problemas de asociación, segmentación, clasificación, y predicción.

9. Aprendizaje basado en casos, no supervisado, supervisado, o por refuerzo.

10. Evaluación de métodos. Sobreajuste, validación cruzada (k-fold).

11.Reglas de asociación.

12. Técnicas de vecinos cercanos, distancias, núcleos y funciones de base radial.

13.Segmentación jerárquica, k-medias, SOM.

14.Árboles de clasificación y regresión.

15. Modelos lineales y aditivos generalizados.

16.Aprendizaje por conjuntos: boosting y bagging.

M03 - Gestión de Datos

ECTS: 12 Créditos
Nivel: Básico
Idioma: Castellano / Inglés
Objetivo

Esta materia tiene como objetivo proporcionar al estudiante una introducción a los modelos de datos y sistemas de información, incluyendo tanto el diseño cómo la implementación práctica sobre bases de datos o sistemas de ficheros, y las herramientas para explotarlos. Igualmente se espera que el estudiante comprenda el interés de diseñar las soluciones teniendo en cuenta el ciclo de vida completo de los datos, desde la planificación de su gestión hasta la publicación de los mismos y su posible re-uso.

Contenido

1. Introducción a la gestión de la información. Ciclo de vida de los sistemas de información.

2. Tipos y estructuras de datos. Modelado de datos. Diseño conceptual, diseño lógico y diseño físico.

3. Tecnologías de gestión de datos para sistemas científicos y sistemas corporativos.

4. Base de datos relacionales. Lenguaje SQL. Tecnología OLAP.

5. Bases de datos para problemas de Big Data.

6. Extracción, transformación y carga de datos.

7. Diferentes aproximaciones al Ciclo de Vida de los Datos.

8. Planificación de la gestión de los datos: DMPs

9. Herramientas de gestión de Metadatos.

10. Ingestión de datos. Ejemplos multidisciplinares.

11. Publicación de datos en abierto.

PRE-INSCRIBETE

Volver a la página principal