2.- Specialization Module

El presente módulo tiene como objetivo proporcionar al estudiante la especialización necesaria en un tema determinado. El estudiante deberá elegir una de las 3 opciones que se le proporcionan.

En este módulo el estudiante deberá elegir una de las 3 ramas de especialización que se le proporcionan:


M04 - Data Science Analytics

M05 - Data Science Engineering

M06 - Open Data Management

Módulos

M04 - Inteligencia en Ciencia de Datos

ECTS: 12 Créditos
Nivel: Avanzado
Idioma: Castellano / Inglés
Objetivo

Esta materia tiene como objetivo proporcionar al estudiante los conocimientos básicos sobre las distintas metodologías y técnicas de aprendizaje automático (machine learning) para que sepan aplicarlas de forma crítica en problemas reales, incluyendo la minería de textos y la minería Web. Un segundo objetivo, de tipo práctico, es proporcionar al alumno las capacidades y herramientas estándar necesarias para poder llevar a cabo de manera autónoma proyectos de analítica de datos.

Asignaturas

M04-01 Aprendizaje automático I / Machine Learning I

M04-02 Aprendizaje Automático II / Machine Learning II

M04-03 Semántica, datos conectados y minería de datos textual / Semantics, Linked Data, Text Data Mining

Contenido

1. Redes neuronales. Topologías multicapa y recurrente.

2. Algoritmos iterativos de aprendizaje (backprop).

3. Reservorios y técnicas de proyección aleatoria.

4. Extreme Learning Machines.

5. Retos en problemas "big data". Aprendizaje batch y online.

6. Deep learning. Autoencoders y convolución.

7. Tecnologías y paquetes para redes neuronales y deep learning.

8. Aprendizaje estadístico.

9. Márgenes y vectores soporte. Máquinas de vector soporte (SVM)

10. Métodos basados en núcleos.

11. Variables latentes y método EM.

12. Modelos de Markov ocultos (HMM).

13. Aprendizaje Bayesiano. Redes probabilísticas. Causalidad.

14. Selección de modelos. MCMC.

15. Redes semánticas.

16. Ontologías.

17. Aprendizaje de ontologías.

18. Linked data.

19. Análisis de redes complejas.

20. Minería de textos y minería Web.

M05 - Ingeniería de Datos

ECTS: 12 Créditos
Nivel: Avanzado
Idioma: Castellano / Inglés
Objetivo

Esta materia tiene como objetivo proporcionar al estudiante un contacto directo con las tecnologías, principalmente de ingeniería informática, que permiten el despliegue de las herramientas de análisis de datos y el desarrollo e implementación de nuevas soluciones.

Asignaturas

M05-01 Sistemas de computación para datos masivos / Computing systems for Big Data

M05-02 Herramientas en la nube para la Ciencia de Datos / Cloud for Data Science

M05-03 Desarrollo de proyectos / Project development (OpenProject, github)

Contenido

1. Arquitectura de una e-Infraestructura.

2. Computación HPC y HTC: servidores, clusters, supercomputadores.

3. Gestión clásica de un cluster de computación. Sistemas de colas. Benchmarking. Monitorización.

4. Redes de interconexión de sistemas.

5. Sistemas de almacenamiento.

6. Transmisión de datos en Internet.

7. Computación distribuida.

8. Computación en paralelo. Introducción a MPI.

9. Principios de gestión como servicio: introducción a FitSM.

10. Virtualización de sistemas. Hipervisores.

11. Uso de Contenedores y Docker.

12. Entorno Cloud: principios básicos

13. Infraestructura como Servicio (IaaS), estándares (OCCI), gestión básica con OpenStack.

14. Acceso a recursos comerciales: Amazon, Azure, BlueMix, Google Cloud.

15. Composición de Servicios y Platform as a Service (PaaS). Herramientas básicas.

16. Software as a Service (SaaS). Ejemplos de aplicaciones. Acceso a R y Python en modo SaaS.

17. Almacenamiento en entorno Cloud: el estándar CDMI y de-facto S3. Ejemplos de integración de datos locales (CEPH) y distribuidos (OneData).

18. Plataformas SaaS para Big Data.

19. Introducción a la metodología de proyectos.

20. Diseño de Casos de Estudio.

21. Desarrollo de software. Metodología Agil.

22. Control de versiones. Github.

23. Despliegue de software en entornos distribuidos.

24. Gestión global del proyecto.

25. Aplicación de FitSM en el desarrollo de proyectos

26. Servicio a terceros: SLA (Service Level Agrement) y CRM (Customer Relationship Management)

M06 - Gestión de Datos en Abierto

ECTS: 12 Créditos
Nivel: Avanzado
Idioma: Castellano / Inglés
Objetivo

Esta materia tiene como objetivo proporcionar al estudiante un contacto directo con las tecnologías utilizadas para la implementación de repositorios de datos y su posterior explotación. Se presentan los estándares más relevantes y las iniciativas más visibles en diferentes áreas de conocimiento dentro del contexto Open Science.

Asignaturas

M06-01 Portales y servicios de acceso a datos en abierto / Open Data portals and access services

M06-02 Preservación de datos / Data Preservation

M06-03 Repositorios en abierto / Open data repositories

Contenido

1. Portales de acceso a datos en abierto

2. Registro de datos y metadatos, estándares y herramientas.

3. Descarga de datos, acceso mediante web services y APIs

4. Ejemplos relevantes de portales globales de datos en abierto(GEOSS)

5. Infraestructuras de procesado de datos en abierto.

6. Preservación de datos: preservación física (bit)

7. Preservación de datos: uso de identificadores (PID y DOI)

8. Preservación del software: gestión de código y uso de VM

9. Preservación del análisis y cadena de provenance

10. Estándares de ingestión de datos.

11. Repositorios digitales: ejemplos institucionales.

12. Implementación de un repositorio digital: herramienta Invenio.

PRE-INSCRIBETE

Volver a la página principal