This wiki has been deprecated and will be removed soon.

The new Advanced Computing and e-Science wiki is located at http://grid.ifca.es/wiki.

Please update your bookmarks.

Cluster logbook

De e-Ciencia

Tabla de contenidos

2008-05-30

  • egeece01
    • Reinstalación en nueva máquina (eifca90).
    • Nuevo disco de 700GB para /var.
    • Instalado en SLC4.
    • Añadidos scripts para interactuar con torque/maui.
  • torque
    • Reinstalación en SLC4

2008-05-27

  • egaes
    • Abiertas al publico.
    • Añadidas en Ganglia.

2008-05-19

  • dpm01
    • Eliminacion. Editados los ldif de los siguientes nodos:
      • egeece01, egeeiis01

2008-03-27

  • i2gui02
    • Instalacion
  • WNS
    • Actualizacion de Openmpi compilado con ifort.
  • CE (egeece01), RN (egeerb01), DPM (griddpm01)
    • Error en los user.conf y groups.conf (EGEE, GRID). Cuando hay 1 sola cuenta (caso de cmssgm), solo puede tener un grupo y ten�a dos y por ello fallaba el mapeo de cmssgm. Esto pasaba para las VO 'cms' y 'swetest'.
    • Se han recofigurado los gridmapfile /opt/glite/yaim/bin/yaim -r -s INSTALL/*/yaim/siteinfo/site-info.def -f config_i2g_workload_manager_server

2008-03-26

  • torque
    • Reconfigurado MAUI para mapear a chiqui a cms01 para pruebas Storm.
  • cms01
    • Montado /opt/exp_soft/cms desde egeese01 para pruebas Storm.
  • WNS, UI (egeeui01)
    • Montado /opt/exp_soft/ para las VOs de EGEE desde gridsoft01
  • EGAES
    • Montado /opt/exp_soft/ para desde gridsoft01

2008-03-25

  • CE (i2gce01)
    • Reconfigurado el Jobmanager, no funcionaba para la vo euforia (/opt/glite/yaim/bin/yaim -r -s INSTALL/I2G/yaim/siteinfo/site-info.def -f config_jobmanager)
  • RB (i2grb01)
    • Cambiada la variable RB_RLS y reconfigurado con /opt/glite/yaim/bin/yaim -r -s INSTALL/I2G/yaim/siteinfo/site-info.def -f config_i2g_workload_manager_server.
    • Problemas con algunos usuarios de ihidra:
[gutierrad@i2gui01 ifca]$ i2g-job-submit MC-par.jdl

Selected Virtual Organisation name (from JDL): ihidra
Connecting to host i2grb01.ifca.es, port 7772
Logging to host i2grb01.ifca.es, port 9002
**** Error: NS_SUBMIT_FAIL ****
"SandboxIOException: Globus Ftp API Failure in creating remote Directories." received when submitting a job to NS

Mirando en /var/i2gwl/networkserver/log/events.log se ve:

18 Mar, 17:51:47 -I- "CFSI::crFSM": Creating FSM.
18 Mar, 17:51:47 -I- "CFSI::crFSM": Command Received..: GetMultiAttributeList
18 Mar, 17:51:47 -I- "CFSI::crFSM": Client  Version...: 2.0.1
18 Mar, 17:51:47 -I- "CFSI::serializeServer": Serializing Server.
18 Mar, 17:51:47 -I- "CFSI::setMVA": Setting MultiValueAttributes.
18 Mar, 17:51:50 -I- "CFSI::crFSM": Creating FSM.
18 Mar, 17:51:50 -I- "CFSI::crFSM": Command Received..: JobSubmit
18 Mar, 17:51:50 -I- "CFSI::crFSM": Client  Version...: 2.0.1
18 Mar, 17:51:50 -I- "CFSI::serializeServer": Serializing Server.
18 Mar, 17:51:50 -I- "CFSI::crContext": Creating Context for JobSubmit.
18 Mar, 17:51:50 -I- "CFSI::ckJobSize": Checking Job Size.
18 Mar, 17:51:50 -I- "CFSI::ckUserQuota": Evaluating User Quota.
18 Mar, 17:51:50 -I- "CFSI::insertCertSubj": Inserting Certificate Subject
18 Mar, 17:51:50 -I- "CFSI::setJobPaths": Setting Pathnames.
18 Mar, 17:51:50 -I- "CFSI::crReducedPathDirs": Creating reduced path dirs.
18 Mar, 17:51:50 -S- "CFSI::crReducedPathDirs": /var/i2gwl/SandboxDir/So already exists.
18 Mar, 17:51:51 -C- "CFSI::evClientCreateDirs": Evaluating Remote Dirs Creation: Failure.

Esperando respuesta de Enol. Mirando en el gridmapdir del RB el usuario estaba a mapeado a un usuario incorrecto (ihep en lugar de ihidra).a

  • DPM (griddpm01)
    • Aniadido en el gocdb.
    • Entrado en funcionamiento.
  • DPM (griddpm01), RB (egeerb01)
    • Soporte para vo.e-ca.es (Susana)
  • DPM (griddpm01), SE (egeese01), RB (egeerb01), CE (egeece01)
    • Cambiados los vo.d y el site-info.def para eliminar los antiguos valores de los servidores de VOMS. Regenerado el grid-mapfile: /opt/glite/yaim/bin/yaim -r -s INSTALL/GRID/yaim/siteinfo/site-info.def -f config_mkgridmap
  • WNS
    • Instaladas las librerias de STORM para GPFS.
    • Acceso mediante llaves ssh desde gpfs01 y gpfs02 (nuevo authorized_keys)
  • WNS, UI (egeeui01)
    • Cambiado /opt/exp_soft de EGEE de egeese01 a i2gse01

2008-03-05

  • CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01)
    • Update 40 - gLite 3.0

2008-02-28

  • WNs (ingrid01, ..., ingrid17, cms01, ..., cms28)
    • Update 15 - gLite 3.1

2008-02-22

  • WNs (ingrid01, ..., ingrid20, cms01, ..., cms28), UI (egeeui01)
    • Update 14 - gLite 3.1

2008-02-07

  • Update Int.eu.grid User Interface (i2gui01)
    • Según indicación de la lista inteugrid-sa1 (2008-02-06)

2008-02-05

  • WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01), Site-BDIIs (egeeiis01, i2gce01), Top-BDIIs (egeeii01, i2gii01), UIs (egeeui01, i2gui01)
    • Update CA rpms (1.18-1 -> 1.19-1)

2007-11-30

  • EGEE User Interface (egeeui01.ifca.es) Migration
    • SLC-3.08 (gLite 3.0) -> SLC-4.5 (gLite 3.1)
  • TORQUE/MAUI (torque.ifca.es)
    • Update 37 - gLite 3.0
      • torque-2.1.6-1 -> torque-2.1.9-4
      • -> maui-3.2.6p19_20

2007-11-21

  • WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), Torque-MAUI (torque.ifca.es), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01), Site-BDIIs (egeeiis01, i2gce01), Top-BDIIs (egeeii01, i2gii01), UIs (egeeui01, i2gui01)
    • Update CA rpms (1.17-1 -> 1.18-1)

2007-11-08

  • Site-BDII (egeeiis01), Top-BDIIs (egeeii01, i2gii01), PXs (egeepx01, i2gpx01), MONs (egeemon01, i2gmon01), SEs (egeese01, i2gse01), UI (egeeui01), CE (i2gce01), RB (egeerb01)
    • Update 35 - gLite 3.0

2007-11-07

  • WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), UIs (egeeui01, i2gui01), Site-BDIIs (i2gce01), Top-BDIIs (egeeii01, i2gii01), PXs (egeepx01, i2gpx01)
    • Update YAIM (3.1 => 4.0)

2007-10-29

  • WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20)
    • Update 05 - gLite 3.1 (glite-WN-3.1.0_4 => glite-WN-3.1.0_5)

2007-10-18

  • CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01)
    • Cambio de certificados: DATAGrid => pkIRISGrid

2007-10-10

  • WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01), Site-BDIIs (egeeiis01, i2gce01), Top-BDIIs (egeeii01, i2gii01), UIs (egeeui01, i2gui01)
    • Update CA rpms (1.16-1 -> 1.17-1)

2007-09-06

  • egeece01 i2gce01
    • Configurado LDAP (globus-mds) para red privada/publica

2007-09-04

  • egeese01 i2gse01
    • Red privada y exports en nfs de exp_soft
  • WNs
    • Automount
  • egeece01
    • Reconfiguración con la vo swetest

--AlvaroLopez 19:09 4 sep 2007 (CEST)

2007-09-03

  • egeece01
    • Configuración con servidor torque separado
    • Configuración con red privada
    • Configuración firewall con autorización a IPs privadas
  • egeese01 y i2gse01
    • Reinicio de ambas máquinas
  • WNs
    • Configuración de /opt/exp con automount
  • CEs y WNs
    • Reconfiguración de edg-pbs-knownhosts

--AlvaroLopez 12:42 3 sep 2007 (CEST)

Herramientas personales
Grid Administration
Users Support