Cluster logbook
De e-Ciencia
Tabla de contenidos |
[editar]
2008-05-30
- egeece01
- Reinstalación en nueva máquina (eifca90).
- Nuevo disco de 700GB para /var.
- Instalado en SLC4.
- Añadidos scripts para interactuar con torque/maui.
- torque
- Reinstalación en SLC4
[editar]
2008-05-27
- egaes
- Abiertas al publico.
- Añadidas en Ganglia.
[editar]
2008-05-19
- dpm01
- Eliminacion. Editados los ldif de los siguientes nodos:
- egeece01, egeeiis01
- Eliminacion. Editados los ldif de los siguientes nodos:
[editar]
2008-03-27
- i2gui02
- Instalacion
- WNS
- Actualizacion de Openmpi compilado con ifort.
- CE (egeece01), RN (egeerb01), DPM (griddpm01)
- Error en los user.conf y groups.conf (EGEE, GRID). Cuando hay 1 sola cuenta (caso de cmssgm), solo puede tener un grupo y ten�a dos y por ello fallaba el mapeo de cmssgm. Esto pasaba para las VO 'cms' y 'swetest'.
- Se han recofigurado los gridmapfile
/opt/glite/yaim/bin/yaim -r -s INSTALL/*/yaim/siteinfo/site-info.def -f config_i2g_workload_manager_server
[editar]
2008-03-26
- torque
- Reconfigurado MAUI para mapear a chiqui a cms01 para pruebas Storm.
- cms01
- Montado /opt/exp_soft/cms desde egeese01 para pruebas Storm.
- WNS, UI (egeeui01)
- Montado /opt/exp_soft/ para las VOs de EGEE desde gridsoft01
- EGAES
- Montado /opt/exp_soft/ para desde gridsoft01
[editar]
2008-03-25
- CE (i2gce01)
- Reconfigurado el Jobmanager, no funcionaba para la vo euforia (
/opt/glite/yaim/bin/yaim -r -s INSTALL/I2G/yaim/siteinfo/site-info.def -f config_jobmanager)
- Reconfigurado el Jobmanager, no funcionaba para la vo euforia (
- RB (i2grb01)
- Cambiada la variable RB_RLS y reconfigurado con
/opt/glite/yaim/bin/yaim -r -s INSTALL/I2G/yaim/siteinfo/site-info.def -f config_i2g_workload_manager_server. - Problemas con algunos usuarios de ihidra:
- Cambiada la variable RB_RLS y reconfigurado con
[gutierrad@i2gui01 ifca]$ i2g-job-submit MC-par.jdl Selected Virtual Organisation name (from JDL): ihidra Connecting to host i2grb01.ifca.es, port 7772 Logging to host i2grb01.ifca.es, port 9002 **** Error: NS_SUBMIT_FAIL **** "SandboxIOException: Globus Ftp API Failure in creating remote Directories." received when submitting a job to NS
Mirando en /var/i2gwl/networkserver/log/events.log se ve:
18 Mar, 17:51:47 -I- "CFSI::crFSM": Creating FSM. 18 Mar, 17:51:47 -I- "CFSI::crFSM": Command Received..: GetMultiAttributeList 18 Mar, 17:51:47 -I- "CFSI::crFSM": Client Version...: 2.0.1 18 Mar, 17:51:47 -I- "CFSI::serializeServer": Serializing Server. 18 Mar, 17:51:47 -I- "CFSI::setMVA": Setting MultiValueAttributes. 18 Mar, 17:51:50 -I- "CFSI::crFSM": Creating FSM. 18 Mar, 17:51:50 -I- "CFSI::crFSM": Command Received..: JobSubmit 18 Mar, 17:51:50 -I- "CFSI::crFSM": Client Version...: 2.0.1 18 Mar, 17:51:50 -I- "CFSI::serializeServer": Serializing Server. 18 Mar, 17:51:50 -I- "CFSI::crContext": Creating Context for JobSubmit. 18 Mar, 17:51:50 -I- "CFSI::ckJobSize": Checking Job Size. 18 Mar, 17:51:50 -I- "CFSI::ckUserQuota": Evaluating User Quota. 18 Mar, 17:51:50 -I- "CFSI::insertCertSubj": Inserting Certificate Subject 18 Mar, 17:51:50 -I- "CFSI::setJobPaths": Setting Pathnames. 18 Mar, 17:51:50 -I- "CFSI::crReducedPathDirs": Creating reduced path dirs. 18 Mar, 17:51:50 -S- "CFSI::crReducedPathDirs": /var/i2gwl/SandboxDir/So already exists. 18 Mar, 17:51:51 -C- "CFSI::evClientCreateDirs": Evaluating Remote Dirs Creation: Failure.
Esperando respuesta de Enol. Mirando en el gridmapdir del RB el usuario estaba a mapeado a un usuario incorrecto (ihep en lugar de ihidra).a
- DPM (griddpm01)
- Aniadido en el gocdb.
- Entrado en funcionamiento.
- DPM (griddpm01), RB (egeerb01)
- Soporte para vo.e-ca.es (Susana)
- DPM (griddpm01), SE (egeese01), RB (egeerb01), CE (egeece01)
- Cambiados los vo.d y el site-info.def para eliminar los antiguos valores de los servidores de VOMS. Regenerado el grid-mapfile:
/opt/glite/yaim/bin/yaim -r -s INSTALL/GRID/yaim/siteinfo/site-info.def -f config_mkgridmap
- Cambiados los vo.d y el site-info.def para eliminar los antiguos valores de los servidores de VOMS. Regenerado el grid-mapfile:
- WNS
- Instaladas las librerias de STORM para GPFS.
- Acceso mediante llaves ssh desde gpfs01 y gpfs02 (nuevo authorized_keys)
- WNS, UI (egeeui01)
- Cambiado /opt/exp_soft de EGEE de egeese01 a i2gse01
[editar]
2008-03-05
- CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01)
- Update 40 - gLite 3.0
[editar]
2008-02-28
- WNs (ingrid01, ..., ingrid17, cms01, ..., cms28)
- Update 15 - gLite 3.1
[editar]
2008-02-22
- WNs (ingrid01, ..., ingrid20, cms01, ..., cms28), UI (egeeui01)
- Update 14 - gLite 3.1
[editar]
2008-02-07
- Update Int.eu.grid User Interface (i2gui01)
- Según indicación de la lista inteugrid-sa1 (2008-02-06)
[editar]
2008-02-05
- WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01), Site-BDIIs (egeeiis01, i2gce01), Top-BDIIs (egeeii01, i2gii01), UIs (egeeui01, i2gui01)
- Update CA rpms (1.18-1 -> 1.19-1)
[editar]
2007-11-30
- EGEE User Interface (egeeui01.ifca.es) Migration
- SLC-3.08 (gLite 3.0) -> SLC-4.5 (gLite 3.1)
- TORQUE/MAUI (torque.ifca.es)
- Update 37 - gLite 3.0
- torque-2.1.6-1 -> torque-2.1.9-4
- -> maui-3.2.6p19_20
- Update 37 - gLite 3.0
[editar]
2007-11-21
- WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), Torque-MAUI (torque.ifca.es), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01), Site-BDIIs (egeeiis01, i2gce01), Top-BDIIs (egeeii01, i2gii01), UIs (egeeui01, i2gui01)
- Update CA rpms (1.17-1 -> 1.18-1)
[editar]
2007-11-08
- Site-BDII (egeeiis01), Top-BDIIs (egeeii01, i2gii01), PXs (egeepx01, i2gpx01), MONs (egeemon01, i2gmon01), SEs (egeese01, i2gse01), UI (egeeui01), CE (i2gce01), RB (egeerb01)
- Update 35 - gLite 3.0
[editar]
2007-11-07
- WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), UIs (egeeui01, i2gui01), Site-BDIIs (i2gce01), Top-BDIIs (egeeii01, i2gii01), PXs (egeepx01, i2gpx01)
- Update YAIM (3.1 => 4.0)
[editar]
2007-10-29
- WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20)
- Update 05 - gLite 3.1 (glite-WN-3.1.0_4 => glite-WN-3.1.0_5)
[editar]
2007-10-18
- CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01)
- Cambio de certificados: DATAGrid => pkIRISGrid
[editar]
2007-10-10
- WNs (eifca11, ..., eifca90, ingrid01, ..., ingrid20), CEs (egeece01, i2gce01), SEs (egeese01, i2gse01), RBs (egeerb01, i2grb01), PXs (egeepx01, i2gpx01), MonBox's (egeemon01, i2gmon01), Site-BDIIs (egeeiis01, i2gce01), Top-BDIIs (egeeii01, i2gii01), UIs (egeeui01, i2gui01)
- Update CA rpms (1.16-1 -> 1.17-1)
[editar]
2007-09-06
- egeece01 i2gce01
- Configurado LDAP (globus-mds) para red privada/publica
[editar]
2007-09-04
- egeese01 i2gse01
- Red privada y exports en nfs de exp_soft
- WNs
- Automount
- egeece01
- Reconfiguración con la vo swetest
--AlvaroLopez 19:09 4 sep 2007 (CEST)
[editar]
2007-09-03
- egeece01
- Configuración con servidor torque separado
- Configuración con red privada
- Configuración firewall con autorización a IPs privadas
- egeese01 y i2gse01
- Reinicio de ambas máquinas
- WNs
- Configuración de
/opt/expcon automount
- Configuración de
- CEs y WNs
- Reconfiguración de
edg-pbs-knownhosts
- Reconfiguración de
--AlvaroLopez 12:42 3 sep 2007 (CEST)
