Javier Pastor
Saber qué tiempo va a hacer no es sencillo, y para lograr hacer predicciones fiables se necesitan realizar cálculos muy complejos queestán al alcance de los supercomputadores.
La Agencia Estatal de Meteorología,AEMET,anunciaba recientementeque iba a actualizarse y aestrenar nuevo supercomputador. Nosotros hemos hablado con uno de los máximos responsables de este proyecto, y hemos podido descubrir varios de sus secretos.
Un supercomputador estupendo que aún así queda lejos de la élite
El mundo de la supercomputación tiene en la lista TOP500 un referente claro de cómo andan las cosas en este ámbito.Los primeros integrantes de esa lista están en una élite casi inalcanzablepara la mayoría de economías, y España no es una excepción. Los primeros diez puestos están dominados por China y Estados Unidos, aunque hay participantes notables en Alemania, Italia o Arabia Saudí en ese inicio del ranking.
ElMareNostrum del Barcelona Supercomputing Centerocupaactualmenteel puesto 42 de esa lista, pero está muy lejos de esos primeros puestos en rendimiento, aunque desde luego es difícil que cualquiera de los supercomputadores de la lista pueda superar el mágico emplazamiento de ese sistema en una antigua capilla.
El supercomputador que nos ocupa hoy es desde luego más modesto en ambos aspectos, pero sigue siendo un elemento clave para uno de los escenarios más claros del uso de la supercomputación:las simulaciones que permiten predecir el tiempo con antelacióny anticiparnos a futuras condiciones meteorológicas.
Ese es uno de los objetivos de AEMET, la Agencia Estatal de Meteorología quedesde hace años cuenta con supercomputadoresprecisamente destinados ahabilitar dichas predicciones.
Precisamente estos días AEMET anunciaba la puesta en marcha de su nuevo supercomputador, un sistema quepermitirá incrementar la capacidad y precisión de los cálculosde forma notable.
Para hablar de ese sistema nos pusimos en contacto conRaúl Hilara, Coordinador de Telemática de AEMETy uno de los máximos responsables del proyecto.
Este ingeniero de telecomunicaciones pasó de trabajar en la empresa privada en el ámbito del desarrollo de equipos médicos y foenses a acabar en AEMET —tras pasar también por el Ministerio de Hacienda—, donde desde hace años él y su equipo dan “soporte de comunicaciones, sistemas y aplicaciones al resto de AEMET”. Hilara nos explicaba que aunque su equipo “da soporte al supercomputador, hay otros agentes que están implicados”.
Hasta 10 veces más potente que el actual
Al comenzar a hablar de las “tripas” del nuevo supercomputador de AEMET, Hilara nos explicaba cómo en su ámbito un supercomputador “debe ser una máquina de propósito dedicado, debes diseñar desde el inicio cuál es el tipo de nodo o el almacenamiento,porque se busca que se puedan ejecutar los modelos de cálculo meteorológico, que son muy exigentes”.
El objetivo de esta actualización es claro: aumentar la capacidad de cómputo, y eso se logra “aumentando número de cores, número de nodos y mejores características del procesador”. Acompañando a esa mejora en los núcleos utilizados está también el aumento de memoria disponible y la mejora de la red de interconexión que permita acceder a un “mayor ancho de banda”.
Al supercomputadorle acompaña un sistema de ficheros llamado LUSTREcuya conexión también se ha mejorado para lograr tratar con mayor capacidad los “ficheros grandes. También se ha mejorado la interconexión con el resto de sistemas del Centro de Proceso de Datos de AEMET, porque como explicaba Hilara “los datos, predicciones y modelos también hay que almacenarlos fuera. Una vez ejecutados los cálculos se llevan a otro sistema, y todo eso también mejora notablemente”.
El responsable del proyecto nos explicaba cómo aunque “la meteorología no tiene tantos fabricantes, sí había bastante diversidad de tecnologías. Dejamos todo bastante abierto para dejarlo a juicio de los candidatos, y solo especificamos la memoria por nodo que es casi obligada”. En este sentido nos explicaba cómo precisamentepor eso “no se presentó ninguna oferta con ARM, ya que este tipo de procesador no dispone de tanta memoria por nodo”, algo que es muy importante en el escenario que maneja AEMET.
Al final lo que tenemos son claras diferencias entre el supercomputador que entró en acción en 2014 y se había usado hasta ahora, y entre el nuevo modelo, que en realidad se implantará en dos fases. En una primera fase constará con 280 nodos con 2 procesadores AMD EPYC Rome por nodo, yen 2023 se ampliará para llegar a los 376 nodoscon procesadores que serán tanto los Rome anteriores como futuros EPYC Genoa.
Los datos de los modelos específicos de procesadores de AMD se publicarán cuando se pongan en marcha, perollaman la atención esos 96 núcleos por procesadorque se podrían alcanzar en los nodos que se integren en la actualización de 2023.
BULL DLC B700
Nuevo Supercomputador (2021)
Nuevo Supercomputador (2023)
Número de nodos
324
280
376
Número de procesadores por nodo
2
2
2
Modelo de procesador
Intel Xeon 2697 v2 (Ivy Bridge a 2,7 GHz)
AMD EPYC Rome
AMD EPYC Rome / Genoa
Procesadores Totales
648
560
752
Núcleos por procesador
10
64
64 para EPYC Rome
Hasta 96 para EPYC Genoa
Núcleos totales
7.776
35.840
48.128
Memoria RAM total
31,5 TB DDR3
70 TB DDR4
106 TB DDR4
Sistema operativo
Red Hat Linux
Red Hat Linux
Red Hat Linux
Interconexión de nodos
InfiniBand FDR a 56 Gbps
Basada en Infiniband HDR
Basada en Infiniband HDR
Sistema de ficheros en paralelo
LUSTRE, 360 TB
LUSTRE 5,9 PB
LUSTRE 5,9 PB
potencia estimada
168 TFLOPs
Aprox. 1.350 TFLOPS
Aprox. 1.680 TFLOPS
En la tabla se puede ver cómo las prestaciones del supercomputador serán mucho más notables en todos los ámbitos, y es importante destacar, como señalaba Hilara, que aunque en el nuevo modelo inicialmente se tienen menos procesadores en total,el número de núcleos por procesador es mucho mayoren los EPYC Rome (64 frente a los 10 de los Xeon) que al final el número de núcleos totales se quintuplica en esa primera fase, y va aún más allá en la ampliación que se aplicará en 2023, dondela potencia podría ser 10 vecesla del antiguo supercomputador..
Eso también se notará en la memoria principal disponible, que es más del doble en la primera fase y más del triple en la ampliación:llegará a contar con 106 TB de memoria RAM, que además será DDR4, lo queplantea también ventajastanto en ancho de banda como en eficiencia.
¿Cómo se realiza esa ampliación en 2023? Como nos explicaba Raúl Hilara, no hay parada de servicio en ningún caso porque el supercomputador cuenta con dos clústeres y “todas las modificaciones se harán sobre uno mientras el otro seguirá operativo”.
En el pliego del proyecto y en el anuncio oficial no se explicabacuáles eran los plazos de puesta en funcionamientodel supercomputador, pero Hilara aclaraba este punto: “el contrato se firmó el 9 de noviembre de 2020, y poco después comenzó el acondicionamiento” de la ubicación en la que se instala el supercomputador.
Las máquinas, ya aceptadas en la cadena de producción, han sufrido algún que otro retraso por la COVID-19 —difícil escapar de laescasez de chips—, pero en los últimos dos meses se ha realizado la preparación del CPD, con tareas como la preparación de la “refrigeración, los bastidores y el acondicionamientodel espacio, además de la recepción de los equipos para su instalación”.
Tras la instalación se comprobará su rendimiento y prestaciones con diversos benchmarks para ver si efectivamente cumplen con el pliego, y tras esa fase “se empiezan a migrar datos, fase durante la cual convive el antiguo supercomputador con el nuevo”.
Esa convivencia se producirá según las estimaciones en los meses de marzo y abril, y durante ella el antiguo supercomputador “seguirá proveyendo datos a los clientes”. Aunque el nuevo supercomputador comenzará a funcionar en estos últimos días de febrero, no proporcionará datos aún a los clientes.
Así, explicaba Hilara, “se espera que la segunda semana de mayo de 2021 el nuevo supercomputador esté en funcionamiento”. Ese plazo podría acortarse no obstante, pero parece claro que en pocas semanas los usuarios de este supercomputador podrán disfrutar de una potencia netamente superior a la que se ofrecía en el modelo anterior.
Supercomputadores de alquiler: comprarlos no tiene (mucho) sentido
Al hablar de las diferencias entre el modelo actual del supercomputador y el que había estado en funcionamiento hasta ahora surgía una pregunta obvia:¿qué pasa con el supercomputador antiguo?¿qué se hace con él?
Hilara nos indicaba cómo “hasta 2014 AEMET siempre tuvo su supercomputador en propiedad. Eso implicaba un esfuerzo bastante grande, además de bastante personal. Tenías el problema de la obsolescencia: amortizar el coste llevaba tiempo y ese plazo se podía alargar”, algo que preocupaba si tenemos en cuenta que “el dinero para la compra de estos supercomputadores sale de los Presupuestos Generales del Estado”.
Así, el modelo que se puso en funcionamiento en 2014 se vio afectado por ejemplo por la crisis de 2007. ¿Qué se hizo? “se adoptó la fórmula del arrendamiento”. El antiguo supercomputador que se instaló en 2014 no es de AEMET, está en alquiler, y “es el fabricante se encarga de la retirada”.
De hecho, nos confesaba Hilara, “el supercomptador anterior a 2014 seguía en nuestro Centro de Proceso de Datos, pero tenía un coste evidente.Quedaba muy bien, pero ya no era práctico”.
Con el arrendamiento todo se simplifica y se optimiza. No solo se arrienda el supercomputador, sino que con la máquinase incluye la delegación del soporte y de parte de la administración. AEMET monitoriza y controla cómo se llevan a cabo todas las tareas del supercomputador, pero con este modelo de arrendamiento es posible externalizar esas tareas que desvían la atención de las tareas principales a las que se encargan sus técnicos.
¿Qué será capaz de hacer el nuevo supercomputador?
La capacidad de cálculo del nuevo supercomputador de AEMET hará posibleacceder a nuevas posibilidadesen diversos ámbitos y precisamente de todo ello quisimos hablar con este experto.
En la mente de los responsables de AEMET estaban claras las cinco áreas en las que se quería avanzar para lograr que el nuevo supercomputadorproporcionase nuevas capacidades:
En general la mejora se notará en todos los ámbitos:mejores predicciones, más precisas, más rápidasy que cubrirán rangos de tiempo más amplios que van desde los tres a los 12 días si se necesita.
Filomena contra los supercomputadores
Lacélebre Filomenaque tuvoen jaquea varias Comunidades Autónomas —aunque tuvieraun lado realmente espectacular— es un ejemplo interesante dequé habría pasado si AEMET hubiera contado con este potente supercomputadorantes.
En realidad, explicaba Hilara, “Filomena ha sido un caso de éxito por precisión de lugar y momento:fue una predicción muy ajustada a la realidad”. La predicción estaba ahí a disposición de todos los organismos públicos.
Aún así, explicaba, “con el nuevo supercomputadorse podrá mejorar la resolución, con beneficios en la predicción, nowcastingy otros. Esta mayor resolución redundaría en un mayor ajuste geográfico-temporal, pero aun así la predicción fue muy acertada”.
Supercomputadores de la mano de la computación en la nube
Aunque hace tiempo que AEMET proporciona este tipo de servicios y otras agencias meteorológicas hacen lo mismo en todo el mundo, poco a poco estamos viendo cómoalgunas grandes empresas están planteando soluciones alternativaspara proporcionar sus propias predicciones meteorológicas.
IBM lleva tiempotrabajandoen un sistema de este tipo a través de su plataforma de inteligencia artificial Watson, yAmazon hace lo propiocon suForescast Weather Index, gestionado a través de su gigantesca infraestructura en la nube, AWS.
Ambas son propuestas interesantes, y nos preguntábamos si amenazan de alguna forma a lo que AEMET y otras agencias plantean con estos supercomputadores. Para HilaraAEMET no ve estos servicios como un peligro o una amenaza, y de hecho en la agencia “se prevé una oportunidad para los servicios en la nube”. De hecho, AEMET participa en proyectos de nube como la European Weather Cloud.
Por ejemplo, explica, para disponer de esa capacidad de cómputo “cuando hay una situación excepcional.Ahí puede haber una necesidad y puedes tener que recurrir a servicios en la nube para aumentar los recursos de forma temporal”. Tener esas propuestas es por tanto interesante para este experto, y hay agencias nacionales, como la de Suecia, que ya están avanzando en este sentido.
Es importante destacar aquí cómo AEMET “tiene modelos de predicción que se ejecutan en la agencia y una red de observación propia”, pero está en contacto constante con organismos internacionales. Esta agenciaes miembro del llamado Centro Europeo de Previsiones Meteorológicas a Plazo Medio(CEPMPM o ECMWF por sus siglas en inglés) y adicionalmente todos los países comparten datos para poder realizar predicciones de mejor nivel. En particular, AEMET está trabajando en la definición del mecanismo FDCM (Federation Data Coordination Mechanism) de EUMETNET.
Aquí es curioso cómo en la comparación —quelevanta pasionesentre los expertos— con el Global Forecast System de Estados Unidos, el sistema europeo esconsiderado superioren precisión y detalle.Hasta Estados Unidos parece reconocer la excelencia de los modelos europeos de predicción, pero como señalaba Hilara en Estados Unidos se fomenta que sus modelos sean públicos, algo que no ocurre siempre en Europa.
Eso sí: este experto destaca quese está avanzando en este sentido con el diseño una Directiva de OpenDataen la que se incluirán los datos meteorológicos y climatológicos. Algunos Servicios Meteorológicos Nacionales europeos se están adelantando a estas regulaciones y están poniendo de forma libre y gratuita la información disponible que estos poseen.