Plataformas de datos y banca: dónde estamos y hacia dónde vamos

Hacia dónde vamos
Image by Leandro Barco from Pixabay

Las empresas de software ayudamos en los grandes procesos de transformación que buscan extender el uso de los datos en nuevas soluciones inteligentes. Vamos dejando atrás los sistemas de ámbito local o de área funcional y se impone una arquitectura corporativa que permite construir y compartir la inteligencia a escala dentro de la organización.
Los grandes bancos tienen requisitos particulares que determinan las características de las plataformas que diseñamos, y entre ellos destacan especialmente la dimensión organizativa y la regulación.

Organización

El tamaño y complejidad de la organización nos impacta más que el propio tamaño de la infraestructura o de los datos: no es lo mismo un gran cluster de procesamiento dando servicio a un número reducido de usuarios y casos de uso especializados que gestionar la misma infraestructura soportando el trabajo de cientos o miles de usuarios de todo tipo, con cargas dispares como reporting departamental, analítica avanzada, procesamiento crítico y entrenamiento de modelos de IA. En el segundo caso, necesitamos un esfuerzo especial en capacidades de gestión de la seguridad, tarificación del consumo de servicios, gobierno de los usuarios y los procesos, etc. Además, la integración de herramientas para cubrir un espectro amplio de casuísticas, la formación y el soporte suponen desafíos adicionales.

Regulación

Una actividad fuertemente regulada, y en especial con lo que tiene que ver con el gobierno y seguridad de la información, nos exige que los sistemas proporcionen un alto grado de control sobre para qué, quien, como y cuando se utilizan los datos. De nuevo, la velocidad de innovación y la irrupción de posibilidades técnicas nos plantea la necesidad de ser especialmente finos en el diseño para dotar a la plataforma de soluciones estructurales que hagan posible la innovación sostenida a la vez que aseguramos el gobierno.

¿Qué dicen los expertos?

Como casi siempre, la aproximación a la solución exige tomar decisiones de calado. Simplificando, podríamos pensar que la necesidad de escalar aconseja dotar de mucha autonomía y control técnico a las áreas usuarias (sistemas descentralizados), mientras que garantizar la interoperabilidad y el gobierno corporativo aconseja lo contrario.
¿Cómo progresamos en dos direcciones aparentemente distintas? El conocido paper de Zhamak Dehghani nos propone arquitecturas distribuidas, con gobierno centralizado y estándares que permitan la interoperabilidad implementada mediante una infraestructura compartida disponible en modo autoservicio.
En este escenario, las distintas áreas o data domains consumen los servicios y herramientas de la plataforma y construyen de forma autónoma sus soluciones y aportar valor y capacidades al conjunto de la organización.
Una plataforma así facilita muchos de los factores de éxito que el se identifican en el informe The next evolution of innovation in financial services (World Economic Forum/Deloitte), como son facilidad de ejecución de la estrategia, el éxito en establecer relaciones con otros agentes y en evitar la fragmentación de los datos.

Datio 2020

En Datio hemos seguido avanzando en el año recién terminado hacia la construcción de estos paradigmas, tal como lo demuestran algunos de nuestros logros:

Autoservicio End-to-End: Nuestra última versión de Sandbox permite al usuario realizar de forma autónoma el ciclo completo del desarrollo tanto de engines (procesos de procesamiento masivo distribuido) como de modelos AI, desde la exploración inicial de los datos hasta la productivización de los objetos resultantes. Para ello integramos en un único entorno la gestión de las herramientas de desarrollo, gestión de procesos, acceso al almacenamiento, herramientas de BI en modo “as-a-service” y gestión del ciclo de vida. Combinamos la flexibilidad de uso (trabajo desde Jupyter Lab o IDEs locales, autogestión de tallas, imágenes, librerías….) con automatismos que garanticen estándares y seguridad (generación de scaffolds, checks de validación de código…).
Procesamiento multi-tenant / multi-país: un servicio de procesamiento distribuido único, invocable desde los propios sandbox como desde sistemas ajenos e integrado con los circuitos corporativos de CI nos permite compartir de forma eficiente los recursos del cluster entre las distintas cargas.

Hibridación: podemos utilizar infraestructura de cloud pública para nuestros entornos analíticos con exactamente la misma seguridad, herramientas y acceso a datos, lo que supone una facilidad más a la hora de facilitar la adopción y el crecimiento.

Gobierno Centralizado: tenemos herramientas que centralizan la gestión de la información de negocio, datos técnicos, de seguridad y calidad en las persistencias de la plataforma. Además hemos avanzado mucho en definir un modelo de seguridad global, incorporar nuevos tipos de persistencias al esquema de gobierno y comenzar a aplicar el procesamiento del lenguaje natural para identificar y tagear datos sensibles dentro de la información de texto.

Volumen uso plataforma de datos
Volumen de uso actual de la plataforma de datos.

¿Qué viene en el futuro?

Más híbridos, con más capacidades, más integrados. Seguimos evolucionando para anticiparnos a las necesidades futuras actualizando elementos de la plataforma que nos permitirán una gestión universal de las cargas de trabajo basada en Kubernetes, y con mecanismos que permitan incorporar rápidamente la innovación que se genere en el mercado, pero asegurando a la vez, por diseño, todo el gobierno de datos y procesos que necesita nuestra actividad.

Y para dar cobertura a todo el crecimiento en cantidad y variedad de datos, presentaremos innovadoras capacidades de gobierno: los nuevos agentes de auto-descubrimiento permitirán automatizar gran parte de la generación de los diccionarios de datos mediante la identificación automática de conceptos y relaciones; el trabajo con ontologías de negocio hará posible un nuevo nivel de abstracción a la hora de construir procesos y servicios, y los knowledge graphs serán de grandísima ayuda a la hora de identificar dependencias, jerarquías e interacciones entre datos y procesos.

2021 es pues, de nuevo, un año ilusionante en cuanto a cantidad y calado de las novedades que nos van a ocupar.

¡Os iremos contando!

mm

Manuel Vigil

I am really motivated by technology, teamwork and the development of end to end and transforming solutions. My career path has been tied to technological companies like Indra, Meta4, Calculo, Paradigma and Stratio, where I have the chance to grow and enjoy myself implementing solutions for the most important Spanish companies of Telecommunication, Finance, Industry and Government. Nowadays I am CEO in Datio and my role is helping to combine people, methodologies and technologies, to build the best data solutions for the bank industry.

More Posts