Potenciando los datos con Delta Lake

Potenciando los datos con Delta Lake

La transaccionalidad en bases de datos es fundamental para sistemas críticos, pero la histórica asimetría entre lecturas (masivas) y escrituras (puntuales, pero que pueden impactar en medio de una lectura) podría resolverse con un nuevo enfoque. El año pasado Databricks liberó a la comunidad su nuevo formato de persistencia de datos construido sobre almacenamientos del […]

Understanding the Data Partitioning Technique

Understanding the Data Partitioning Technique

The objective of this post is to explain what data partitioning is and why it is important in the context of a current data architecture to improve the storage of the master dataset. With data partitioning we’ll get a logical distribution of large data sets in different partitions, which will allow us to make more […]