Tema 3 - El almacenamiento en modo Cloud Computing (la nube)
Grupo 10 - Marcel Andrei Voicu, Darius Dumitras Tamas,
Juan García López
Resumen
Cada día, millones de personas en todo el mundo acceden a sitios web con diversos
propósitos, como las redes sociales, donde pueden compartir fotos, vídeos, mensajes,
artículos, etc., o sitios web de streaming de series y películas, donde pueden verlas mediante
una suscripción de pago o, en algunos casos, incluso gratuitamente. Estos son solo unos
pocos ejemplos de todos los servicios que se pueden utilizar a través de Internet, pero,
¿alguna vez te has preguntado cuánta información hay en Internet? Todos estos servicios
se basan en el almacenamiento y difusión de datos, después de todo. Esas fotos que subes,
las series que ves a través de Netflix, todo se debe almacenar en algún lugar, para después
poder acceder a ello y compartirlo con quienes queramos. Pero es que todos los días se crea
nuevo contenido en Internet, a cada segundo, ¿acaso Internet alberga un espacio infinito?
Se estima que, en 2020, se superaron los 40 ZB (zettabytes) de datos en Internet.
Esto equivale a unos 40.000.000.000 TB (terabytes). Es decir:
1 película (almacenada en disco Blu Ray) ≈ 40 GB = 0,04 TB
25 películas = 1 TB
1.000.000.000.000 películas = 40 ZB
Dicho de otra forma, se estima que, en 2020, Internet contenía datos con un tamaño total
similar a lo que ocuparían 1 billón de películas con un tamaño de alrededor de 40 GB.
Vale, pero, ¿qué tiene que ver esto con la nube? La nube es lo mismo que Internet. Se suele
denominar así por la forma en que se representa normalmente Internet al esquematizar las
redes de ordenadores que lo conforman. En el pasado, se podía dibujar TODA la red de
Internet:
Pero, con el paso del tiempo y el consiguiente aumento del tamaño de la red llamada Internet,
los esquemas de Internet se iban pareciendo más a esto (1998):
Por lo que, finalmente, nos curamos en salud y decidimos denominarla “la nube”, por su
semejanza a los diagramas. Hay que tener presente que Internet no deja de ser una red de
ordenadores interconectados entre sí. Anteriormente se conectaban únicamente a través de
cables, ahora podemos conectarlos también a través de WiFi o el 3G, 4G, etc. Actualmente,
la red rodea el planeta Tierra. Aquí podemos ver un esquema con los cables submarinos que
conectan los continentes:
Esto es originalmente “la nube” pero, en el ámbito empresarial, la nube suele referirse a otro
concepto similar. Empresas como Google o Amazon poseen sus propias bases de datos,
donde almacenan enormes cantidades de información, las cuales son accesibles a través de
Internet.
Pero, espera, ¿qué es una base de datos? Vayamos paso a paso.
Las bases de datos contienen datos, los cuales se deben almacenar de alguna forma. Los
ordenadores gestionan estos datos de forma digital, es decir, con cadenas de 1 y 0. Los
medios de almacenamiento digital que se suelen utilizar actualmente son los discos duros,
la memoria SSD y los pendrives, entre otros. Dicho esto, las bases de datos suelen utilizar
discos duros.
Estos datos se deben almacenar de una manera eficiente, tanto para cuando queramos
acceder rápidamente a ellos, como para que ocupen el menor espacio posible. Esto se
consigue diseñando un almacenamiento orientado a entidades, donde una entidad es un
conjunto de datos concretos que representan algo realmente existente, como por ejemplo
una factura o un cliente. Hay que tener en cuenta que existen muchos ejemplos de una
misma entidad, una misma factura, por lo que todos ellos se almacenan en una tabla, pues
comparten las mismas características. Así, cada fila de la tabla es una factura en concreto, y
cada columna una característica de la factura (fecha de emisión, producto comprado, etc.).
Finalmente, la gestión de las bases de datos, es decir, el control de su estructura, su diseño,
sus tablas, el acceso y modificación de los datos, etc., se facilita gracias a un tipo de software
llamado Sistema Gestor de Bases de Datos, el cual se encarga de automatizar ciertos
procesos y de facilitar la ejecución de otros.
Así, podemos resumir el concepto de base de datos al conjunto de los dispositivos físicos que
contienen los datos digitalmente, los cuales son gestionados por herramientas software
llamadas Sistemas Gestores de Bases de Datos, y que organizan los datos en tablas.
Pues bien, en el ámbito empresarial, hoy en día casi todas las empresas necesitan bases de
datos, además de otras herramientas software que ayuden en el desempeño diario de la
empresa. Pero comprar todos los dispositivos de almacenamiento, además de alojarlos en
lugares seguros, mantenerlos, garantizar su acceso a través de la red de la empresa,
gestionar sus datos, etc., puede llegar a ser muy costoso. Es por ello que existen empresas
que se encargan de ofrecer a otras cierto porcentaje de toda la estructura necesaria para
mantener y hacer uso de las bases de datos y el software que se comunique con ellas.
Así, también se suele denominar “la nube” al conjunto de estructuras y servicios que nos
proveen determinadas empresas. Podemos distinguir los siguientes servicios a través de la
nube, dependiendo de lo que estas empresas ofrezcan:
Dichos servicios son, IaaS, (Infrastructure as a service), donde la empresa permite gestionar
la mayoría de los servicios, dejando el mantenimiento del sistema operativo, bases de datos,
seguridad y aplicaciones al/los usuario/s.
PaaS, (Platform as a service), el cual se ofrece la gestión y mantenimiento de todo excepto
las aplicaciones, las cuales deberán ser instaladas y mantenidas por los usuarios.
SaaS, (Software as a service), donde la empresa da todo instalado y mantenido y el usuario
sólo se encarga de encender y utilizar dicha máquina.
Ampliación
Profundizaremos un poco más en la privacidad de nuestros datos en el almacenamiento en la
nube. Las políticas que rigen sobre nuestros datos están sujetas a las empresas que ofrecen
estos servicios, que también están influidas por el país en el que operan.
La mayoría de las grandes empresas que ofrecen servicios Cloud (Google, AWS,...) están de
acuerdo en que la seguridad de los servicios en la nube es una respondabilidad compartida
entre los clientes y la propia empresa. Estas responsabilidades también varían evidentemente
entre los distintos modelos Cloud como vemos en la siguiente imagen (Microsoft):
En cuanto a los distintos países, Europa va a la cabeza con el Reglamento General de
Protección de Datos, que otorga a los usuarios un mayor control sobre la gestión de sus datos
personales por parte de las compañías. Estados Unidos no tiene en sí un consenso entre sus
distintos estados, y aunque en los últimos años se han aprobado leyes de privacidad del lado
de los usuarios (CCPA), sigue dando mucha libertad a las empresas para establecer sus
propios estándares.
En contraposición tenemos a China y su Ley de Seguridad Cibernética, que tiene algunos
puntos comunes con el RGPD, pero uno de los más polémicos es la obligación de los
operadores de red de controlar la información divulgada por los usuarios, todo esto para
recabar dicha información y ver si está "prohibida de ser publicada".
Aunque confiar nuestros datos a entidades externas no está libre de riesgos, las empresas
invierten mucho capital en mejorar los sistemas de protección de datos en sus nubes, y sigue
siendo una opción más barata frente a configurar y mantener nuestros propios CTDs tanto
domésticos como en empresas u organizaciones. Es por esto que cada vez más la tecnología
Cloud está terminando de establecerse en todo el mundo.
Opinión al respecto
Se tratan estas bases de datos debido a que los grafos son ampliamente utilizados para la
inteligencia artificial, un ejemplo de este tipo de bases de datos son las del ajedrez, cada nodo
del grafo representa un tablero entero de ajedrez, la transición para llegar de un nodo a otro es
muy simple, consta de un movimiento, por lo que trabajar sobre grafos es muy cómodo.
A día de hoy existen muchas bases de datos llenas de grafos de partidas de ajedrez que se
usan para entrenar inteligencias artificiales, estudiar aperturas…
En un futuro cercano, con el avance de la computación cuántica también se necesitarán bases
de datos cuánticas y observando el comportamiento del ADN y de cómo es capaz de
almacenar mucha información en muy poco espacio se puede definir un proceso de
codificación de datos binarios hacia y desde cadenas de ADN sintetizadas.
Referencias
https://healthit.com.au/how-big-is-the-internet-and-how-do-we-measure-it/
https://www.quora.com/Why-is-the-cloud-called-the-cloud
https://evaluandocloud.com/seguridad-privacidad-la-nube-quien-la-responsabilidad/
Comentarios
Publicar un comentario