Tema 3 - El almacenamiento en modo Cloud Computing (la nube)

Grupo 10 - Marcel Andrei Voicu, Darius Dumitras Tamas, 

Juan García López


Resumen

 

Cada día, millones de personas en todo el mundo acceden a sitios web con diversos

propósitos, como las redes sociales, donde pueden compartir fotos, vídeos, mensajes,

artículos, etc., o sitios web de streaming de series y películas, donde pueden verlas mediante

una suscripción de pago o, en algunos casos, incluso gratuitamente. Estos son solo unos

pocos ejemplos de todos los servicios que se pueden utilizar a través de Internet, pero,

¿alguna vez te has preguntado cuánta información hay en Internet? Todos estos servicios

se basan en el almacenamiento y difusión de datos, después de todo. Esas fotos que subes,

las series que ves a través de Netflix, todo se debe almacenar en algún lugar, para después

poder acceder a ello y compartirlo con quienes queramos. Pero es que todos los días se crea

nuevo contenido en Internet, a cada segundo, ¿acaso Internet alberga un espacio infinito?


Se estima que, en 2020, se superaron los 40 ZB (zettabytes) de datos en Internet.

Esto equivale a unos 40.000.000.000 TB (terabytes). Es decir:


1 película (almacenada en disco Blu Ray) ≈ 40 GB = 0,04 TB

25 películas = 1 TB

1.000.000.000.000 películas = 40 ZB


Dicho de otra forma, se estima que, en 2020, Internet contenía datos con un tamaño total

similar a lo que ocuparían 1 billón de películas con un tamaño de alrededor de 40 GB.


Vale, pero, ¿qué tiene que ver esto con la nube? La nube es lo mismo que Internet. Se suele

denominar así por la forma en que se representa normalmente Internet al esquematizar las

redes de ordenadores que lo conforman. En el pasado, se podía dibujar TODA la red de

Internet:



Pero, con el paso del tiempo y el consiguiente aumento del tamaño de la red llamada Internet,

los esquemas de Internet se iban pareciendo más a esto (1998):



Por lo que, finalmente, nos curamos en salud y decidimos denominarla “la nube”, por su

semejanza a los diagramas. Hay que tener presente que Internet no deja de ser una red de

ordenadores interconectados entre sí. Anteriormente se conectaban únicamente a través de

cables, ahora podemos conectarlos también a través de WiFi o el 3G, 4G, etc. Actualmente,

la red rodea el planeta Tierra. Aquí podemos ver un esquema con los cables submarinos que

conectan los continentes:

 


Esto es originalmente “la nube” pero, en el ámbito empresarial, la nube suele referirse a otro

concepto similar. Empresas como Google o Amazon poseen sus propias bases de datos,

donde almacenan enormes cantidades de información, las cuales son accesibles a través de 

Internet. 


Pero, espera, ¿qué es una base de datos? Vayamos paso a paso.


Las bases de datos contienen datos, los cuales se deben almacenar de alguna forma. Los

ordenadores gestionan estos datos de forma digital, es decir, con cadenas de 1 y 0. Los

medios de almacenamiento digital que se suelen utilizar actualmente son los discos duros,

la memoria SSD y los pendrives, entre otros. Dicho esto, las bases de datos suelen utilizar

discos duros.


Estos datos se deben almacenar de una manera eficiente, tanto para cuando queramos 

acceder rápidamente a ellos, como para que ocupen el menor espacio posible. Esto se 

consigue diseñando un almacenamiento orientado a entidades, donde una entidad es un 

conjunto de datos concretos que representan algo realmente existente, como por ejemplo 

una factura o un cliente. Hay que tener en cuenta que existen muchos ejemplos de una 

misma entidad, una misma factura, por lo que todos ellos se almacenan en una tabla, pues 

comparten las mismas características. Así, cada fila de la tabla es una factura en concreto, y 

cada columna una característica de la factura (fecha de emisión, producto comprado, etc.).


Finalmente, la gestión de las bases de datos, es decir, el control de su estructura, su diseño, 

sus tablas, el acceso y modificación de los datos, etc., se facilita gracias a un tipo de software

llamado Sistema Gestor de Bases de Datos, el cual se encarga de automatizar ciertos 

procesos y de facilitar la ejecución de otros.


Así, podemos resumir el concepto de base de datos al conjunto de los dispositivos físicos que

contienen los datos digitalmente, los cuales son gestionados por herramientas software

llamadas Sistemas Gestores de Bases de Datos, y que organizan los datos en tablas.


Pues bien, en el ámbito empresarial, hoy en día casi todas las empresas necesitan bases de 

datos, además de otras herramientas software que ayuden en el desempeño diario de la 

empresa. Pero comprar todos los dispositivos de almacenamiento, además de alojarlos en 

lugares seguros, mantenerlos, garantizar su acceso a través de la red de la empresa, 

gestionar sus datos, etc., puede llegar a ser muy costoso. Es por ello que existen empresas 

que se encargan de ofrecer a otras cierto porcentaje de toda la estructura necesaria para 

mantener y hacer uso de las bases de datos y el software que se comunique con ellas.


Así, también se suele denominar “la nube” al conjunto de estructuras y servicios que nos 

proveen determinadas empresas. Podemos distinguir los siguientes servicios a través de la 

nube, dependiendo de lo que estas empresas ofrezcan:

 



Dichos servicios son, IaaS, (Infrastructure as a service), donde la empresa permite gestionar 

la mayoría de los servicios, dejando el mantenimiento del sistema operativo, bases de datos, 

seguridad y aplicaciones al/los usuario/s.

PaaS, (Platform as a service), el cual se ofrece la gestión y mantenimiento de todo excepto

las aplicaciones, las cuales deberán ser instaladas y mantenidas por los usuarios.

SaaS, (Software as a service), donde la empresa da todo instalado y mantenido y el usuario 

sólo se encarga de encender y utilizar dicha máquina.



Ampliación   

Profundizaremos un poco más en la privacidad de nuestros datos en el almacenamiento en la

nube. Las políticas que rigen sobre nuestros datos están sujetas a las empresas que ofrecen

estos servicios, que también están influidas por el país en el que operan.

 

La mayoría de las grandes empresas que ofrecen servicios Cloud (Google, AWS,...) están de

acuerdo en que la seguridad de los servicios en la nube es una respondabilidad compartida

entre los clientes y la propia empresa. Estas responsabilidades también varían evidentemente

entre los distintos modelos Cloud como vemos en la siguiente imagen (Microsoft):

 


En cuanto a los distintos países, Europa va a la cabeza con el Reglamento General de 

Protección de Datos, que otorga a los usuarios un mayor control sobre la gestión de sus datos

personales por parte de las compañías. Estados Unidos no tiene en sí un consenso entre sus

distintos estados, y aunque en los últimos años se han aprobado leyes de privacidad del lado

de los usuarios (CCPA), sigue dando mucha libertad a las empresas para establecer sus

propios estándares.

 

En contraposición tenemos a China y su Ley de Seguridad Cibernética, que tiene algunos

puntos comunes con el RGPD, pero uno de los más polémicos es la obligación de los 

operadores de red de controlar la información divulgada por los usuarios, todo esto para

recabar dicha información y ver si está "prohibida de ser publicada".

 

Aunque confiar nuestros datos a entidades externas no está libre de riesgos, las empresas

invierten mucho capital en mejorar los sistemas de protección de datos en sus nubes, y sigue

siendo una opción más barata frente a configurar y mantener nuestros propios CTDs tanto 

domésticos como en empresas u organizaciones. Es por esto que cada vez más la tecnología

Cloud está terminando de establecerse en todo el mundo. 

 

Opinión al respecto 

Partiendo de la base de que el futuro está en la inteligencia Artificial y teniendo en cuenta la 
velocidad de expansión de la informática, podemos llegar a la conclusión de que las bases de 
datos enfocadas a la IA no tardarán en popularizarse, bases de datos enfocadas al de 
tratamiento y almacenamiento de grafos. ¿Por qué de grafos?
 

Se tratan estas bases de datos debido a que los grafos son ampliamente utilizados para la 

inteligencia artificial, un ejemplo de este tipo de bases de datos son las del ajedrez, cada nodo 

del grafo representa un tablero entero de ajedrez, la transición para llegar de un nodo a otro es 

muy simple, consta de un movimiento, por lo que trabajar sobre grafos es muy cómodo. 

A día de hoy existen muchas bases de datos llenas de grafos de partidas de ajedrez que se 

usan para entrenar inteligencias artificiales, estudiar aperturas…


En un futuro cercano, con el avance de la computación cuántica también se necesitarán bases 

de datos cuánticas y observando el comportamiento del ADN y de cómo es capaz de 

almacenar mucha información en muy poco espacio se puede definir un proceso de 

codificación de datos binarios hacia y desde cadenas de ADN sintetizadas. 


Referencias 

https://healthit.com.au/how-big-is-the-internet-and-how-do-we-measure-it/

https://www.quora.com/Why-is-the-cloud-called-the-cloud

https://he.net/3d-map/

https://evaluandocloud.com/seguridad-privacidad-la-nube-quien-la-responsabilidad/

Comentarios

Entradas populares de este blog

Tema 6 - Qué es el Business Intelligence: hacia el Big Data

Tema 1

Tema 4 - SEO/SEM, concepto y funcionamiento en Google