Les services de stockage AWS
Les services de stockage AWS sont regroupés en trois catégories : le stockage de fichiers, le stockage par blocs et le stockage d'objets. Dans le stockage de fichiers, les données sont stockées sous forme de fichiers dans une hiérarchie. Dans le stockage par blocs, les données sont stockées dans des blocs de taille fixe. Et dans le stockage d'objets, les données sont stockées sous forme d'objets dans des compartiments.
Stockage de fichiers
Vous connaissez peut-être le stockage de fichiers si vous avez utilisé les systèmes de stockage de fichiers tels que l'Explorateur de fichiers Windows ou le Finder sur macOS. Les fichiers sont organisés dans une hiérarchie arborescente composée de dossiers et de sous-dossiers.
Exemple : Si vous avez des centaines de photos de chat sur votre ordinateur portable, vous pouvez créer un dossier appelé Photos de chat
et placer les images à l'intérieur de ce dossier pour les organiser. Comme vous savez que ces images seront utilisées dans une application, vous souhaiterez peut-être placer le dossier Photos de chat
dans un autre dossier appelé Fichiers d'application
.
Chaque fichier contient des métadonnées telles que :
- Le nom du fichier
- La taille du fichier
- La date de création du fichier
Le fichier possède également un chemin d'accès, par exemple : computer/Application_files/Cat_photos/cats-03.png
. Lorsque vous devez récupérer un fichier, votre système peut utiliser le chemin d'accès pour le trouver dans la hiérarchie de fichiers.
Avantages du stockage de fichiers
- Accès centralisé aux fichiers
- Partage facile entre plusieurs ordinateurs hôtes
- Intégration avec les protocoles de communication existants
Cas d'utilisation du stockage de fichiers
Service web
Les solutions de stockage de fichiers dans le cloud suivent des protocoles courants au niveau des fichiers, des conventions de dénomination des fichiers et des autorisations que les développeurs connaissent bien. Par conséquent, le stockage de fichiers peut être intégré dans les applications web.
Analytique
De nombreuses charges de travail analytiques interagissent avec les données via une interface de fichier et s'appuient sur des fonctionnalités telles que le verrouillage des fichiers ou l'écriture sur des parties d'un fichier.
Média et divertissement
Le stockage de fichiers dans le cloud suit la sémantique des systèmes de fichiers existants. Par conséquent, il peut être utilisé pour :
- La production de contenu
- Les chaînes d'approvisionnement numériques
- Le streaming multimédia
- L'archivage
Répertoires de base
Les systèmes de stockage de fichiers dans le cloud respectent des protocoles courants au niveau des fichiers et des modèles d'autorisation standard. Par conséquent, les clients peuvent utiliser une approche "lift-and-shift" pour les applications qui ont besoin de cette fonctionnalité vers le cloud.
Stockage par blocs
Bien que le stockage de fichiers traite les fichiers comme une unité singulière, le stockage par blocs fractionne les fichiers en blocs de données de taille fixe appelés blocs possédant leurs propres adresses.
Caractéristiques :
- Chaque bloc est un élément de stockage de données individuel
- Les blocs sont adressables et peuvent être récupérés efficacement
- Aucune métadonnée supplémentaire n'est associée à chaque bloc (juste l'adresse)
Exemple de modification :
Si vous souhaitez modifier un caractère dans un fichier, il suffit de modifier le bloc ou la partie du fichier contenant le caractère. Cette facilité d'accès explique pourquoi les solutions de stockage par blocs sont rapides et utilisent moins de bande passante.
Cas d'utilisation du stockage par blocs
Charges de travail transactionnelles
Le stockage par blocs permet aux développeurs de mettre en place une base de données transactionnelle robuste, pouvant être mise à l'échelle et hautement efficace.
Conteneurs
Les développeurs utilisent le stockage par blocs pour stocker des applications conteneurisées dans le cloud.
Machines virtuelles
Le stockage par blocs prend en charge les hyperviseurs de machines virtuelles (VM) les plus courants.
Stockage d'objets
Avec le stockage d'objets, les fichiers sont stockés en tant qu'objets.
Caractéristiques :
- Structure plate (pas de hiérarchie de dossiers)
- Chaque objet contient un identifiant unique
- Métadonnées stockées avec les données
- Plus difficile de modifier une partie d'un objet (doit mettre à jour tout l'objet)
Cas d'utilisation pour le stockage d'objets
Archivage de données
Excellent pour la conservation des données à long terme.
Sauvegarde et restauration
Permet la réplication du contenu pour une continuité d'activité.
Contenu multimédia enrichi
Permet de stocker et distribuer efficacement des fichiers multimédias volumineux.
Amazon Elastic File System (Amazon EFS)
Amazon Elastic File System (Amazon EFS) est un système de fichiers « set-and-forget » qui :
- S'agrandit et rétrécit automatiquement
- Ne nécessite pas de gestion de capacité
- Peut être utilisé avec les services AWS et les ressources sur site
- Permet de connecter des milliers d'instances simultanément
- Offre des performances cohérentes
Avantages
- Interface web simple
- Configuration rapide
- Pas de frais initiaux
- Paiement à l'usage
- Choix de classes de stockage
Classes de stockage
Type | Classes Standard | Classes One Zone |
---|---|---|
Options | EFS Standard EFS Standard – Accès peu fréquent | EFS One Zone EFS One Zone – Accès peu fréquent |
Avantages | Résilience multi-AZ Haute durabilité | Économies Stockage dans une seule zone |
Amazon FSx
Service entièrement géré offrant :
- Fiabilité
- Sécurité
- Capacité de mise à l'échelle
- Fonctionnalités avancées
Options disponibles
- Amazon FSx pour NetApp ONTAP
- Amazon FSx pour OpenZFS
- Amazon FSx for Windows File Server
- Amazon FSx pour Lustre
Choix possible selon :
- Votre maîtrise du système
- Vos exigences de charge de travail
- Fonctionnalités nécessaires
- Profils de performances
Amazon EBS (Elastic Block Store)
Amazon EBS est un stockage de niveau bloc attachable à une instance Amazon EC2, comparable à un disque externe pour ordinateur.
Caractéristiques principales
- Détachable : Peut être déplacé entre instances EC2 dans la même zone
- Distinct : Persiste même en cas de panne de l'instance
- Taille limitée : Capacité maximale fixe (jusqu'à 64 To)
- Connexion 1 à 1 : Généralement attaché à une seule instance à la fois
Mise à l'échelle
- Augmentation possible jusqu'à 64 To maximum
- Possibilité d'attacher plusieurs volumes à une instance EC2
Cas d'utilisation
- Systèmes d'exploitation : Volumes de démarrage/racine
- Bases de données : Stockage persistant et performant
- Applications d'entreprise : Stockage haute disponibilité
- Big Data : Persistance des données et ajustements dynamiques
Types de volumes
Volumes SSD
Type | Description | Taille max | IOPS max | Débit max |
---|---|---|---|---|
gp3 | Usage général | 16 To | 16 000 | 1 000 Mio/s |
io2 | Hautes performances | 64 To | 256 000 | 4 000 Mio/s |
Volumes HDD
Type | Description | Taille max | Débit max |
---|---|---|---|
st1 | Haut débit | 16 To | 500 Mio/s |
sc1 | Économique | 16 To | 250 Mio/s |
Avantages
- Réplication automatique dans la zone de disponibilité
- Persistance des données
- Chiffrement pris en charge
- Modifications à chaud possibles
- Sauvegardes faciles
Instantanés EBS
- Sauvegardes progressives (seuls les blocs modifiés)
- Stockés de manière redondante dans Amazon S3
- Permettent de créer de nouveaux volumes identiques
- Gérés via la console Amazon EBS
Amazon S3 (Simple Storage Service)
Amazon S3 est une solution de stockage autonome indépendante du calcul, permettant d'accéder aux données depuis n'importe où sur le web.
Concepts clés
Compartiments (Buckets)
- Conteneurs pour stocker les objets
- Nécessaire avant tout chargement d'objet
- Identification unique par :
- Nom du compartiment
- Clé d'objet
- ID de version
Règles de nommage des compartiments
- Unicité globale : Nom unique dans toutes les régions AWS
- Longueur : 3 à 63 caractères
- Caractères autorisés :
- Lettres minuscules
- Chiffres
- Points (.)
- Traits d'union (-)
- Interdictions :
- Ne doit pas ressembler à une adresse IP
- Ne peut contenir "AWS" ou "Amazon"
- Non réutilisable avant suppression complète
Structure des objets
- Modèle plat : Pas de hiérarchie réelle
- Simulation de dossiers via :
- Préfixes de noms de clés
- Délimiteurs (/)
- Exemple :
testbucket/2022-03-01/AmazonS3.html
testbucket/2022-03-01/Cats.jpg
Cas d'utilisation principaux
-
Sauvegarde et stockage :
- Haute redondance
- Stockage des instantanés EBS
-
Hébergement multimédia :
- Jusqu'à 5 To par objet
- Nombre d'objets illimité
-
Distribution de logiciels :
- Hébergement d'applications téléchargeables
-
Lacs de données :
- Scalabilité de Go à Po
- Paiement à l'usage
-
Sites web statiques :
- Hébergement de HTML/CSS
- Scripts côté client
-
Contenu statique :
- Accès web permanent
- Support des gros fichiers
Sécurité dans Amazon S3
Protection par défaut
- Toutes les ressources S3 (compartiments et objets) sont privées par défaut
- Accessibles uniquement par le compte/utilisateur qui les a créées
Gestion des accès
Politiques IAM et S3
- Politiques basées sur les ressources : Attachées aux compartiments/objets
- Politiques utilisateur : Attachées aux utilisateurs/groupes/roles IAM
Politiques de compartiment S3
- Format JSON (similaire aux politiques IAM)
- Applicables uniquement aux compartiments S3
- S'appliquent à tous les objets du compartiment
Cas d'utilisation :
- Accès inter-comptes sans rôles IAM
- Contournement des limites de taille des politiques IAM
Chiffrement
- Chiffrement automatique de tous les objets lors du chargement
- Chiffrement côté serveur avec clés gérées par S3
- Service inclus sans frais supplémentaires
Classes de stockage S3
Classe de stockage | Description | Cas d'utilisation |
---|---|---|
S3 Standard | Stockage à usage général | Applications cloud, sites web dynamiques, CDN |
S3 Intelligent-Tiering | Niveaux automatiques (fréquent/peu fréquent/archivage) | Données avec motifs d'accès inconnus/changants |
S3 Standard-IA | Accès peu fréquent mais rapide | Sauvegardes long terme, reprise après sinistre |
S3 One Zone-IA | Stockage sur une seule AZ (moins cher) | Copies secondaires, données re-créables |
S3 Glacier Instant Retrieval | Archivage avec récupération en ms | Archives rarement consultées |
S3 Glacier Flexible Retrieval | Récupération en 1-5 min (batch gratuit 5-12h) | Sauvegardes annuelles, DR |
S3 Glacier Deep Archive | Solution la moins chère (récupération 12h) | Conformité réglementaire (7-10+ ans) |
S3 Outposts | Stockage sur site avec API S3 | Résidence locale des données |
Notes :
- Les classes Glacier optimisent les coûts pour l'archivage
- Standard/IA répliquent sur ≥3 AZ vs One Zone (1 AZ)
- Intelligent-Tiering adapte automatiquement le niveau