examlab .net 最も価値のある認定資格への最も効率的な道。
このノートについて 約 21 分

AWSストレージサービス

4,120 語 · 約 21 分の読書 ·

CLF-C02に向けたAWSストレージサービスの完全マスター:Amazon S3のストレージクラス、Amazon EBSブロックボリューム、Amazon EFSファイルシステム、Amazon FSx、Storage Gateway、AWS Backupの頻出試験トラップとシナリオ問題を網羅。

20問の模擬問題に挑戦 → 無料 · 登録不要 · CLF-C02

AWSストレージサービスは、オブジェクト・ブロック・ファイルという3つの基本パラダイムに加え、ハイブリッドとバックアップの層から構成される。CLF-C02のタスク3.6「AWSストレージサービスを特定する」では、与えられたシナリオに対して正しいAWSストレージサービスを選択でき、Amazon S3のストレージクラスを即座に読み取り、「Amazon S3 vs Amazon EBS vs Amazon EFS」の古典的な混同を解消できるかどうかが問われる。本学習ノートでは、試験範囲に含まれるすべてのAWSストレージサービスを解説し、最も見落とされやすいトラップを掘り下げ、高頻度キーワード(Amazon S3、Amazon EBS、Amazon EFS、Amazon FSx、S3ストレージクラス)を十分に反復することで、問題文を読んで20秒以内に答えが浮かぶよう仕上げる。

AWSストレージサービスはドメイン3の重みの約34%を占め、コミュニティデータでもドメイン3で最も出題頻度の高いトピック(言及数340、難易度0.75)と示されていることから、ここを軽視することは確実な失点につながる。このガイドを最初から最後まで活用してほしい。

AWSストレージサービスとは何か?

AWSストレージサービスは、基盤となるディスク・ファイルサーバー・テープロボットを自前で運用することなく、データを永続化・共有・アーカイブ・保護できるマネージドサービスである。3つのストレージパラダイムと1つの保護層を備えている。

  • オブジェクトストレージ — Amazon S3。データはバケットと呼ばれるフラットな名前空間にオブジェクト(ファイル+メタデータ+一意のキー)として格納され、HTTPS経由でS3 APIにアクセスする。
  • ブロックストレージ — Amazon EBS。データは仮想ボリューム上に固定サイズのブロックとして格納され、単一のAmazon EC2インスタンスに接続した生ディスクのように振る舞う。
  • ファイルストレージ — Amazon EFSおよびAmazon FSx。データは階層型ファイルシステムに格納され、複数のクライアントがNFS(EFS)またはSMB/Lustre/NFS/ZFS(FSx)プロトコルでマウントできる。
  • ハイブリッド+データ保護 — AWS Storage Gatewayがオンプレミスとクラウドを橋渡しし、AWS Backupがバックアップを集約管理し、AWS Elastic Disaster Recovery(DRS)がマシンをレプリケートしてリカバリに備える。

AWSストレージサービスとデータベースの違いに注意すること。データベース(RDS、DynamoDB)は構造化データに対してクエリAPIを公開するが、AWSストレージサービスはバイトレベル・ファイルレベル・オブジェクトレベルのAPIで生のコンテンツを扱う。この境界線は常に明確に意識しておくこと。CLF-C02では Amazon S3とAmazon RDSを混同させる誤答選択肢が繰り返し登場する。

3つのストレージパラダイムを一覧で比較

パラダイム AWSサービス例 単位 プロトコル 最適用途
オブジェクト Amazon S3 オブジェクト(ファイル+キー+メタデータ) HTTPS/REST API バックアップ、静的アセット、データレイク、メディア
ブロック Amazon EBS 512バイト〜4 KiBブロック EC2へブロックデバイスとして接続 ブートボリューム、データベース、トランザクション系アプリ
ファイル Amazon EFS、Amazon FSx ファイルとフォルダ NFS、SMB、Lustre 共有ファイル、Linux/Windowsワークロード、HPC
オブジェクト・ブロック・ファイルストレージはAWSストレージサービスの3大パラダイムである。Amazon S3はオブジェクト、Amazon EBSはブロック、Amazon EFSとAmazon FSxはファイル。このマッピングを暗記せよ。CLF-C02のストレージ問題で最も多く問われる知識だ。

やさしい解説: AWSストレージサービス — 3つの日常的な比喩

Analogy 1 — 図書館の本棚(Amazon S3 = 全書架の本)

巨大な公立図書館を思い浮かべてほしい。すべての本にバーコード(S3のキー)が貼られており、あなた自身が書架に入ることはない。バーコードをカウンター(S3 API)に渡すと、司書(S3のバックエンド)が本を持ってくる。Amazon S3はまさにそのように動作する。ファイルの中身が本のページ、キーがバーコード、メタデータが表紙シール(content-type・暗号化設定・タグ)、バケットが図書館の分館だ。書架のゾーンがストレージクラスに対応する。Standard は司書室のすぐそばの閲覧コーナー、Glacier Deep Archiveは地下の書庫だ。図書館に「ドライブをマウント」することはできない。本の貸し出しはカウンター経由でしか行えない。これが、Amazon S3がEC2のブートディスクになれない理由だ。

Analogy 2 — 机の引き出し(Amazon EBS = 1台の机に固定された個人引き出し)

EBSボリュームは、1台の机(EC2インスタンス)にボルトで固定された引き出しだ。使えるのはその机に座る人だけで、別の机に移したければ引き出しを外してオフィスを歩いて移動し、再度固定する必要がある。引き出しの中身を写真に収めること(EBSスナップショット)ができ、その写真を図書館(S3)に預けておける。引き出しには品質グレードがある。プラスチックは安いが遅く(sc1)、金属製が日常向け(st1、gp3、gp2)、チタン製は高価だが爆速だ(io2、io1)。引き出しは物理的に机に結びついているため、EBSボリュームは単一のアベイラビリティゾーン(AZ)内にしか存在できない。AZをまたいで移動するにはスナップショットとリストアが必要だ。

Analogy 3 — フロア共有の書類キャビネット(Amazon EFS = 全員が使える共有キャビネット)

Amazon EFSは、廊下に置かれた巨大な共有書類キャビネットだ。フロアのどの社員(EC2インスタンス)でも同時に開けて読み書きできる。このキャビネットは自動的に他のフロアにもコピーされる(マルチAZ)ため、1フロアが火事になっても全データが失われない。ただし、このキャビネットはLinux NFS対応の鍵しか受け付けない。Windows社員には別の部屋(Amazon FSx for Windows File Server)が必要で、HPCエンジニアには専用の金庫(Amazon FSx for Lustre)が要る。

試験向けの即決ルール:ストレージの問いが出たら「本(S3オブジェクト)か、個人の引き出し(EBSブロック)か、共有キャビネット(EFS/FSxファイル)か?」と問いかけよ。

AWSストレージサービスの設計原則

AWSストレージサービスは、全製品に共通するいくつかの設計思想を持つ。

  1. マネージド — AWSがハードウェア・レプリケーション・パッチ適用・容量プロビジョニングを担当する。データ・アクセス制御・暗号化キーはお客様が担当する。
  2. デフォルトで高い耐久性 — ほとんどのAWSストレージサービスは、複数デバイス・複数施設にまたがってデータをレプリケートする。Amazon S3は保存オブジェクトに99.999999999%(11個の9)の耐久性を提供する。
  3. リージョンスコープ vs AZスコープ — Amazon S3はリージョン単位(オブジェクトは選択したリージョン内の少なくとも3 AZに自動的に保存)。Amazon EBSはAZスコープ(1ボリュームは1 AZに存在)。Amazon EFSはリージョン単位(リージョンの各AZにマウントターゲットを作成)。
  4. 従量課金 — ストレージ容量・リクエスト・データ転送量、場合によってはデータ取り出し(Glacier)に課金される。
  5. セキュリティ — 保存時の暗号化(S3のSSE-S3・SSE-KMS・SSE-C、EBS暗号化、EFS暗号化、FSx暗号化)および転送中のTLS。
Amazon S3はリージョン単位 — AWSが自動的に少なくとも3つのアベイラビリティゾーンにコピーを保存する。Amazon EBSはAZスコープ — 単一のボリュームは必ず1つのAZに存在し、別のAZのEC2インスタンスにはスナップショットなしでは接続できない。Amazon EFSはリージョン単位 — リージョンの各AZにマウントターゲットを公開する。このスコープの問いはほぼすべてのCLF-C02受験で出題される。

Amazon S3 — オブジェクトストレージの詳解

Amazon S3(Amazon Simple Storage Service)はAWSの主力オブジェクトストレージサービスであり、CLF-C02で最も多く問われるAWSストレージサービスだ。バケットに任意のデータの塊(1オブジェクトあたり最大5 TB)を入れ、キーで参照する。

Amazon S3 の重要ファクト

  • 耐久性: 99.999999999%(11個の9)— S3 One Zone-IA を除く全ストレージクラスで同様。
  • 可用性: ストレージクラスによって異なる。S3 Standard は99.99%、S3 One Zone-IAは99.5%。
  • オブジェクトサイズ: 1オブジェクトあたり最大5 TB、1回のPUTは最大5 GB、100 MB超はマルチパートアップロード。
  • バケット名: 全AWSアカウントを通じてグローバルに一意。
  • アクセス: HTTPS API、S3コンソール、AWS CLI、SDK — ブロックデバイスとしてマウントは不可。
  • 名前空間: フラット構造。「フォルダ」はUIの錯覚であり、/ はキーの1文字に過ぎない。

Amazon S3 の主要機能

  • バージョニング — オブジェクトのすべてのバージョンを保持。誤削除・上書きから保護する。
  • ライフサイクルポリシー — オブジェクトをストレージクラス間で自動移行するか、N日後に期限切れにする。
  • Cross-Region Replication(CRR)Same-Region Replication(SRR) — 非同期オブジェクトコピー。
  • 暗号化 — SSE-S3(S3管理キー)、SSE-KMS(KMS管理キー)、SSE-C(お客様提供キー)、クライアントサイド。
  • アクセス制御 — バケットポリシー、IAMポリシー、ACL、S3 Block Public Access、署名付きURL。
  • S3 Object Lock — 規制対応ワークロード向けWORM(Write Once Read Many)。
  • S3 Transfer Acceleration — CloudFrontエッジロケーションを活用した長距離アップロードの高速化。
  • S3 Event Notifications — オブジェクトの作成・削除でLambda・SQS・SNSをトリガー。
試験シナリオで「静的Webサイトをホスティングしたい」「画像をバックアップしたい」「オンプレミスのデータをアーカイブしたい」「データレイクを構築したい」といった記述が出たら、答えはほぼ必ずAmazon S3だ。「大規模な静的コンテンツ」「耐久性の高いアーカイブ」という言葉が見えたら、すぐにAmazon S3のフラグを立てよ。

Amazon S3 ストレージクラス

S3ストレージクラスはCLF-C02の定番キーワードトラップだ。覚えるべき7種類のストレージクラスを、最も「熱い」ものから「冷たい」ものへ順に並べた。

  1. S3 Standard — 頻繁なアクセス向け、ミリ秒レベルの取り出し、可用性99.99%。デフォルト。
  2. S3 Intelligent-Tiering — アクセスパターンに基づいてオブジェクトを自動的にアクセス層間で移動。オブジェクトあたり少額のモニタリング料がかかるが、ライフサイクルルール不要。
  3. S3 Standard-IA(Infrequent Access) — Standardより低いストレージコスト、取り出し時にGB単位の料金、可用性99.9%。最低保存期間30日、最低オブジェクトサイズ128 KB。
  4. S3 One Zone-IA — Standard-IAと同様だが単一AZにのみデータを保存。可用性99.5%、20%安価。再作成可能なデータ向け。
  5. S3 Glacier Instant Retrieval — ミリ秒取り出しのアーカイブ。四半期に1回程度アクセスするデータ向け。
  6. S3 Glacier Flexible Retrieval — 数分〜数時間の取り出し(Expedited 1〜5分、Standard 3〜5時間、Bulk 5〜12時間)のアーカイブ。
  7. S3 Glacier Deep Archive — 最安値のS3ストレージクラス。取り出しに12〜48時間。年1〜2回しかアクセスしないコンプライアンス向けアーカイブ。

S3ストレージクラス早見表

S3ストレージクラス 取り出し時間 最低保存期間 用途
S3 Standard ミリ秒 なし ホットデータ、Webサイト
S3 Intelligent-Tiering ミリ秒〜時間 なし アクセスパターン不明
S3 Standard-IA ミリ秒 30日 月1回程度のバックアップ
S3 One Zone-IA ミリ秒 30日 再作成可能・非重要データ
S3 Glacier Instant ミリ秒 90日 四半期アクセスのアーカイブ
S3 Glacier Flexible 1分〜12時間 90日 災害復旧データ
S3 Glacier Deep Archive 12〜48時間 180日 7〜10年コンプライアンス
Amazon S3の耐久性は11個の9(99.999999999%)— ほぼすべてのS3ストレージクラスで同様。1,000万オブジェクトを保存して1万年に1オブジェクトしか失われない計算だ。可用性は異なり、ストレージクラスによって変わる:99.99%(Standard)、99.9%(IA)、99.5%(One Zone-IA)。試験の誤答選択肢は耐久性と可用性の数値を入れ替えて混乱させてくる。

S3ライフサイクルポリシーとバージョニング

S3ライフサイクルポリシーは、Amazon S3にオブジェクトの移行や期限切れを指示する自動化ルールだ。典型的な流れ:

0日目    → S3 Standard
30日目   → S3 Standard-IA
90日目   → S3 Glacier Flexible Retrieval
365日目  → S3 Glacier Deep Archive
2555日目 → 期限切れ(削除)

バージョニングはオブジェクトのすべてのバージョンを保持する。バケットで一度有効にすると無効化はできず、一時停止のみ可能だ。バージョニング+MFA Deleteは「誤削除から保護したい」シナリオへの定番回答だ。

S3 Intelligent-Tieringは、手動のライフサイクルルールなしにコストを最適化するために設計されている。「アクセスパターンが不明で、ライフサイクルルールを設定せずにコストを自動最適化したいストレージクラスはどれか?」という問いへの答えはS3 Intelligent-Tieringであり、S3 Standard-IAではない。Intelligent-Tieringには取り出し料金も最低保存期間もないが、オブジェクトあたり少額の月次モニタリング料がかかる。

S3レプリケーション

  • Cross-Region Replication(CRR) — 別のAWSリージョンのバケットにオブジェクトをレプリケート(コンプライアンス、災害復旧、レイテンシ低減)。
  • Same-Region Replication(SRR) — 同一リージョン内でレプリケート(ログ集約、アカウント分離)。
  • どちらも送信元・送信先バケットでバージョニングが有効である必要がある。
  • レプリケーションは非同期で、ルール有効化後に作成されたオブジェクトにのみ適用(既存オブジェクトはS3 Batch Replicationで対応可能)。

Amazon EBS — EC2向けブロックストレージ

Amazon EBS(Amazon Elastic Block Store)は、Amazon EC2インスタンス向けの永続的なブロックレベルストレージボリュームを提供する。Amazon EBSはEC2インスタンスに接続された仮想ディスクと考えるとよい。

Amazon EBSの重要ファクト

  • スコープ: アベイラビリティゾーン。Amazon EBSボリュームは必ず1つのAZに存在し、同じAZのEC2インスタンスにしか接続できない。
  • 接続: 1ボリュームを1 EC2インスタンスに接続(クラスタリングワークロード向けio1/io2 Multi-Attachは例外)。
  • サイズ: ボリュームタイプにより1 GiB〜64 TiB。
  • 永続性: インスタンスのライフサイクルを超えてデータが保持される(DeleteOnTermination=trueの場合を除く)。
  • スナップショット: Amazon S3に保存されるポイントインタイムバックアップ(AWSが管理しており、バケットは見えない)。スナップショットはリージョン間でコピーでき、クロスリージョンDRを実現できる。
  • 暗号化: KMS経由のAES-256。暗号化されたスナップショットから作成されたボリュームは自動的に暗号化される。

Amazon EBSボリュームタイプ

タイプ カテゴリ 最大IOPS 用途
gp3 SSD 汎用 16,000 デフォルト選択、ほとんどのワークロード、ブートボリューム
gp2 SSD 汎用 16,000 旧デフォルト、IOPSがサイズに応じてスケール
io2 Block Express SSD プロビジョニドIOPS 256,000 ミッションクリティカルなDB、SAP HANA
io1 SSD プロビジョニドIOPS 64,000 ハイパフォーマンスDB
st1 HDD スループット最適化 500 ビッグデータ、ログ処理、データウェアハウス
sc1 HDD コールド 250 アクセス頻度の低い最安値データ
Amazon EBSスナップショットはAmazon S3に保存されるが、バケットはユーザーには見えない。これがEBSスナップショットを別リージョンにコピーできる理由だ — AWSが管理するS3レイヤーを経由するからだ。スナップショットは増分式で、最初のスナップショット以降は変更されたブロックのみがコピーされるため、コスト効率が高い。

EC2 Instance Store と Amazon EBSの比較

  • Instance store — ホストマシンに物理的に接続、エフェメラル(停止・終了で消失)、ネットワークレイテンシゼロ、インスタンスに無料付属。
  • Amazon EBS — ネットワーク接続型ブロックストレージ、永続的、別途有料。

「一時データに最高のIOPS」という問いならInstance storeが勝ることもある。永続性やブートボリュームが必要なら、Amazon EBSが答えだ。

Amazon EFS — 共有NFSファイルストレージ

Amazon EFS(Amazon Elastic File System)は、Linuxワークロード向けのフルマネージドNFSv4ファイルシステムだ。複数のEC2インスタンス、さらにはVPNやDirect Connect経由のオンプレミスサーバーも、同一のAmazon EFSファイルシステムを同時にマウントできる。

Amazon EFSの重要ファクト

  • プロトコル: NFSv4.1(Linux専用)。Windowsには非対応。
  • スコープ: リージョン。VPCの各AZにマウントターゲットを作成。
  • スケーリング: プロビジョニング不要で、MBからPBまで自動スケール。
  • パフォーマンスモード: General Purpose(デフォルト、低レイテンシ)とMax I/O(高スループット、やや高レイテンシ)。
  • スループットモード: Bursting(デフォルト)、Provisioned、Elastic。
  • ストレージクラス: EFS Standard、EFS Standard-IA、EFS One Zone、EFS One Zone-IA(ライフサイクル管理でアクセスの少ないファイルを自動的にIAへ移動)。
  • 料金: 使用した分だけ支払う — 事前プロビジョニング不要。

Amazon EFSの典型的なユースケース

  • 複数のWebサーバーが同一のアセットライブラリを共有するコンテンツ管理システム。
  • 開発者のホームディレクトリ。
  • Auto Scalingグループ全体で共有するアプリケーション設定やシークレット。
  • コンテナの永続ストレージ(ECS/EKS)。
  • 共有POSIX ファイルシステムが必要な分析・ビッグデータワークロード。
Amazon EFSはLinux専用(NFSプロトコル)だ。シナリオに「Windows File Serverの共有ドライブ」または「SMBプロトコル」とある場合、正しいAWSストレージサービスはAmazon FSx for Windows File Serverであり、Amazon EFSではない。「EFSは汎用的に聞こえる」という先入観でEFSを選ぶと失点する。

Amazon FSx — マネージド専用ファイルシステム

Amazon FSxはサードパーティ製ファイルシステムのマネージドファミリーだ。CLF-C02の試験範囲には4つのバリアントがある。

Amazon FSxバリアント プロトコル 主な用途
Amazon FSx for Windows File Server SMB / NTFS Windowsアプリ、Active Directory統合、SharePoint
Amazon FSx for Lustre Lustre HPC、ML学習、ゲノミクス、金融モデリング
Amazon FSx for NetApp ONTAP NFS、SMB、iSCSI AWSへリフトアンドシフトするNetAppエンタープライズ顧客
Amazon FSx for OpenZFS NFS ZFSスナップショット/クローンが必要なLinuxワークロード

Amazon FSxの試験ポイント

  • Windows+SMB+Active Directory → Amazon FSx for Windows File Server
  • HPC+Lustre+サブミリ秒レイテンシ+数百GB/sスループット → Amazon FSx for Lustre
  • NetApp SnapMirror / SnapVault / FlexClone要件 → Amazon FSx for NetApp ONTAP
  • Linux ZFSクローン/スナップショット → Amazon FSx for OpenZFS
「Amazon S3からデータを低レイテンシでストリーミングするディープラーニング学習」というシナリオの答えはAmazon FSx for Lustreだ。FSx for LustreはS3バケットに直接リンクしてオブジェクトをファイルとして処理できる。これは繰り返し出題されるシナリオ問題だ。

AWS Storage Gateway — ハイブリッドストレージ

AWS Storage Gatewayは、オンプレミスのアプリケーションをAWSストレージサービスに接続するハイブリッドクラウドストレージサービスだ。オンプレミスに仮想またはハードウェアアプライアンスを展開し、ホットデータをローカルにキャッシュしながら非同期でAWSにデータを移動する。

AWS Storage Gatewayのモード

  • S3 File Gateway — NFS/SMB経由でファイルをオンプレミスに公開し、Amazon S3にオブジェクトとして保存。クラウドの耐久性が必要なファイルベースワークロード向け。
  • FSx File Gateway — Amazon FSx for Windows File Serverのオンプレミスキャッシュ。
  • Volume Gateway — iSCSIブロックボリュームをオンプレミスに公開(CachedとStoredの2モード)。Amazon S3をバックエンドとし、Amazon EBSスナップショットとしてポイントインタイムスナップショットを作成。
  • Tape Gateway — 物理テープを置き換えるバーチャルテープライブラリ(VTL)。バックアップをS3に送り、S3 Glacier/Glacier Deep Archiveにアーカイブ。NetBackup、Veeam、Veritasなどにドロップイン対応。

典型的な試験シナリオ:「企業はオンプレミスのバックアップソフトウェアで物理テープに書き込んでいる。テープロボットを廃止してアーカイブをクラウドに移したい。」→ AWS Storage Gateway Tape Gateway

AWS Backup — 一元化されたバックアップ

AWS Backupはフルマネージドのポリシー駆動型バックアップサービスで、以下を含む15以上のAWSストレージサービスおよびコンピューティングサービスのバックアップを一元化・自動化する。

  • Amazon EBSボリューム
  • Amazon EC2インスタンス(アプリケーション整合性)
  • Amazon RDS / Aurora / DynamoDB
  • Amazon EFS
  • Amazon FSx
  • Storage Gatewayボリューム
  • Amazon S3(オブジェクトレベル)
  • AWS Storage Gateway経由のVMwareワークロード

AWS Backupの機能

  • バックアッププラン — スケジュール・保持期間・コールドストレージへのライフサイクル移行を設定。
  • クロスリージョンコピー および クロスアカウントコピー でDRを実現。
  • AWS Backup Vault Lock — バックアップのWORM保護(コンプライアンス)。
  • AWS Backup Audit Manager — バックアップのポリシー準拠状況を監視。
「Amazon EBS、Amazon RDS、Amazon EFS、Amazon DynamoDB、AWS Storage Gatewayのバックアップを1つの保持ポリシーで一元管理するサービスはどれか?」という問いへの答えは AWS Backup であり、Amazon S3ライフサイクルルールや個別サービスのバックアップではない。AWS BackupはAWSストレージサービスを横断する一元化されたバックアッププレーンだ。

AWS Elastic Disaster Recovery(AWS DRS)

AWS Elastic Disaster Recovery(旧CloudEndure Disaster Recovery)は、災害発生後にサーバー(物理・仮想・クラウド)をAWSにリカバリするサービスだ。送信元マシンをAWSアカウント内のステージングエリア(通常は安価なAmazon EBSステージングボリューム)にブロックレベルで継続的にレプリケートし、フェイルオーバー時にオンデマンドでフルキャパシティのレプリカを起動する。

試験での位置づけ:

  • AWS Backup → スケジュールされたバックアップ(RPO 数分〜数時間、RTO 数時間〜数日)
  • AWS DRS → リアルタイム災害復旧(RPO 秒単位、RTO 数分)
  • AWS Storage Gateway → 日常的なハイブリッドストレージ(純粋なDRではない)

比較:Amazon S3 vs Amazon EBS vs Amazon EFS vs Amazon FSx

これはCLF-C02で最も頻繁に問われるAWSストレージサービスの問題パターンだ。この表を頭に叩き込もう。

属性 Amazon S3 Amazon EBS Amazon EFS Amazon FSx
パラダイム オブジェクト ブロック ファイル ファイル
アクセス方式 HTTPS API EC2のブロックデバイス NFSマウント SMB / NFS / Lustre
スコープ リージョン AZ リージョン AZまたはMulti-AZ(FSxバリアントによる)
同時接続クライアント数 数千 1 EC2(通常) 多数のEC2 多数のEC2/オンプレミス
耐久性 11個の9 AZ内でレプリケート 11個の9(Multi-AZ) レプリケート
OS対応 問わない(API) 問わない Linuxのみ Windows/Linux(バリアントによる)
典型的なサイズ 無制限 1 GiB〜64 TiB PB PB
価格スケール コールドデータで最安値 中程度 GBあたりEBSより高い プレミアム
主な試験のヒント 「静的コンテンツ/バックアップ/アーカイブ」 「EC2にディスクを接続」 「EC2間でファイルを共有(Linux)」 「Windowsファイル共有/HPC Lustre」

オブジェクト vs ブロック vs ファイル — 30秒判断ルール

  • オブジェクト → 「HTTP API経由で取り出すファイルを保存したい」→ Amazon S3
  • ブロック → 「1台のEC2インスタンスにハードドライブを接続したい」→ Amazon EBS
  • ファイル → 「複数のマシンが同一のファイルシステムを参照する必要がある」→ Amazon EFS(Linux)またはAmazon FSx(Windows/HPC)

AWSストレージサービスの頻出試験トラップ

CLF-C02のほぼすべての受験でAWSストレージサービスの問題が4〜6問出題される。以下のトラップを認識しておくこと。

  1. Amazon S3はEC2インスタンスをブートできない — Amazon EBS(またはInstance store)が必要。「EC2ブートボリューム」と書かれた問いへの答えは常にAmazon EBS。
  2. Amazon EBSはAZ間で共有できない。 異なるAZの2台のEC2インスタンスが同じディスクを必要とする場合、答えはAmazon EBS ではなくAmazon EFS(またはFSx)。
  3. Amazon EFSはLinux専用、Amazon FSx for Windows File ServerはWindows専用。
  4. 耐久性≠可用性。 11個の9は耐久性(データ損失の確率)。可用性は別の数値で低い。
  5. S3 Intelligent-Tiering が答えになるのは、「アクセスパターンが不明または変動し、ライフサイクルルールを設定したくない」という問いのとき。
  6. S3 One Zone-IA はAZが破壊されるとデータが失われる — 再作成可能なデータにのみ使用すること。
  7. Amazon EBSスナップショット はS3に保存されるがバケットは見えない。増分式だ。
  8. AWS Storage Gateway Tape Gateway はバックアップソフトウェアの物理テープを置き換える。
  9. AWS Backup は一元化されたプレーン — 個別サービスのスナップショットと混同しないこと。
  10. Amazon S3 Glacier Deep Archive は最安値だが最も遅い(取り出しに12〜48時間)。
「LinuxウェブサーバーのEC2インスタンスのブートボリュームとして使用するAWSストレージサービスはどれか?」という問いでは、「Linux」という言葉に引っ張られてAmazon EFSを選ぶ罠がある。誤りだ。ブートボリュームにはブロックストレージが必要 → Amazon EBS。Amazon EFSはデータ共有サービスであり、ブートディスクではない。問いの中で「boot(ブート)」を最初に確認してから判断せよ。

AWSストレージサービス vs データベースサービス — 範囲の境界線

これはタスク3.6 vs タスク3.4の境界線トラップだ。覚えておくこと:

  • Amazon S3はAWSストレージサービスであり、データベースではない。SQL・クエリエンジン・トランザクション機能はない。
  • Amazon DynamoDBはデータベースであり、AWSストレージサービスではない — データを保存するとはいえ。
  • Amazon EBSはEC2向けのAWSストレージ。Amazon RDSはAmazon EBSを内部で使用するが、データベースサービスとして分類される。

問いに「バックアップファイルを保存する」とある → Amazon S3。「SQLで構造化レコードをクエリする」とある → データベースサービス。

AWSストレージサービスの重要な数字と必須暗記ファクト

  • Amazon S3の耐久性:11個の9(99.999999999%)
  • Amazon S3の最大オブジェクトサイズ:5 TB。1回のPUTの最大:5 GB
  • Amazon S3のストレージクラス数:7種(Standard、Intelligent-Tiering、Standard-IA、One Zone-IA、Glacier Instant、Glacier Flexible、Glacier Deep Archive)
  • S3 Glacier Deep Archiveの取り出し時間:12〜48時間
  • S3 Standardの可用性:99.99%
  • Amazon EBSのスコープ:1 AZ
  • Amazon EBSのボリュームタイプ:gp3、gp2、io2、io1、st1、sc1
  • Amazon EFSのプロトコル:NFSv4.1、Linuxのみ
  • Amazon FSxのバリアント:Windows File Server、Lustre、NetApp ONTAP、OpenZFS
  • AWS Storage Gatewayのモード:S3 File、FSx File、Volume(Cached/Stored)、Tape
試験当日までに焼き付けておくAWSストレージサービスの数字:S3耐久性11個の9、S3最大オブジェクト5 TB、S3ストレージクラス=7種、EBSはAZスコープ、EFSはLinux-NFS、FSxは4バリアント(Windows/Lustre/ONTAP/OpenZFS)、Storage Gatewayは4モード(S3 File / FSx File / Volume / Tape)。これらの数値は試験の選択肢にそのまま登場する。

AWSストレージサービスの価格シグナル

価格を計算する必要はないが、相対的な順序は把握しておく必要がある。

  • GB-月あたり最安値 — Amazon S3 Glacier Deep Archive
  • GB-月あたり最高値 — Amazon FSx for Windows/Lustre(プレミアムマネージドファイル)
  • Amazon EBS > Amazon S3 Standard(永続ストレージとして比較したGB単価)
  • Amazon S3 Standard-IA / One Zone-IA はGB単価がStandardより安いが取り出し料金が発生
  • AWSストレージサービスへのデータ転送(IN)は無料。インターネットへのデータ転送(OUT)は有料
  • クロスAZおよびクロスリージョンのレプリケーションには追加費用がかかる

AWSストレージサービスと他のCLF-C02トピックとのつながり

  • コンピューティング(3.3) — EC2はブロック用にEBS、共有ファイル用にEFS/FSxを使用。LambdaはS3イベントを読み取る。
  • データベース(3.4) — RDSとDynamoDBは内部ストレージを持つが別に分類。AWS Backupはデータベースとストレージにまたがる。
  • ネットワーク(3.5) — プライベートアクセス用のS3エンドポイント(Gateway VPC Endpoint)。Storage GatewayはVPNまたはDirect Connectを使用。
  • セキュリティ(2.4) — Amazon MacieがS3をスキャンしてPIIを検出。KMSがS3・EBS・EFS・FSxを暗号化。
  • 移行(1.3) — AWS Snow Family(Snowcone、Snowball、Snowmobile)がPBスケールのデータをAmazon S3に転送。DataSyncがファイルシステムを移行。Storage Gatewayは継続的なハイブリッド接続向け。

AWSストレージサービスの演習シナリオパターン

パターン1:「企業はコンプライアンスログを年に最大1回しかアクセスせず、7年間保持したい。」→ S3 Glacier Deep Archive と7年のライフサイクル期限切れルール。

パターン2:「3つのAZに分散した20台のEC2 Linux Webサーバーが同一のコンテンツディレクトリを読み書きする必要がある。」→ Amazon EFS

パターン3:「WindowsアプリケーションサーバーにActive Directory統合を持つ高性能SMB共有が必要だ。」→ Amazon FSx for Windows File Server

パターン4:「データベースはEC2上で動作し、1 TBボリュームで20,000の一貫したIOPSが必要だ。」→ Amazon EBS io2(またはio1)

パターン5:「企業はVeeamが使用するオンプレミスのテープライブラリを置き換えたい。」→ AWS Storage Gateway Tape Gateway

パターン6:「企業はAmazon EBS・Amazon RDS・Amazon DynamoDBにまたがる単一のバックアップポリシーが必要だ。」→ AWS Backup

パターン7:「アクセスパターンが不明なオブジェクトのコストを最小化したい。ライフサイクルルールは設定しない。」→ S3 Intelligent-Tiering

パターン8:「再作成が容易なデータに最もコストが安いAmazon S3ストレージ。」→ S3 One Zone-IA

FAQ — AWSストレージサービス頻出問題

Q1: Amazon S3とAmazon EBSの違いは何か?

Amazon S3はHTTPS API経由でアクセスするオブジェクトストレージで、ディスクとしてマウントはできない。Amazon EBSはハードドライブのように単一のEC2インスタンスに接続するブロックストレージだ。Amazon S3はファイル・バックアップ・静的コンテンツ・データレイクに使用する。Amazon EBSはEC2のブートボリュームやEC2上で動作するデータベースに使用する。

Q2: 1つのAmazon EBSボリュームを複数のEC2インスタンスに接続できるか?

通常はできない。Amazon EBSはAZスコープであり、1 EC2インスタンスに接続する。例外として、同一AZ内のクラスタリングワークロード向けにio1/io2ボリュームのMulti-Attachがあるが、CLF-C02の範囲外だ。複数インスタンスでの共有にはAmazon EFS(Linux NFS)またはAmazon FSxを使用する。

Q3: 最も安いS3ストレージクラスとそのトレードオフは?

S3 Glacier Deep Archive が最安値だ。トレードオフは取り出し時間で12〜48時間、最低保存期間180日、GBあたりの取り出し料金がかかる。滅多にアクセスしない規制対応アーカイブにのみ使用すること。

Q4: Amazon S3はリージョン単位かグローバルか?

Amazon S3はリージョン単位のAWSストレージサービスで、オブジェクトは選択したリージョンに保存され、少なくとも3つのアベイラビリティゾーンにレプリケートされる。ただし、バケット名はすべてのAWSアカウントを通じてグローバルに一意だ。CloudFrontがS3のコンテンツをエッジロケーションでグローバルにキャッシュできるが、データ自体はリージョンに存在する。

Q5: Amazon FSx for LustreとAmazon S3はいつ使い分けるか?

HPCやMLワークロードでサブミリ秒レイテンシと数百GB/sスループットを持つPOSIXファイルシステムセマンティクスが必要な場合は Amazon FSx for Lustre を使う。FSx for LustreはAmazon S3から直接データを取り込み、ファイルシステムとして公開できる。これがディープラーニング学習パイプラインの両取りパターンだ。

Q6: AWS BackupとAmazon S3の違いは?

AWS Backupは15以上のAWSストレージサービスとデータサービスにまたがるポリシー駆動型のバックアップオーケストレーションサービスで、リカバリポイントを保存して保持期間を強制する。Amazon S3は基盤となるオブジェクトストレージサービスだ。AWS Backupが内部でAmazon S3を使用することがあるが、試験の観点では「Amazon EBS+Amazon RDS+Amazon EFSのバックアップをどう管理するか」という問いへの答えはAWS Backupだ。

Q7: Amazon EFSはWindowsで動作するか?

動作しない。Amazon EFSはNFSプロトコルのみをサポートしており、Linuxワークロード向けだ。Windows SMBファイル共有には Amazon FSx for Windows File Server を使用する。これはCLF-C02で最もよく繰り返されるトラップの1つだ。

AWSストレージサービスの参考資料

まとめ — AWSストレージサービスの最終チェックリスト

  1. Amazon S3 vs Amazon EBS vs Amazon EFSの三角形を反射的に答えられるまで繰り返す — これだけで試験3〜5問分の価値がある。
  2. 7種のS3ストレージクラスを順番に暗記し、各クラスに1行の用途を結びつける。
  3. 4つのAmazon FSxバリアントをプロトコル別(SMB / Lustre / ONTAP / ZFS)に覚える。
  4. AWS Storage Gatewayの4つのモードを把握する。「テープライブラリの置き換え」=Tape Gateway。
  5. AWS BackupはAWSストレージサービスの一元化されたバックアッププレーン — 個別サービスのスナップショットと混同しない。
  6. AWSストレージサービスのシナリオでは、まずパラダイム(オブジェクト/ブロック/ファイル/アーカイブ/ハイブリッド/バックアップ)を分類する。そうすれば正しいサービスはほぼ自動的に導き出される。

これらのAWSストレージサービスのパターンをマスターすれば、ドメイン3のタスクステートメント「3.6 AWSストレージサービスを特定する」はCLF-C02試験で確実に得点できる分野となる。

公式ソース

その他の CLF-C02 トピック