DO-SREP
| コースコード | TOC507 | 期間 | 3日間 | 時間 | 09:30~17:30 | 価格 | \264,000(税込) | 主催 | Top Out Human Capital株式会社 |
|---|
| コースコード | TOC507 | 期間 | 3日間 | 時間 | 09:30~17:30 |
|---|---|---|---|---|---|
| 価格 | \264,000(税込) | 主催 | Top Out Human Capital株式会社 | ||
| コースコード | TOC507 | ||
|---|---|---|---|
| 期間 | 3日間 | ||
| 時間 | 09:30~17:30 | ||
| 価格 | \264,000(税込) | ||
| 主催 | Top Out Human Capital株式会社 | ||
SRE (Site Reliability Engineering) Practitionerトレーニングでは、組織内のサービスを経済的かつ信頼性の高い方法で拡張する方法を紹介します。
設計/自動化/クローズドループ修復による回復力の構築に向けて、アジリティ/部門間コラボレーション/サービス健全性の透明性などを向上させるための戦略を探ります。
本トレーニングでは、実際のシナリオやケースストーリーを用いて、信頼性に関わる組織全体の人々を巻き込むための実践手法/方法論/ツールを習得することを目的としています。
トレーニング修了後には、組織の状況に合わせたSREモデルの導入/分散システムにおける高度な可観測性の構築/設計による回復力の構築/SREの実践による効果的なインシデント対応など、実務上で活用可能なスキルを習得できます。
SREの主要な情報源を活用し、SRE分野のソートリーダーたちと関わり、SREを採用している組織と協力して実際のベストプラクティスを抽出することによって開発された本トレーニングは、SREの導入を始めるために必要な、主要原則と実践方法を学べるよう設計されています。
本トレーニングは「Site Reliability Engineering Practitioner」認定試験に合格するための基礎となります。
・SREの文化を組織内で成功させるための実践的な視点の獲得
・SREの基本原則とアンチパターンの観点から見たSREの定義およびアンチパターンを回避するために意識すべき事柄の理解
・SRE導入による組織への影響の理解
・分散エコシステムにおけるSLIとSLOの技術習得、イノベーションとリスク回避のためのエラーバジェットの使用方法の拡張
・分散型ゼロトラスト環境における、設計によるセキュリティとレジリエンスの構築
・フルスタックの可観測性と分散トレースの実装方法、可観測性駆動型の開発文化を実現方法の理解
・AIを活用したデータのキュレーションによる、リアクティブなインシデント管理からプロアクティブで予測的なインシデント管理への移行方法の理解
・DataOpsを利用したクリーンなデータリネージの構築方法の理解
・SRE文化の一貫性と予測可能性を構築する上で、プラットフォームエンジニアリングが重要な理由の理解
・実践的なカオスエンジニアリングの実践
・インシデントコマンドのフレームワークに基づくSREの重大インシデント対応責任と、管理されていないインシデントの分析例の理解
・SREがDevOpsの最も純粋な実装だと考えられる理由についての視点の獲得
・SREの実行モデルの理解
・SREの役割の理解、信頼性が全員の問題である理由の理解
・SRE成功事例の教訓の理解
SRE (Site Reliability Engineering) Practitionerコースの対象者は、以下のようなプロフェッショナルです。
・信頼性向上への取り組みを始めた方、または主導している方
・現代のITリーダーシップや組織変革のアプローチに興味のある方
・SRE Practitionerコース受講と認定試験受験の前に、DevOps Institute認定教育パートナーのSRE Foundationコースを受講し、SRE Foundationの認定を受けることが強く推奨されます。
・一般的なSREの用語、概念、原則の理解や知識、関連する実務経験があることが推奨されます。
注意:DevOps Institute SRE Foundation認定は、SRE Practitioner試験の前提条件です。
・集合研修
・オンライントレーニング(Webex)
●SREのアンチパターン
・SREの原則と実践(復習)
・SREの誤解とアンチパターン
・インシデント対応における SREの実践
●SLOは顧客幸福の代理人である
・SLOで何が変わったか?
・SLI設定のためにシステム境界を特定することの重要性
・ベロシティと安定性の議論を超えたエラーバジェットの使い方
●安全で信頼性の高いシステムの構築
・非抽象的な大規模システム設計
・耐障害設計のパターン
・セキュリティのための設計
・レジリエンス/スケーラビリティ/パフォーマンス/可用性/信頼性のための設計
●フルスタックのオブザーバビリティ
・現代のアプリケーションの複雑さ
・オブザーバビリティ
・モニタリングとテレメトリー
●プラットフォームエンジニアリングとAIOpsの活用
・プラットフォーム主導の視点
・AIOpsによるレジリエンス向上と、DataOpsがどのようにそれを支援するか
・AIOpsの実装と測定
●SREとインシデント対応管理
・インシデント対応におけるSREの主な責務
・インシデント対応のパターン
・AI/MLによるインシデント管理の改善
●カオスエンジニアリング
・現代のシステムの複雑さ
・カオスエンジニアリング
・セキュリティのためのカオスエンジニアリング
●SREはDevOpsの一形態である
・SREの主要原則
・成功のための指標
・SREの実践への変革
●最後に(課題および解答例の配付)
・非抽象的な大規模システム設計 - 容量計画
・Gremlinのインストルメンテーション
【DevOps Institute認定資格試験の受験について】
受講者様のご希望の試験日時を各自で設定可能です (職場や自宅などから各自でご受験いただけます)。 ※ 受験バウチャーの有効期間内
受験申込方法およびバウチャー有効期限につきましては、受講者ポータルでお知らせいたします。
DOI (DevOps Institute) の試験は、PeopleCert社によって実施されます。
サンプルペーパーと試験は、Foundation v3.10に基づいています。
※取得可能PDU数 21(PowerSkills(旧Leadership): 5 / Business(旧Strategic): 14 / Ways/Working(旧Technical): 2)
※配布物:認定資格試験受験バウチャー (1回分)