MLOpsとは|機械学習モデルの運用自動化をITパスポート向けに整理
MLOps(機械学習運用)の概念、DevOps との違い、データ・モデル管理、A/B テストなどをITパスポート試験向けに整理します。
MLOpsとは
MLOps(Machine Learning Operations)とは、機械学習モデルの開発から運用までを自動化・効率化する手法です。DevOpsの機械学習版として2018年頃から普及しました。機械学習の研究は進んでも実運用が難しいという課題を解決するために生まれました。
なぜ MLOps が必要か
機械学習特有の課題
機械学習には特有の課題が存在します。時間とともにデータの傾向が変わり、モデルの精度が低下するデータドリフトが問題となります。また、定期的なモデルの再学習が必要です。同じ結果を再現するにはデータ・コード・環境のすべてを記録しなければなりません。新旧モデルの比較にはA/Bテストが用いられます。
MLOps の主な構成要素
データ管理
データ管理では、DVCなどのツールを用いたデータバージョン管理や、自動的にデータを収集・前処理するデータパイプラインが重要です(NoSQLとビッグデータ参照)。
モデル管理
モデル管理では、学習済みモデルを保管・バージョン管理するモデルレジストリと、精度・学習条件・データセットを記録するモデルメタデータが使用されます。
デプロイ・運用
デプロイ・運用では、モデルをAPIとして公開するモデルサービング、本番環境で新旧モデルを比較するA/Bテスト、精度劣化(ドリフト)を検知するモニタリングが行われます。
再学習
再学習は、定期スケジュールまたはドリフト検知時に自動的に実行されます。
DevOps と MLOps の違い
| 観点 | DevOps | MLOps |
|---|---|---|
| 対象 | アプリケーションコード | データ・モデル・コード |
| バージョン管理 | コードのみ | コード + データ + モデル |
| テスト | 単体・結合 | + データ品質・モデル精度 |
| 再現性 | 比較的容易 | データ・乱数の影響で難しい |
| 監視 | 稼働率・エラー | + モデル精度・データドリフト |
代表的なツール
代表的なツールとして、実験管理・モデルレジストリのMLflow、Kubernetes上のMLパイプラインのKubeflow、実験追跡のWeights & Biases、クラウドMLプラットフォームのVertex AIやAmazon SageMakerなどがあります。これらのツールはMLOpsの各段階を支援します。
ITパスポート試験での出題ポイント
ITパスポート試験では、MLOpsの目的(ML運用の自動化)やDevOpsとの違い、データドリフトとモデル再学習、A/Bテストなどが頻出です。これらのポイントを中心に学習しましょう。
過去問の典型パターン
- 「機械学習モデルの運用を自動化する手法はどれか」型 → MLOps
- 「モデルの精度低下を引き起こすデータ傾向の変化はどれか」型 → データドリフト
関連用語
- AI・機械学習(AI・機械学習の基礎)
- DevOps(DevOpsとは)
- データサイエンス(データサイエンスとデータエンジニアリング)
学習のコツ
MLOpsは「DevOps + データとモデル管理」と簡潔に覚えましょう。データドリフトの概念を理解し、主要構成要素(データ管理・モデル管理・デプロイ・再学習)の4つを押さえると効果的です。
まとめ
MLOpsの目的、DevOpsとの違い、主要構成要素を押さえれば、関連問題で確実に得点できます。テクノロジ系を網羅的に演習するならテクノロジ系まとめ、本番形式は模擬試験へ進みましょう。