The Big Data Problem is Real
Privacy
既存のビッグデータ&AIプラットフォームでは、プライバシーを守りながら同時に学習することはできません。
Latency
ビッグデータは一度にアップロードできないため、リアルタイムのコンピューティング&インテリジェンスの配信は不可能&スローになる。
Efficiency
中央のクラウドですべてのデータを転送して処理するには、時間がかかり、膨大なコンピュテーション能力を消費します。
Cost
ビッグデータセンターと巨大なコンピュテーション資源を利用することは、運用・管理のコストにつながります。
AI プロジェクトの85%は、データの偏りにより
誤った結果をもたらす - ガートナー
Bias
人為的なバイアスやデータ収集によるデータの幅が不足していることによるモデルの偏り
Overfitting
データセットが大きすぎるため、ノイズや不正確な情報から学習してしまうMLモデル
Underfitting
小さなデータセットでの高い
バイアスと低い分散による、
誤った予測
Inconsistency
無関係な低品質データでの
トレーニングによって引き
起こされるモデルの問題
現状の課題
Data Silos
プライバシーなどの制約により、あらゆるソースからのデータ収集が困難な問題
Data Sparsity
MLモデルの性能に影響を与えるデータセットの値の不足
Data Security
データセキュリティ上の
リスクにより、重要なデータ
へのアクセスが不可
Data Storage
MLにおけるデータ転送・
保存のため高騰するコスト
TieSet ができること
モデルドリフトやバイアスの問題など、
お客様のAIモデルの限界を評価し、トレー
ニングデータのギャップを特定します。
分散連合学習環境の構築とSTADLEによる
パフォーマンス向上を支援します。
機械学習プロセスをSTADLEプラット
フォームに統合する方法について説明
します。
プライバシー保護 ができるデザイン
STADLEは、インテリジェンスのみを
収集し、実際の個人情報は収集しない連合型集合学習技術を使用しています。
個人情報は安全に保管され、本人の端末からやクラウドに持ち出されることはありません。
非代表的なデータでトレーニングする
より精度の高い汎化モデルを作成するためには、様々なユースケースをカバーするあらゆる種類のデータを学習させる必要があります。
多くの場合、システム間や組織間でサイロ化されたデータの性質上、これは非常に困難です。
データエンジニアリングプロセスにおいて、これまで利用できなかったデータへのアクセスを増やすことで、機械学習モデルの真のポテンシャルを引き出します。
データ転送のないトレーニングでは、パートナー、ベンダー、顧客からの外部データを使用することで、AIモデルのパフォーマンスを向上させる多大な機会が得られます。
データ転送コストの大幅な削減
AIを学習させる上で大きなボトルネックとなるのが、クラウドを利用したデータ転送コストです。データ転送コストは、プロジェクト全体の約30%を消費します。少ないデータでAIモデルを学習させると、モデルの性能に限界が生じる可能性があります。
表面的には、データが増えることは良いことです。しかし、膨大な計算資源を使った学習には、多くの時間とコストがかかります。
STADLEはインテリジェンスのみをオーケストレーションし、データによるトレーニングとインテリジェンスによるトレーニングを分離することで、オーバーフィッティングとアンダーフィッティングの適切なバランスを見つけることを支援します。
エッジでのトレーニングによりデータレイテンシーを低減
STADLEは、エッジでAIを学習させることにより、データのレイテンシーを減らし、学習効率を高めることで、スマートプロダクトの導入を加速させます。
ビデオストリーミングや自律走行システムなど、時間的制約のある機能に対して、より高い精度、より速いスピードで応答することができます。
センサーは、大量のビデオデータをクラウドに送信する必要はなく、異常を検出するだけで、リアルタイムの意思決定をより効率的に行うことができます。また、医療用画像処理装置では、機密性の高い医用画像を送信する必要はなく、診断に必要な情報のみを送信することができます。
開催予定のイベント
- 2021年11月18日 19:00OnlineWhether you’re familiar with Federated Learning, or are just curious about the many applications of this groundbreaking technology, please join us on Friday, September 17th from 4-5 PM Pacific. Just a few of the topics include: Federated Learning Basics Modeling Approaches Centralized vs Decentral
- 2021年10月14日 19:00OnlineWhether you’re familiar with Federated Learning, or are just curious about the many applications of this groundbreaking technology, please join us on Friday, September 17th from 4-5 PM Pacific. Just a few of the topics include: Federated Learning Basics Modeling Approaches Centralized vs Decentral
- 2021年9月17日 19:00OnlineWhether you’re familiar with Federated Learning, or are just curious about the many applications of this groundbreaking technology, please join us on Friday, September 17th from 4-5 PM Pacific. Just a few of the topics include: Federated Learning Basics Modeling Approaches Centralized vs Decentral