コンテンツ情報
公開日 |
2016/09/06 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
8ページ |
ファイルサイズ |
583KB
|
要約
データ・サイエンティストの多くは、モデル開発にかかる時間の50~80%をデータの準備に費やしている。洞察を導く作業に使えるはずの時間が、それだけ犠牲になっているのだ。
SASでは、高度なアナリティクスの活用と洞察の深化をサポートするためのデータ管理プロセスに関して、5つのベストプラクティスを提唱している。
・従来のデータと新しいデータの両方へのアクセスを簡素化する
・高度なアナリティクス手法でデータ・サイエンティストの分析力を強化する
・データ浄化手法を用いて既存のプロセスに品質管理を組み込む
・柔軟なデータ操作手法を用いてデータを整形する
・データ管理領域とアナリティクス領域を横断してメタデータを共有する
本資料では、これら5つのポイントについて詳しく解説する。