業界特化型 技術・製品情報サイト
  • MONOist
  • EE Times Japan
  • EDN Japan
  • スマートジャパン
  • BUILT

SAS Institute Japan株式会社

技術文書・技術解説

SAS Institute Japan株式会社

アナリティクス向けのデータ管理、5つのベストプラクティス

アナリティクスにおいて、データ管理は極めて重要である。 ビジネスの成功には「汚染されていない」データが欠かせないからだ。

コンテンツ情報
公開日 2016/09/06 フォーマット PDF 種類

技術文書・技術解説

ページ数・視聴時間 8ページ ファイルサイズ 583KB
要約
 データ・サイエンティストの多くは、モデル開発にかかる時間の50~80%をデータの準備に費やしている。洞察を導く作業に使えるはずの時間が、それだけ犠牲になっているのだ。

 SASでは、高度なアナリティクスの活用と洞察の深化をサポートするためのデータ管理プロセスに関して、5つのベストプラクティスを提唱している。

・従来のデータと新しいデータの両方へのアクセスを簡素化する

・高度なアナリティクス手法でデータ・サイエンティストの分析力を強化する

・データ浄化手法を用いて既存のプロセスに品質管理を組み込む

・柔軟なデータ操作手法を用いてデータを整形する

・データ管理領域とアナリティクス領域を横断してメタデータを共有する

 本資料では、これら5つのポイントについて詳しく解説する。