AIモデル開発においては、教師データの作成に必要なリソースや、社内外で作成した教師データの品質・精度・整合性に課題を抱える企業も多い。教師データの質を高めたい、あるいは迅速に収集したい場合は、専門事業者への外注が有効だが、依頼しても期待通りの成果が得られないケースもある。
外注先を選ぶ際には、既製データセットの提供実績の有無、分野ごとの専門アノテーターチームの有無、自社開発のアノテーションツールの保有状況、品質管理体制の整備状況などを確認することが望ましい。本資料では、このような選定基準を整理した上で、ある事業者の「既製データセット提供サービス」や「データ収集・アノテーションサービス」を紹介する。
同事業者は、音声・画像・動画・テキスト・点群など多様なフォーマットのデータ収集やアノテーションを受託した実績を持ち、専門的なデータ収集にも対応できる。さらに、独自のアノテーションプラットフォームや、専門家で構成するグローバルなアノテーションセンターも保有している。詳細は資料で紹介しているので、ぜひ目を通していただきたい。