「Northstar」が実現しようとしていることはデータサイエンスの民主化だ。複雑な分析を誰もが素早くできれるようになれば、マーケッターが売り上げを予測したり、医者が疾患を予測したりといったことが容易になる。
・ドラッグ・アンド・ドロップでデータ解析
「Northstar」では、スマホやデジタルホワイトボードなど、タッチスクリーン対応デバイスが使えて、指やスタイラスで操作可能だ。
そして、VDS(Virtual Data Scientist)という最新のコンポーネントを使えば、データサイエンスに関する知識をほとんど持たない人も、AIモデルを利用したデータ解析ができる。
データ解析を実施するには、データセットをシステムにアップロードし、ラベル付けされ分類されたデータのボックスや、システムに含まれるアルゴリズムをドラッグ・アンド・ドロップするだけ。各ボックスをリンクすることでより複雑な解析もできる。
また昨今は、AutoMLの活用がさかんだが、「Northstar」にも最新のAutoMLツールが含まれているようだ。
・予測エンジンにより数秒以内に解析完了
AutoMLツールにより、システムは自動的に最適な機械学習パイプラインを生成。処理中に各モデルのエラー率や構造をチェックできる。
解析はクラウドで行うが、その前に予測エンジンによる前処理が走る。ここではデータセットのなかから代表サンプルを自動でピックアップし、まずこれらに対して解析シミュレーションを実施。これにより、時間をかけた解析に近い結果が数秒で得られるという。得られた結果を段階的に処理して精度を上げていく。
実際、300のデータセットでVDSを評価したところ、最先端のAutoMLシステムと同程度の正確性を持ち、他では数分から数時間かかる解析を数秒以内に終わらせたようだ。
今後研究者らは、潜在的なデータの偏りやエラーをユーザーに教えてくれる機能を追加する計画だ。
参照元:Drag-and-drop data analytics/MIT News