生成AIが変えるComputer visionの未来
Computer visionとは、コンピューターがデジタル画像・動画、その他の視覚データから意味のある情報を導き出し、推奨を行うことがきるようにする人工知能(AI)の分野を指す。たとえば製造業の分野では大量の製品の検査をComputer visionで行い、ヒトでは知覚できない欠陥を発見することが出来る。
他にもエンターテインメントの分野ではプロジェクションマッピング、自動運転におけるオートパイロット機能などに用いられるなど、Computer visionは用途が広く今最も熱い分野だ。
一方、Computer visionの課題として、機械学習モデルを作成・改善するためには多大なコストと期間が必要となる。モデル作成時に大量の画像や動画などのデータセットを用意しなければならない。これを生成AIを使うことによって、同プロセスを大幅に短縮させることが期待されている。
ソフトバンク・ビジョン・ファンド2が支援するWhatfix
Whatfixは、2014年にKhadim Batti氏とVara Kumar氏によって設立。2021年にはソフトバンク・ビジョン・ファンド2がリードインベスターとなり、セコイア・キャピタル・インディア、シスコ・インベストメンツなどから9,000万ドルの調達に成功。同社はデジタルアダプションソリューション(DAP)に関するサービスを、主に米国・ヨーロッパ市場のテクノロジー、製造業、ヘルスケアなど、多様な産業に向けて展開している。
Whatfixの展望
WhatfixのDAPは、企業で働く従業員の生産性、あるいは企業が提供するサービスを使用する“エンドユーザー”のユーザーエクスペリエンスが向上するような機能を提供。企業は、いち早く使い方や機能に慣れてもらうためのガイダンスやチュートリアルのサポート機能を簡単に設置出来るようになる。たとえばユーザーに対してポップアップを使ってガイドしたり、プロセスが完了するまでに必要なタスクをリストやフローで表示したりすることなどが可能だ。
さらにユーザーがどのようにコンテンツを消費しているかを分析し、エンゲージメントを解析。ユーザーの行動心理を深く理解し、離脱を防ぐための手段を講じることに役立てることが出来るサービスもある。同社のサービスは、すでにMicrosoft Azure Marketplace上でも提供されている。
このようなDAPサービスを展開するWhatfixは、人間のようにアプリケーションやプロセスを理解するコンピュータ・ビジョン・モデルの開発を続け、2023年5月にはWhatfix AIを発表。テキスト・フィールドをリアルタイムで自動補完したり、顧客の簡単な言語による指示でタスクやプロセス全体をガイドすることができるようになった。そして今回は、生成AIを活用したComputer visionモデルの開発に挑んでいる。Whatfixの技術躍進は止まらない。
文:はっさく(@hassakumacro)