f:id:aptpod_tech-writer:20210623183848j:plain

こんにちは。製品開発グループにて機械学習の研究開発まわりを担当しているきしだです。
現在、研究開発の一環として、「デバイスから収集された時系列データから、発話された箇所を自動で検出するシステム」を開発しています。現在はまだ試作段階ですが、この試作品を用いて実際に利用機会があるかどうか検証しているフェーズです。そこで、今回はこの試作内容をテックブログにてご紹介します。

※ 現在こちらの試作品にご興味がある方々を募集しております。試しに利用してみたい、という方がいらっしゃいましたらぜひこちらまでお問い合わせください。

ことの背景
機能の概要
実現方法
まとめ

ことの背景

走行データをフィードバックデータとして活用する

弊社のプロダクトであるintdashは、各デバイスから収集した高頻度の時系列データを伝送・管理するミドルウェア的要素を持っています。収集および可視化にはそれぞれアプリケーションが提供され、その間をつなぐパイプラインとして様々なデータリソースを活用できます。

利用ケースとしては、走行する車のエンジン回転率や前方方向を撮影した走行動画、走行位置などを走行データとして記録しておき、走行時におかしなところがないか後からチェックしたいケースが挙げられます。例えば、最近発表があった大阪ガス様の"AI/IoTによる工事現場自動検出システム" では、走行ルートから工事現場という特定の要素を検出し、後から工事現場の配置状況を走行時のフィードバックとして確認する運用フローをサポートしています。

このように、走行状況を後からフィードバックデータとして利用したいケースは、他案件でも需要があることが確認できています。ここでは"おかしなところ"を検出しておくことで、フィードバックデータの価値をより高めることができる点がポイントです。

フィードバックデータの価値を高める難しさ

しかし検出を行うためには、検出を行うためのトリガーが必要です。

ここでいうトリガーは、"スピードが80km/hを超えた"というような単純なしきい値で定義付けできるものもあれば、 "道に穴が空いている" というような、数式化するには骨が折れるような定義付けも含まれます。現状では後者に対する需要が高まっており、機械学習を使ってソリューションを検討する場合が多いですが、機械学習では精度の担保にリスクがついてまわったり、開発リソースがコントロールしづらいため、機械学習に知見がないと手を出しにくい領域です。

一方でこのような作業を人手で行うと、一日数時間の走行データを最初から最後まで目でみて、異常がないかチェックすることになり、時間が非常にかかってしまいます。加えて複数人にスケールすると、判断基準がぶれたりしてチェック内容が正確でなくなったりと、課題はなかなか無くなりません。

フィードバックデータの価値を"発話箇所"で高める

そこで少し発想を変えてみて、

トリガーの判断は人間が行いつつ
判断時の記録を運転しながらできるようにし
後から確認すれば記録を見れるようになる

とすれば、フィードバックデータの価値を高められるのでは？と考え「音声を使って"おかしなところ"を記録し、後から見れるようにする」ことを思いつきました。

運転中に人が"穴があった！"といい、その発話した時間帯をシステムに記録しておけば、後から見たときにその発話箇所を参照することで、"穴があった"箇所を確認できます。トリガー自体の開発は行わなくとも、走行時の記録を簡易的にシステム化することで、ユーザーの業務改善フローを簡単に実現することができ、システム導入にあたる効果検証を素早く行うことができます。

ということで、まずはこのシステムの効果検証を行うべく、intdashに取り込まれたデータから、発話した箇所を検出して検索する機能を試作品としてつくってみました。