大規模モデルを開発し、ターゲット環境で動作する軽量な手法に蒸留
Arm9(240MHz), NPU(1TOPS/512MB LPDDR4)等で動作実績あり
Time delay neural network (TDNN)による英語・日本語向け連続音声認識技術
NPU、モバイル端末等多くの環境でご利用頂けるよう複数種類のパラメータサイズの音響モデル及び言語モデルを開発し、導入コストを低減
xVector の改良手法による話者認証モデルを開発
軽量なため、ターゲット端末上で認証対象話者の登録処理も可能
1D-CNN+Transformerによる感情分類モデルを開発
8クラス("anger", "disgust", "fear", "happiness", "sadness", "surprise", "neutral", "calm")の分類が可能であり、さらに独自クラスの追加も可能
Audio Spectrogram Transformerによる音響イベント検出モデル及びMobileNet の改良手法による軽量モデルを開発
527クラスの分類が可能であり、さらに独自クラスの追加も可能
オフライン且つモバイル端末上で軽快に動作するVLMの開発
軽量な行動認識モデルと異常検知モデルにより、作業のオペレーションミスの検知、不審行動の検知等、従来技術では難しい複雑な行動の検知が可能
常時稼働や頻回な稼働でも低コストに運用可
検出したい独自行動を追加カスタマイズし、お客様独自のAIモデルをご提供可
NPUやモバイル端末等で動作するように軽量化(蒸留・量子化)・移植可
Transformerエンコーダによる汎用行動を理解する行動認識モデル及び異常行動を検知する異常検知モデルの2層で構成
ターゲット環境で動作するよう蒸留し軽量化
車両の進入
不審行動
転倒
※UCSD Anomaly Detection Dataset
ヘルメット未着用
正常
正常
作業誤り