iTAC_Technical_Documents

アイタックソリューションズ株式会社

ブログ名

Smooth gradによる可視化

本記事で行うこと 機械がどのように人検知しているかということを知る意義 Smooth gradについて Smooth gradの実行 準備 SSDの実際の出力結果との比較 VGGの可視化 Grad-CAMについて Grad-CAMの実行 SSDを用いた検出 VGGの出力結果とSSDの結果を比較して 本…

人検出モデルの実行

本記事で行うこと 人検出について 人検出とは? 物体検知のアルゴリズム CNN(畳み込みニューラルネットワーク) R-CNN系 SSD系 YOLO系 各アルゴリズムの速度と精度について Ubuntuでの人検出 keras, tensorflowのインストール Githubからクローン 実際にモデ…

人認識の実行環境の構築

本記事で行うこと 環境構築手順 Windows10にVirtual Boxを用いてUbuntuの仮想マシンを構築する 仮想マシン(Virtual Box)のインストール Ubuntuのインストール Ubuntuの設定 Pythonのインストール Anacondaのインストール 本記事で行うこと 今回はWindows10の…

GMMとトライフォン

今回も機械学習の回です 今回もよろしくお願いします! 引き続き「音響モデル」について学びます。 今回は、 HMM(隠れマルコフモデル)に加えてよく用いられる GMM トライフォン という技術について説明します。 この記事は主に、 CDHMM GMM-HMM triphone と…

補足:隠れマルコフモデルについて

マルコフ性とは 隠れマルコフモデル 隠れマルコフモデルは、マルコフモデルに隠れ変数を加えたモデルです。数式に関する説明が多くなるので補足記事としました。 まずは、マルコフモデル及びマルコフ性という考え方について説明します。 マルコフ性とは driv…

音声認識に用いる隠れマルコフモデル

今回は機械学習の回です 以降より、 音響モデルについて学びます。 今回は、 - 音響モデル変遷(歴史的背景) - 音響モデルで主流であった隠れマルコフモデル について説明していきます。 この記事では主に、 MFCC 周波数ビン幅 メルフィルタバンク 対数パワー…

周波数データから特徴量ベクトルを抽出する

今回は特徴量抽出の回です 今回は、特徴量の抽出 について学びます。 特徴量の抽出は、 周波数データから分析に適した特徴を抽出する 処理です。 特徴量抽出の処理は、音声をどのようなモデルで分析するかも関係するため、音響モデルの説明も少しします。 こ…

スペクトル解析

今回はフーリエ変換の回です 今回は スペクトル解析 について学びます。 スペクトルとは 「光源をプリズムに当てると様々な色の光線に分散する」という実験を覚えていますか? スペクトルは、分散した色の線1本1本のことを言います。 分散された色の光線は、…