【第14回】5W1H抽出AI How要素/What要素の精度改善

AI 音声認識形態素解析

今回改善した点について How要素 What要素実行例今後について今回改善した点について全体を通し、CaboChaを用いて判別する場合はチャンク毎に繋げて出力するように改善しました。 How要素 How要素は文末から探索し、係り受け先がない要素から助詞までの…

2020-07-27

【第13回】5W1H抽出AI KNPを用いた手法の検討

AI 音声認識形態素解析

KNPを用いた手法ソースコード実行例次回の予定 KNPを用いた手法 KNPは地名や人名を正確に分類できるためWhen/Where抽出する時に役立ちますが、係り受け解析は文節ではなくチャンクごとに分類するCaboChaの方が正確であることが多いです。そのため、When…

2020-07-21

【第12回】5W1H抽出AI KNPを用いた精度向上

AI 音声認識形態素解析

KNPのセットアップ 5w1h抽出への応用実行例次回の予定 KNPのセットアップ前回の記事の通り、KNPを使用するとより精度が向上すると考えられるため、以下の記事を参考にKNPをセットアップしました。 qiita.com 以下のマニュアルを参考に実際に動作させて、c…

2020-07-17

【第11回】5W1H抽出AI KNPとcabochaの比較

AI 音声認識形態素解析

精度向上に向けて KNPとは Cabochaの方が優れていること KNPとCabochaを組み合わせた手法の検討精度向上に向けて前回までで、助詞がある場合は高い精度で抜き出すことができるようになりました。更なる精度向上のための手法について調査を行ったところ、K…

2020-07-14

【第10回】5W1H抽出AI 係り受け解析を用いた手法

AI 音声認識形態素解析

係り受け解析を用いた手法の検討ソースコードステップ1 ステップ2 次回の予定係り受け解析を用いた手法の検討前回、係り受け解析による手法は文ごとに区切られていないと効果がないことが分かりまししたが、 Siri等の音声サービスを使用する場合は基本文…

2020-07-10

【第9回】5W1H抽出AI 係り受け解析による精度向上の検討

AI 音声認識形態素解析

現在の課題係り受け解析検討方針 CaboChaAnalyzerのセットアップ精度向上次回の予定現在の課題現在の課題は、連用形の場合を考慮できないこと(「〜する人」などの場合「〜する」をHowとしてしまう)です。つまり、修飾語を区別できていません。この問…

2020-07-07

【第8回】5W1H抽出AI Whatの抽出・その他の要素の抽出精度向上に向けて

AI 音声認識形態素解析

Whatの抽出その他要素の抽出精度の向上に向けて WhereやWhenの抽出が簡単なものは先に抽出抽出した時に意味が通る様に前の要素まで抽出 How要素抽出要素の追加コードの実行結果今回分かった課題 Whatの抽出まず、Whatとなるパターンは以下の二つの場合…

2020-07-04

【第7回】5W1H抽出AI Whenの抽出

AI 音声認識形態素解析

出力形式の変更 Whenの抽出 Whenとなる要素の分類入出力の結果次回の予定出力形式の変更前回までの出力の形式を変更し、入力の文に直接要素名を出力する様にしました。これにより、誤認識などがわかりやすくなりました。 Whenの抽出 Whenとなる要素を二…

2020-07-02

【第6回】5W1H抽出AI Howの抽出2

AI 音声認識形態素解析

Howの抽出精度向上前回の課題課題2と3の解決策前回との結果の比較前回の結果今回の結果ソースコード: 次回の予定 Howの抽出精度向上前回の課題前回は下記4点の課題がありました。「～ね」がある場合は実際にHowになりうる場合もありますが、ただ除…

2020-06-29

【第5回】5W1H抽出AI Howの抽出1

AI 音声認識形態素解析

Howの抽出実行結果考察次回の予定 Howの抽出「どのように」を表すHowのパターンは、大きく分けて以下の二種類のパターンが考えられます。走る、行くのような動詞です、ますのような助動詞この二つのパターンに共通するのは基本形、終止形であること…

2020-06-23

【第4回】5W1H抽出AI テストデータの生成

AI 音声認識形態素解析

YouTube自動生成字幕をテストデータとする方法の検討テスト結果次回の予定 YouTube自動生成字幕をテストデータとする方法の検討 YouTubeには動画を音声認識してキャプションを生成する機能があります。この機能はGoogle音声検索で導入されている技術とほ…

2020-06-17

【第3回】5W1H抽出AI 抽出器の検討2

AI 音声認識形態素解析

前回作成したプログラムの課題課題の解決策抽出器の改良おわりに前回作成したプログラムの課題 [前回の記事(https://www.itd-blog.jp/entry/5W1H-AI-2)の実行結果3では、2つの誤検知が発生していました。一つ目は固有名詞である"北多摩病院"を一語とし…

2020-06-12

【第2回】5W1H抽出AI 抽出器の検討1

AI 音声認識形態素解析

新しい手法実行結果1 実行結果2 実行結果3 おわりに新しい手法前回のCBSPを参考に、5W1Wを抽出する方法を考えました。ステップ1 テキストをMeCabを用いて形態素解析ステップ2 固有名詞を抜き出し、特徴的なパターン(oo病院、xx時など)と一部一致したら…

2020-06-08

【第1回】5W1H抽出AI 方針の策定と形態素解析ソフト(MeCab)のセットアップ

AI 音声認識形態素解析

そもそも、5W1Hとは？目標と方針従来の手法表層格指向パーシングCBSP(Case-Based Shallow Parsing)[2] 精度形態素解析ソフト(MeCab)のセットアップおわりに参考文献そもそも、5W1Hとは？ Wikipedia[1]によると、下記のように説明されています。 5W1H…

2020-06-04

スペクトル解析補足記事【付録②】

音声認識

はじめにリファレンス一覧プログラム解説1 コメントアウトについて [必要なライブラリをインポート]import xx as xx というおまじないについて [超簡単な正弦波を作る]変数の定義について [超簡単な正弦波を作る]ライブラリの関数について [グラフに表示①]…

2020-05-20

スペクトル解析補足記事【付録①】

音声認識

はじめにリファレンス一覧音声データについて録音･編集ソフト手順1 音声の録音手順2 録音音声の切り出し手順3 録音音声の編集手順4 編集した音声をwaveに出力する音声データの性質を調べる(おまけ) デジタル音声についての説明サンプリング Python…

2020-04-06

環境構築の補足

音声認識

環境構築はややこしい？環境構築って何？環境構築ってどんな作業なの？ Python ライブラリ統合開発環境(IDE) 統合開発環境の何が良いの？統合開発環境の悪い点は？仮想環境結局、仮想環境(マシン)って何なの？結局、何が良いの？まとめ ※Pythonでの…

2020-04-03

第6回音声認識のための深層学習

音声認識

1. ニューラルネットワークについて 1.1 MLP(多層パーセプトロン)構造 1.2 MLPの学習方法 1.3 ニューラルネットワークを用いた音声認識再帰型ニューラルネットワーク(Recurrent neural network; RNN) 時間遅れニューラルネットワーク(Time-delay neural net…