2020-07-01から1ヶ月間の記事一覧
今回の概要 出力値を体積に変更 回帰値→one-hot vecに変更 入力に画像サイズの情報の付与 アンサンブル学習の準備 次回の予定 今回の概要 出力値を体積に変更した結果について 回帰値→one-hot vecに変更した結果について 入力に画像サイズの情報の付与(プロ…
今回改善した点について How要素 What要素 実行例 今後について 今回改善した点について 全体を通し、CaboChaを用いて判別する場合はチャンク毎に繋げて出力するように改善しました。 How要素 How要素は文末から探索し、係り受け先がない要素から助詞までの…
~記事の投稿予定~ はじめに Interstage Information Integratorとは 機能の概要説明 1. データ収集機能 <ファイル収集> - ファイル受信 - ファイル入力 2. データ変換・編集機能 <ファイル形式変換> <文字コード変換> <項目編集> <レコード編集>…
今回の概要 作業内容 出力値を体積に変更 回帰値→one-hot vecに変更 次回の予定 今回の概要 出力値を体積に変更(VGG19_train1.py) 回帰値をone-hot vecに変更(VGG_train2.py) 作業内容 前回の考察を基に改善の戦略を立てましたので、それを順次実行してい…
KNPを用いた手法 ソースコード 実行例 次回の予定 KNPを用いた手法 KNPは地名や人名を正確に分類できるためWhen/Where抽出する時に役立ちますが、 係り受け解析は文節ではなくチャンクごとに分類するCaboChaの方が正確であることが多いです。 そのため、When…
テスト用画像による出力結果の検証 現在のモデルに対する考察 精度と損失について モデルについて 改善策と今後の展望 テスト用画像による出力結果の検証 前回は200epochで実行していたため、1000epochsを上限としてソースコードを再実行しました。 3回実行…
KNPのセットアップ 5w1h抽出への応用 実行例 次回の予定 KNPのセットアップ 前回の記事の通り、KNPを使用するとより精度が向上すると考えられるため、以下の記事を参考にKNPをセットアップしました。 qiita.com 以下のマニュアルを参考に実際に動作させて、c…
パラメータチューニング テスト用画像の収集 評価用モデルの作成 パラメータチューニング 前回は全結合層の3層のパラメータ探索を行いました。 今回はその結果を用いて交差検証を行った結果、41.25% (+/- 35.04%)と今まで行ってきたモデルより精度が低い結…
精度向上に向けて KNPとは Cabochaの方が優れていること KNPとCabochaを組み合わせた手法の検討 精度向上に向けて 前回までで、助詞がある場合は高い精度で抜き出すことができるようになりました。 更なる精度向上のための手法について調査を行ったところ、K…
簡易体積算出の調整 Khold部を再検討 パラメータチューニング ベイズ最適化を用いたパラメータチューニング パラメータチューニングの改善 全結合層を1層でパラメータチューニング実行 交差検証 階層の検討 モデルの詳細分析 次回の予定 簡易体積算出の調整 …
係り受け解析を用いた手法の検討 ソースコード ステップ1 ステップ2 次回の予定 係り受け解析を用いた手法の検討 前回、係り受け解析による手法は文ごとに区切られていないと効果がないことが分かりまししたが、 Siri等の音声サービスを使用する場合は基本文…
今後の予定 Khold部を再検討 パラメータチューニング 評価 テスト学習 モデル構築と学習・評価プログラムの作成が完了したため、ハイパーパラメータを適当に決めてベースラインを決定します。 パラメータは以下のようにしました。 loss function = mean_squa…
現在の課題 係り受け解析 検討方針 CaboChaAnalyzerのセットアップ 精度向上 次回の予定 現在の課題 現在の課題は、連用形の場合を考慮できないこと(「〜する人」などの場合「〜する」をHowとしてしまう)です。 つまり、修飾語を区別できていません。 この問…
Augmentationによるデータ拡張 Augmentationによるデータ拡張のソースコード 学習プログラム機能の追加 Trashの削除 次回の予定 Augmentationによるデータ拡張 学習・検証用データが100枚程度だと不足するため、データ拡張(Augmentation)を行います。 色合い…
Whatの抽出 その他要素の抽出精度の向上に向けて WhereやWhenの抽出が簡単なものは先に抽出 抽出した時に意味が通る様に前の要素まで抽出 How要素抽出要素の追加 コードの実行結果 今回分かった課題 Whatの抽出 まず、Whatとなるパターンは以下の二つの場合…
作業内容 次回の予定 作業内容 モデル作成 前回の記事(https://www.itd-blog.jp/entry/volume-calculation-algorithm-7)をもとにモデルを作成しました。 以下にResNet50と追加した全結合層を示します。 ※ResNet152はAWSのメモリが足りなかったため、ResNet50…
出力形式の変更 Whenの抽出 Whenとなる要素の分類 入出力の結果 次回の予定 出力形式の変更 前回までの出力の形式を変更し、入力の文に直接要素名を出力する様にしました。 これにより、誤認識などがわかりやすくなりました。 Whenの抽出 Whenとなる要素を二…
データセット作成 データセットの整形・分析 製品の傾向の確認 モデル構想 次回の予定 データセット作成 機械学習用のデータセットを作成します。 収集する対象は冷蔵庫や電子レンジ等の大型家電の設置画像と、その製品名と寸法です。 以下にデータセット化…
Howの抽出精度向上 前回の課題 課題2と3の解決策 前回との結果の比較 前回の結果 今回の結果 ソースコード: 次回の予定 Howの抽出精度向上 前回の課題 前回は下記4点の課題がありました。 「~ね」がある場合は実際にHowになりうる場合もありますが、ただ除…
簡易体積算出アルゴリズムの再考 構想 簡易体積算出アルゴリズムの再考 前回までの簡易体積算出プログラムは簡易性と先進性において欠点があったため、方針を再考したいと思います。 条件として、スマホ等のカメラ撮影のみで完結し、チェスボードやブロック…