質問の分野
ニューラルネットワーク
ニューラルネットワーク
質問内容
- 匿名質問
- 2017.9.23
- PV 65
今、二つの画像を入力にしようとしていて最後に単語を出したいと思います。
ざっと調べたところでは、あまりそういうことはしないように思われます。
ニューラルネットの仕組み的にそのようなことはできないのでしょうか?
それともあまりやるメリットが存在しないのでしょうか?
抽象的な質問で恐縮です。
ご回答お願いします。
質問
Thoth
- @mentalMonkey
- 2017.10.3
- Fav 0
はい。結論から言えば可能です。 | 結論 |
正におっしゃってるような使い方でに入力にしています。
目的は様々ですが、近年は一度分離してから再度統合する形や
ランダムに一部層をスキップすることもあります。
学習精度を向上させることや入力に近い情報を保つためなど様々です。
以下に幾らかの例を置いておきます | 説明 |
二つの画像からひとつの画像を生成する例です | 外部リンク グレー画像からカラー画像 |
途中で分離して最後に統合していく例 | 外部リンク UNet |
Youtubeのオススメの動画では様々な要素を入力に突っ込んでいます | 外部リンク Youtubeオススメ動画決定 |
画像認識の適用例もあるので、参考にしてみてください | DeepLearningの画像認識適用例 |