ディープラーニングは聞いたことありますかね??
2016年3月、Google DeepMindのコンピュータ囲碁プログラム:AlpgaGoが九段のプロ棋士:イ・セドルに勝ったニュースが話題になりました。そのAlpha Goに使われている技術の1つがDeep Learningです( ..)φメモメモ
このDeep Learninigの解説はまた別の記事で(気が向けば)書こうと思います。今回書きたいのは、Deep Learningの応用技術の1つであるセグメンテーションについてです!
セグメンテーションは、☟の画像みたいに、入力画像のどこが何なのかをピクセル単位で分けるタスクです( ..)φメモメモ
入力画像が(a)Image
出力が(b)Ground Truth : (出力の理想状態)
機械学習とかディープラーニングについて少しかじった時って、これをどうやってるのか意味が分かんなかったんですよね( ˘ω˘ )
どの本にも画像をクラス分類する(例えば、画像に写ってる数字は何か?、画像に写ってるのは馬か?車か?人か?他のもの?)とか、回帰問題を解くとか書いてあって、画像をこんな風に出力するのがクラス分類???みたいな
自分が何が分かんなかったというと、入力画像をピクセルごとにクラス分類して色付けした結果をまた画像として表示している。ということです。
結局クラス分類を行っていたわけです( ;∀;)
Deep Lerningでは手法というか、ネットワーク構造をいろいろ変えて行うのです。
セグメンテーションの論文とかをいくつか挙げていきたいと思います!(リンクは論文の飛びます。リンク先のPDFから論文を見ることができます)
FCNと呼ばれるものですね!セグメンテーションをやろうという人は一度は見たことあるんじゃないかな。ディープラーニングのセグメンテーションについて先輩に聞いたとき、紹介されたのがこれです
SegNet!!!!超有名なやつ!IEEE で2016年に発表されたものです。論文以外に、SegNetの公式ページがあります( *´艸`)
特徴は、高速・省メモリです。やっぱ、重いもん。セグメンテーション( ;∀;)
SegNetを動かしている動画が☟になります。自動運転とかで使えそうな(੭ु´・ω・`)੭ु⁾⁾
SegNetと同じような出力を出しているけど、格段にきれいに識別できているのがこれ!PSPNet!!論文まだちゃんと読んでないから詳しくは知らないけど( ;∀;)
CVPR2017(コンピュータビジョンのトップ会議。世界中の研究者が集まって研究発表する。2017は7/22-25にホノルルで開催)なので、割と新しいですね!
ムッチャ綺麗にセグメンテーションできてるぅ(੭ु´・ω・`)੭ु⁾⁾
まだDeep Learningを勉強し始めて3ヵ月ほどなので。。。えへへ( *´艸`)
あんまり詳しいことは書けなかったですが、いまセグメンテーションで遊んでて楽しいのです(੭ु´・ω・`)੭ु⁾⁾
No responses yet