二千三百五十五年

"Making peace to build our future, Strong, united, working 'till we fall."

週始論文: 空間周波数に着目した画像分割アーキテクチャ【2023-05-08】

 読んだ論文の備忘録です。毎週月曜日に更新されます。

読んだもの

Jin, S., Yu, S., Peng, J. et al. A novel medical image segmentation approach by using multi-branch segmentation network based on local and global information synchronous learning. Sci Rep 13, 6762 (2023). https://doi.org/10.1038/s41598-023-33357-y

概要

 深層学習の応用が盛んな、医用画像分割(medical image segmentation)のための新たなネットワークとしてMBSNetを提案し、その有効性と特性を検証した論文。

応用上の意義

 正確な画像分割は診断支援・診断の自動化に役立つのでそこに意義がある。今回の論文では、具体的な領域(超音波、MRI等々)の画像分割に特化したものではなく、医用画像の全体を幅広く扱えるようなネットワークの提案が志向されている(逆に言うと、個別具体的な特定の症例・問題を解決するものではなさげ)。

先行研究との比較

 U-Netなどの先行研究で提案されているネットワークよりもより高精度(具体的には、F値などのスコアが高い)で、かつ、計算コストが軽いといううれしさがある。

ポイント

 U-Netに由来するU型のネットワークでは、画像をエンコーディングしていく過程で情報の位置が落ちてしまうという欠点があった。MSBNetでは、大域的で空間周波数の低い情報を扱う枝と局所的で空間周波数の高い情報を扱う枝をある程度独立させたものとして用意してそれぞれ処理させ、あとから2者を結合させて処理することで、その問題の解決を目指している。

実証手法

 いくつかのデータセットについてU-Net等の既存ネットワークを学習させた結果とMSBNetを学習させた結果を複数の指標(F値、G-Mean、IOU、TOPSIS)で比較し、精度において勝っていることを示した。計算コストについての分析も行っている。MSBNet自体の特性を把握するためのアブレーション研究(ablation study)も行われている。ここでは、スコアによる評価によって、完全なMSBNetが一部を無効化したものよりも優れていることが示されているほか(当然クリアしなければいけないハードルではある)、実際に処理した画像について完全なMSBNetとアブレーションしたものの出力を比較・議論する定性的な評価も行われている。わかりやすい。

批判

 Introductionで言ってたU-Net系以外の既存手法(Transformer系とか)との比較がとくに実証されてなかったのが気になる。読み飛ばしてはないと思うんだけど……
 計算コストは低い方ではあるがU-NeXtより重いし、特定の分野(CT)ではパフォーマンスでも負けている。であるからこそ実際に臨床に投入するときはもっと効率化・専門化してパフォーマンスを高めるべきで、そのための手法が必要だ、という結びになっていたのだけれど、どういう方法をとりうるのかは全然わからないので気になる。

感想

 あんまりこの分野の先行研究が頭に入っていなくて意義も文脈も理解できていないきらいがあるので、U-NeXtやViTの論文にあたりたい。PRMとかのネットワークの構成要素がわからず、ネットワークの模式図を見ただけではあんまり設計から機能が読めないのでその辺の把握も課題か。