二千三百五十五年

"Making peace to build our future, Strong, united, working 'till we fall."

週始論文: 深層学習による超音波撮影結果評価系のシミュレーション環境への導入【2023-06-05】

 読んだ論文の備忘録です。毎週月曜日に更新されます。
 次回以降は毎週7本立てになります。

読んだもの

K. Li, Y. Xu, J. Wang, D. Ni, L. Liu and M. Q. . -H. Meng, "Image-Guided Navigation of a Robotic Ultrasound Probe for Autonomous Spinal Sonography Using a Shadow-Aware Dual-Agent Framework," in IEEE Transactions on Medical Robotics and Bionics, vol. 4, no. 1, pp. 130-144, Feb. 2022, doi: 10.1109/TMRB.2021.3127015.

概要

 脊椎の超音波検査においては、いい感じに超音波画像が映るいい感じの位置にプローブを当てる必要があるのだが、これには訓練と経験を積んでいる専門の検査士が必要なのが現状だ。この論文は、超音波検査をロボットで代替するための自律的なプローブ・ナビゲーション機構として、RL(強化学習)とDL(深層学習)を組み合わせた二元的フレームワークを提案するものである。
 読んでから気づいたが、週始論文【2023-05-22】で扱ったナビゲーションの論文と同じグループによる研究のようだ。

応用上の意義

 超音波検査士はすごい足りてないので機械化できると嬉しい。やはり工科の人間としては、自動化の旗印のもとに全人類を労働から解放したいところでもあるわけだし。

先行研究との比較

 他の研究とは違い、エキスパートによる操作データの蓄積・模倣、あるいは人間による初期位置や走査パターンの設定、または特徴点の抽出(これは人間がプローブのよりよい位置を探る方法を模倣する形になる)も行わない、完全に自律的な、フルスクラッチのナビゲーションシステムの構築に挑戦している。……どうやって?

ポイント

 人間の技士の協力の下で作成した超音波3Dモデルを用いてシミュレーション環境を構築し、そこでRLを走らせてナビゲーションのための学習を行う。RLの構成自体は前回とあまり変わらないようだが、画像内の影(実際の脊椎の超音波撮影において、骨は影として映るので、影の形が今見ているのがどの部位に相当するかの判断材料として使われるそうだ)を検出し、なんかこうその程度によって評価値に補正を掛ける感じのサポートが行われているっぽい。正直よくわからなかった。わかろうとする気力が無かったとも言う。
 ともかくこれでRLでのナビゲーション(決められた目的地に向かって進むための経路を生成するというよりかは、よさげな方向へと移動し続けて目的地にたどり着くことを願うシステムなので探索と言った方が正確だと思う)が構成できるわけだが、RLだけではどこが終着点なのか判断できない(ナビゲーションが収束してプローブが停止する可能性はあるが、そこが目的地である保証はない)。ここを補足するために標準画像を学習させたDLを用い、ナビゲーション中に適宜「今見ているものが目的地っぽいか」を計算、そんな感じだったら最終出力の候補として加える、というプロセスが挟まれる。RLで探索方向を決め、DLで評価してそれを補完するような形になる。

実証手法

 あらかじめ作成してある超音波3Dモデルのシミュレーション内でモデルの能力を確かめる。具体的には、シミュレーション空間内でプローブにランダムな位置・姿勢を与えてナビゲーションをやらせる試行を繰り返し、最終的にたどり着いた地点と正解の位置・角度誤差がどれくらいなのかの誤差を計算することで性能の評価としている。SSIM(2つの画像の間の構造的な類似性を定量的に評価する指標)を用い、モデルが最終的に出力した画像と正解の画像の類似度を評価するという方法も取られていて、興味深い。試行の時間は評価対象に含まなかったようだ(シミュレーション内でかかる時間を計算してもあまり意味はないとは思うが)。
 また、上記の評価をRLやDLなどフレームワークの一部を落としたものと完全なフレームワークの間で比較するアブレーション研究的な分析も行われている。

批判

 前に紹介したときは人間に適用したときの安全性の話を批判として挙げたが、やはりその点は著者の頭にもあるらしく、いかにしてセーフティーを組み込むかという問題提起がこれからの課題として為されていた。あくまでシミュレーションではあるので実装を行うなら解決すべき課題は無数に出てくることだろうと思う。解決するべき課題の例としては、プローブを皮膚に押し付ける力の強さの調整が挙げられている。超音波検査って力感覚で結果変わるレベルで繊細な技巧なんですか?ひょえ~

感想

 そもそも根本的な疑問としてあるのが、ロボットによる検査士の代替が技術的に可能になったところで、ロボットアーム(クソ高い)を含むシステムを大量展開するのが人間を訓練するよりも本当に経済的で適切な解法になるのかという点である。そこまで議論が進むような技術的要件が整えば、自動化の次は経済性のための高速化が研究課題になるのかもしれない。
 SSIMの数式的定義はちょっとよくわからない。ここは要勉強。