二千三百五十五年

"Making peace to build our future, Strong, united, working 'till we fall."

週始論文: 強化学習による超音波エコープローブの誘導 ほか1本【2023-05-22】

 読んだ論文の備忘録です。毎週月曜日に更新されます。

読んだもの1

K. Li et al., "Autonomous Navigation of an Ultrasound Probe Towards Standard Scan Planes with Deep Reinforcement Learning," 2021 IEEE International Conference on Robotics and Automation (ICRA), Xi'an, China, 2021, pp. 8302-8308, doi: 10.1109/ICRA48506.2021.9561295.

概要

 超音波診断においては、標準面(standard plane)が撮影できるようにエコーのプローブを指向する必要がある。そのためのプローブのナビゲーションを、深層強化学習を用いて行おうという研究。

応用上の意義

 超音波画像撮影には熟練が必要で、正確な診断のためには質のいい画像と、それを取れる腕のいい技師が必要不可欠だ。これはうれしくない。超音波診断の需要は最近増えつつあるが、技師を養成していたのではコストがかかるし、技師を養成しなければ技師の過労や筋骨格の病気(絵描きの腱鞘炎みたいな話?)にもつながる。もし超音波計測を自動化できれば専門的労働力の不足を解決できるし、診断をより広い場所で行う(例えば、十分な設備・人的リソースが用意できない僻地での超音波診断とか)ことも可能になるだろう。
 この研究は超音波画像撮影の自動化を究極的な目標としている。

先行研究との比較

 ロボットを用いた超音波撮影の自動化自体は既に行われていたが、標準面に狙いを定めての撮影を自動的に行うという、単に画像を撮影するよりは一段複雑な作業の自動化については自動化が進んでいない(研究自体がなされていないわけではないようだ。MRIなど、近い分野で似たような目標に挑戦している先行研究もある)。この研究はそれに挑戦している。

ポイント

 実際に計測した超音波画像から仮想的な腰椎の超音波モデルを構築し、その中でシミュレーションを行う形で、深層強化学習による5自由度のナビゲーションの学習を行っている。5自由度なのはプローブを計測対象である人間の肌に張り付かせるために、肌との法線方向の1自由度が消費されるため。
 学習手法としてはDQNが用いられた。物理的にありえないような姿勢へとプローブが誘導されるのを阻止するための制限と、人間の動きを模倣するための注意機構の実装なども行われているが、この辺への理解がまだまだ弱いので正直よくわからない。

実証手法

 実データを基に構築した超音波モデル内で実際に学習した結果のモデルを走らせて、定量的に精度の評価を行っている。confidence optimazationの効果を確かめるため、それがある場合と無い場合での結果の比較も行っていた。ablation studyに近い発想だ。

批判

 あくまで仮想的に構築した超音波モデルの中でシミュレーションを行って学習・評価を行っているので、それを実装するときに乗り越えるべき課題がいくつもあると思う。ロボットによる撮影の安全性の担保は典型的なものの一つだが、これについては先行研究にもある程度の蓄積がありそうだ。

感想

 実際に臨床に投入する際に大きな課題になるだろう、患者内および患者間でのデータのばらつきが生みうる誤差に対しても議論がなされていて興味深かった。実際にROSとかを叩いてこういう研究を実行する能力は私にはないが、身に着けた方が良いと思う。
 DQNへの理解があまりないのでMethodの理解の解像度が低い。補完する必要がある。先週も似たようなことを言っていた記憶がある。ネットワークと訓練手法の種類が多すぎるきらいがある…… ってかconfidence-awareって何?


読んだもの2

Si-Wook, L., Hee-Uk Ye, Kyung-Jae, L., Woo-Young, J., Jong-Ha, L., Seok-Min Hwang, & Yu-Ran Heo. (2021). Accuracy of new deep learning model-based segmentation and key-point multi-detection method for ultrasonographic developmental dysplasia of the hip (DDH) screening. Diagnostics, 11(7), 1174. doi:https://doi.org/10.3390/diagnostics11071174

概要

 超音波計測を用いたDevelopmental Dysplasia of the Hip (DDH) のスクリーニング支援のための深層学習モデル開発、およびその評価を行っている論文。モデルは、診断のために必要な解剖学的な要点の位置を画像から検出し、その位置関係から得られる情報(詳細後述)を計算するものになっている。具体的な疾患に関連するデータセットを使って具体的な疾患の診断支援のためのモデルを組んでいる論文になる。

応用上の意義

 DDHのスクリーニングが支援される。超音波計測では撮影者内、あるいは撮影者間での結果のばらつきないし診断者内、あるいは診断者間での結果のばらつきが大きく、これを平準化するために人間以外の方法による診断支援手法を提案することには意義がある。

先行研究との比較

 こういう特徴点検出タスクにはR-CNNというネットワークが用いられてきたが、これは非常に遅い。Fast R-CNNという改良版もなお遅い。今回用いられるのは、それのさらなる改良版であるFaster R-CNNをベースにしたMask R-CNNになる。論文の著者によれば、CNNを用いて超音波画像から特徴点を抽出するような研究には前例がないらしい(!)。

ポイント

 DDHの診断は、股関節の超音波画像からalpha Glaf-angleとbeta Glaf-angleを算出することによって為されるのだが、その計算に必要な特徴点を深層学習で発見・位置指定することを目標としている。これは人間の医師が実際にやる診断プロセスをまねたもの(過去の研究では、特徴点ではなく領域をセグメンテーションすることで角度を算出する手法が用いられたこともあったようだ)。Mask R-CNNのネットワーク構造あたりの話はちょっとよくわからない、知らないので。先端分野は本当に手法の数が多すぎる。R-CNNからMask R-CNNの登場までも10年程度しか掛かっていないらしいし、みんなマジでこんなんキャッチアップしてんの……?という気持ちに……

実証手法

 複数の人間の医者の間で関連するパラメータが同じように推定される、人間の医者とAIの双方にとって必要なパラメータが計算可能である、などなどの条件を満たした、質のいい画像を検証用のデータとして用い、そのような画像に対して人間がalpha Glaf-angleなどの測定を行ったときの数値と、AIによる推定値が統計的に一致することが、intraclass correlation coefficient (ICC) などの指標を用いて、有意性検定によって確かめられた。ICCって何?カッパ係数って何?……というのは後で見るにして、ともかく、両者の間に一定の相関関係が存在することをもってAIの質の保証としているようだ。

批判

 質のいいデータしか扱っていないのでより幅の広いデータに対して同じことが言えるのかという点には問題がありそう。ある種の自家中毒を起こしている可能性はあると思う。データセット自体も二人の医師の診断から引っ張ってきているらしく、それによって診断者間のばらつきを平均することに失敗している可能性はあるとは指摘されていた。

感想

 computer aided diagnosis (CAD) とか、computer aidedなDを全部CADで略すのはまずいと誰かが考えなかったんだろうか。これからどんどん増えていきそうではある。
 この論文でもそうだし、だいたいの深層学習による診断支援でもそうだった気がするが、人間が診断で用いているプロセスを定性的に模倣し、一部を深層学習で置換する手法によって研究が進められている節があると思う。悪くはないと思うが、そういう手法でAIが人間以上の能力を獲得することはあるんだろうか。個別具体的な事例についてまで粒度を落として考えないと議論が出来なさそうな話ではあるが。