世界初!熟練医を上回る精度の肝腫瘤画像診断AIを開発 AIによる超音波診断の実用化に大きな期待

【開発したAIのデモ画面】黄色の四角形で囲まれた部分に肝腫瘤(Tumor)が存在する場合の推定確率、およびこの腫瘤が肝細胞癌(HCC)、転移性肝癌(Meta)、肝嚢胞(Cyst)、肝血管腫(Hema)とした場合の推定確率が、画面右上にグラフで表示されている。また、左上には最も高い推定確率を示す腫瘤の診断名とその推定確率が数値で示される。この画像の場合、肝細胞癌(HCC)である確率が99.03%と表示されている。
【開発したAIのデモ画面】黄色の四角形で囲まれた部分に肝腫瘤(Tumor)が存在する場合の推定確率、およびこの腫瘤が肝細胞癌(HCC)、転移性肝癌(Meta)、肝嚢胞(Cyst)、肝血管腫(Hema)とした場合の推定確率が、画面右上にグラフで表示されている。また、左上には最も高い推定確率を示す腫瘤の診断名とその推定確率が数値で示される。この画像の場合、肝細胞癌(HCC)である確率が99.03%と表示されている。

近畿大学医学部(大阪府大阪狭山市)内科学教室(消化器内科部門)教授 西田 直生志、主任教授 工藤 正俊らの研究グループは、超音波検査において4種類の肝腫瘤※1 の画像診断を行う人工知能(AI)を開発し、その精度(正解率)が専門医資格をもつ熟練医を上回ることを世界で初めて報告しました。本研究成果は、AIによる画像認識の精度が熟練医を凌駕したことを示し、AIを活用した超音波診断の実用化に向けた大きな一歩となるものです。
本件に関する論文が、令和4年(2022年)2月27日(日)に、日本消化器病学会の専門誌“Journal of Gastroenterology”にオンライン掲載されました。

【本件のポイント】
●Bモード超音波検査※2 で撮影した4種類の肝腫瘤の画像70,950枚を学習させた、肝腫瘤の画像診断AIモデルを開発
●AIによる4種類の肝腫瘤鑑別、悪性腫瘍鑑別の精度は90%以上で、専門医資格をもつ熟練医の80%を大きく上回る
●本研究成果を生かしたAIモデルを超音波検査支援に用いることで、Bモード超音波検査での肝腫瘤診断精度向上に期待

【研究の背景】
少子高齢化に伴う医療への負担増加が問題となっており、近未来の社会では、AIの持つ速さと正確さを利用して、医療の質向上と効率化を図ることが期待されています。AIの学習方法の一つである「ディープニューラルネットワーク※3」は、ヒトの脳の情報処理を模倣し、データの特徴を自己学習で習得するため複雑なタスク処理が可能であり、多くの分野で導入が始まっています。
一方、肝疾患診療において超音波検査、特にBモード超音波検査は、簡易であるため広く普及しており、肝悪性腫瘍の診断の際に最初に行われる画像検査です。しかし、超音波での映り方はいろいろな因子に影響されるため、画像から病気の有無や進行度合いを診断するには経験が必要であり、初心者や非専門医にとっては正確な診断が困難な場合が多くあります。そこで、Bモード超音波検査の診断精度を高めるための支援技術の開発が望まれています。

【本件の内容】
肝腫瘤は、超音波検査を実施した際にしばしば確認される病変ですが、悪性腫瘍である可能性もあり、検査結果の判断は非常に重要です。研究グループでは、Bモード超音波検査において肝腫瘤の鑑別を支援し、ヒューマンエラーを回避する目的で画像診断用のAIモデルを開発しました。
Bモード超音波検査で撮影した画像のうち、高頻度で確認される4種類の肝腫瘤(肝細胞癌、転移性肝癌、肝嚢胞、肝血管腫)の画像70,950枚を、ディープニューラルネットワークに学習させました。そうして開発したAIモデルによる肝腫瘤の疾患鑑別の精度は90%を超え、専門医資格を持つ熟練医の80%を大きく上回りました。これは世界初の成果であり、AIを活用した超音波検査の実用化に向けた大きな一歩となります。

【論文概要】
掲載誌:Journal of Gastroenterology(インパクトファクター: 7.527@2020)
論文名:
Artificial intelligence (AI) models for the ultrasonographic diagnosis of liver tumors and comparison of diagnostic accuracies between AI and human experts
(肝腫瘤の超音波診断を支援する人工知能(AI)モデルとAIとヒト熟練医での診断精度の比較)
著 者:
西田 直生志1 *、山川 誠2、椎名 毅2、目加田 慶人3、西田 睦4、坂本 直哉5、西村 貴士6、飯島 尋子6、平井 都始子7、高橋 健8、佐藤 真哉9、建石 良介10、小川 眞弘11、森 秀明12、北野 雅之13、豊田 秀徳14、小川 力15、工藤 正俊1
*責任著者
所 属:
1 近畿大学医学部内科学教室(消化器内科部門)、 2 京都大学大学院医学研究科人間健康科学系専攻、3 中京大学工学部情報工学科、4 北海道大学病院超音波センター、5 北海道大学大学院医学研究科内科学講座(消化器内科学)、6 兵庫医科大学医学部肝胆膵内科、7 奈良県立医科大学附属病院総合画像診断センター、8 京都大学大学院医学研究科消化器内科、9 東京大学大学院医学系研究科消化器内科、10 東京大学大学院医学系研究科病態診断医学講座(臨床病態検査医学)、11 日本大学医学部消化器内科、12 杏林大学医学部消化器内科、13 和歌山県立医科大学医学部消化器内科、14 大垣市民病院消化器内科、15 高松赤十字病院消化器内科

【研究詳細】
近畿大学医学部を中心とする研究グループは、全国の11施設から肝腫瘤のBモード超音波画像を収集し、これらをAIの物体判別アルゴリズムの学習データとして用いることで、Bモード超音波検査において肝腫瘤の診断を支援するAIモデルを開発しました。
遭遇頻度の高い4種類の肝腫瘤のBモード超音波画像70,950枚を、ディープニューラルネットワークの一種である、19層の畳み込みニューラルネットワーク※4 に学習させました。Bモード超音波画像の腫瘤部を正方形に切り出して、4種類の学習画像数がおよそ等しくなるようにデータ拡張を行い、10分割交差検証法※5 にて評価しました。学習データ数の増加に伴い、全体の正診率、疾患ごとの鑑別精度、良悪性の鑑別精度、悪性腫瘍検出の感度、特異度は順調に上昇し、最終的に70,950画像の学習AIモデルでは、4種類の疾患の鑑別精度は91.1%、悪性腫瘍鑑別精度は94.3%(感度:82.8%、特異度:96.7%)であり、高い鑑別能を示しました。
本研究では、テスト用肝腫瘤動画を用いて、AIと熟練医の診断能の比較も行っています。AIの診断にはBモード超音波の動画から5フレームの静止画を選び、3フレーム以上で一番高い推定確率を示す疾患をAIの診断としました。一方、ヒトは静止画のみから診断することは通常極めて困難なため、動画を観察して診断しました。この結果、AIの4疾患鑑別精度は89.1%、悪性腫瘍鑑別精度は90.9%であったのに対して、熟練医5名の4疾患鑑別精度の中央値は67.3%(分布:63.6%~69.1%)、悪性腫瘍鑑別精度の中央値は80.0%(分布:74.5%~83.6%)であり、AIの精度が熟練医の結果を大きく上回りました。また、正しい診断に対するAIの推定確率は、学習データ数が多いほど上昇しており、これはAIが学習を増やすことにより信頼性の高い正解を出力できることを示しています。肝腫瘤のBモード超音波診断において、本AIモデルを活用することにより、非専門医においても熟練医を上回る診断を行うことができると期待されます。

【研究支援】
本研究は、日本超音波医学会の人工知能開発事業の一環として、AMEDのICT基盤構築・人工知能実装事業の支援を受けて行なわれました。

【用語解説】
※1 肝腫瘤:肝臓にできた、こぶや固まりのことを示す。原因が明らかでなく、腫瘍性のものや炎症性のものを含む。
※2 Bモード超音波検査:最もよく使用される超音波検査法であり、超音波の反射の強弱に応じて画像の明るさ(エコー輝度)が変化することにより、リアルタイムの2次元画像が得られる。
※3 ディープニューラルネットワーク:AIの学習法であるディープラーニングの一つで、通常のニューラルネットワークから層の数を増やし、より複雑な学習が可能となっている。
※4 畳み込みニューラルネットワーク:データ(主に画像)の特徴抽出をAI自体が行うため、人が抽出作業を行う必要がなく、データから直接学習することができるディープラーニング。医用画像や、音声認識の学習の際によく使用される。
※5 10分割交差検証法:データを10個に分割し、1つをテストデータ、残りを学習データとして、AIモデルを評価する方法。小規模のデータ群で学習させる際に有効である。

【関連リンク】
医学部
https://www.kindai.ac.jp/medicine/

医学部 医学科 教授 西田 直生志 (ニシダ ナオシ)
https://www.kindai.ac.jp/meikan/653-nishida-naoshi.html

医学部 医学科 教授 工藤 正俊 (クドウ マサトシ)
https://www.kindai.ac.jp/meikan/569-kudou-masatoshi.html