生活習慣病の一種である「2型糖尿病」は血液中のブドウ糖(血糖)が正常より多くなる病気だ。一般的に「糖尿病」と表現する場合は、この2型糖尿病を指すことが多いが、子の病気は初期の頃は自覚症状がほとんどない。だが、血糖値を高いまま放置すると、徐々に全身の血管や神経が障害され、いろいろな合併症を引き起こしてしまう厄介なものだ。
現在、2型糖尿病かどうかを調べるには、クリニックに出向いたり、健康診断で血液検査を受ける必要がある。出向く手間もあるが、結果が出るまでにも時間がかかり、気軽に行える物とはほど遠い。だが、新たな研究によれば、録音された10秒間の音声から、8回中7回の精度で糖尿病かどうかを判断できる事が示された。これはアプリとしても利用することが可能で、安価で気軽に糖尿病の予備診断として用いることができる様になるかも知れない。
この研究は国際的なバイオテクノロジー企業Klick Labsの科学者らによって実施された。Klick Labsの研究チームは、最近2型糖尿病の標準検査を受けた267人に、2週間にわたり1日6回、スマートフォンに短いフレーズを録音させた。その後、陽性者と陰性者の間の音響の違いを調べた。
声紋の特徴の有無と、被験者の年齢、性別、身長、体重を組み合わせて、人工知能(AI)モデルが個人の状態を予測した。その結果、男性では86%、女性では89%の精度が得られた。
「音声合成は、呼吸器系、神経系、喉頭の複合的な影響に依存する複雑なプロセスです。これらのシステムに影響を与えるものはすべて、声に影響を与える可能性があります」と研究者たちは書いている。しかし、コンピューターはより微妙な分析を行うことができる。
最も強力な予測ツールは、ピッチと、フレーズを録音したときのピッチの変化であった。その他の手法の中には、女性では「摂動ジッター」、男性では「振幅摂動商シマー」(同上)が予測精度を高め、一方の性についてのみ予測精度を高めるものもあった。
長期的な高血糖は末梢神経や筋繊維にダメージを与え、音声障害を引き起こす可能性があることが、これまでの研究で明らかになっている。糖尿病が悪化させる一時的な血糖値の急上昇も、声帯の弾力性に影響を及ぼすと提唱されているが、これはまだ証明されていない。より間接的には、不安や抑うつが人の声を変化させることがあり、糖尿病はその両方に関与している可能性がある。
「われわれの研究は、2型糖尿病患者とそうでない患者との間で、発声に大きな違いがあることを明らかにし、医学界が糖尿病をスクリーニングする方法を変える可能性があります。現在の検査方法では、多くの時間、移動、費用が必要です。音声技術は、これらの障壁を完全に取り除く可能性を秘めています」と、筆頭著者Jaycee Kaufmanは声明の中で述べた。
糖尿病の罹患率は世界的に急増しており、世界が直面する最も深刻な健康危機のひとつとなっている。糖尿病の結果を予防したり、大幅に軽減したりする多くの介入が遅すぎるため、診断の遅れが大きな原因となっている。
国際糖尿病連合は、成人の糖尿病患者の約半数が自分の糖尿病の状態に気づいていないと推定している。必然的に、その割合は、医療制度が最も遅れている国で最も高くなる。この研究の著者は、未診断の糖尿病が2030年までに世界に年間2兆1000億ドルの損失をもたらすという試算を引用している。
2型糖尿病の特定にはいくつかの検査が用いられるが、いずれも血液サンプルの採取が必要であり、それを避ける人もいる。
「音声テクノロジーは、利用しやすく手頃な価格のデジタル・スクリーニング・ツールとして、医療行為に革命をもたらす可能性があります」と共著者のYan Fossat氏は語った。
Klick Labs社は、より多くのサンプルでこの研究を繰り返すつもりであり、さらに精度を向上させる方法を模索し、糖尿病患者である期間の長さを検出に含めることができるかどうかを探求している。また、この研究を糖尿病前症や高血圧を含む他の疾患にも拡大したいと考えている。
論文
- Mayo Clinic Proceedings: Digital Health: Acoustic Analysis and Prediction of Type 2 Diabetes Mellitus Using Smartphone-Recorded Voice Segments
参考文献
- Kick Labs: AI and 10 seconds of voice can screen for diabetes, new study in Mayo Clinic journal reveals
- via EurekAlert!
研究の要旨
目的
非糖尿病患者とT2DM患者の音声記録の違いを調べることにより、2型糖尿病(T2DM)の事前スクリーニングまたはモニタリングツールとしての音声分析の可能性を調査すること。
対象と方法
2021年8月30日から2022年6月30日の間に、米国糖尿病学会ガイドラインに基づき非糖尿病(女性79名、男性113名)またはT2DM(女性18名、男性57名)と診断された267名の参加者をインドで募集した。スマートフォンのアプリケーションを用い、参加者は決まったフレーズを2週間、毎日6回まで録音し、18,465件の録音が得られた。各録音から14の音響特徴を抽出し、非糖尿病患者とT2DM患者の違いを分析し、T2DM状態の予測方法を作成した。
結果
非糖尿病とT2DMの男女の音声記録間で、データセット全体および年齢と体格指数(BMI[体重(キログラム)を身長(メートル)の2乗で割った値])をマッチさせたサンプルの両方で、有意な違いが認められた。最も高い予測精度を示したのは、女性ではピッチ(P<.0001)、ピッチSD(P<.0001)、相対的平均過管運動ジッター(P=.02)、男性では強度(P<.0001)、11点振幅過動揺(apq11、P<0.0001)であった。これらの特徴を年齢とBMIに組み込んだ最適予測モデルは、年齢とBMIを一致させたサンプルにおいて、5倍のクロスバリデーションにより、女性で0.75±0.22、男性で0.70±0.10の精度を達成した。
結論
全体として、T2DM患者ではT2DM患者でない人に比べて発声に変化が見られる。音声分析は、特にT2DMに関連する他の危険因子と組み合わせた場合、T2DMの事前スクリーニングまたはモニタリングツールとしての可能性を示す。
コメントを残す