مقاومت به انسولین (IR)، که در آن سلولهای بدن به درستی به انسولین، هورمونی حیاتی برای تنظیم قند خون، پاسخ نمیدهند، پیشساز اصلی دیابت نوع ۲ است. این بیماری صدها میلیون نفر را در سراسر جهان تحت تأثیر قرار داده و شیوع آن رو به افزایش است. تشخیص زودهنگام مقاومت به انسولین اهمیت بالایی دارد، زیرا تغییرات سبک زندگی میتواند اغلب آن را معکوس کرده و از شروع دیابت نوع ۲ جلوگیری یا آن را به تأخیر اندازد. با این حال، روشهای فعلی برای اندازهگیری دقیق IR، مانند گیره انسولین یوگلیسمی یا HOMA-IR، اغلب تهاجمی، گرانقیمت یا به راحتی در معاینات معمول در دسترس نیستند. این موانع، تشخیص و مداخله زودهنگام را دشوار میسازند، به ویژه برای افرادی که ناآگاهانه در معرض خطر قرار دارند.
در مقاله “پیشبینی مقاومت به انسولین از ابزارهای پوشیدنی و نشانگرهای زیستی معمول خون”، ما به بررسی مجموعهای از مدلهای یادگیری ماشین میپردازیم که پتانسیل پیشبینی IR را با استفاده از دادههای موجود برای بسیاری از افراد، از جمله دادههای دستگاههای پوشیدنی (مانند ضربان قلب در حالت استراحت، تعداد قدمها، الگوهای خواب) و آزمایشهای خون معمول (مانند گلوکز ناشتا، پانل لیپید) دارند. این رویکرد عملکرد قوی را در جمعیت مورد مطالعه (N=1,165) و یک گروه اعتبارسنجی مستقل (N=72)، به ویژه در افراد پرخطر مانند افراد چاق و دارای سبک زندگی بیتحرک، نشان میدهد.
علاوه بر این، ما عامل سواد و درک مقاومت به انسولین (یک عامل اولیه IR) را معرفی میکنیم که بر پایه مدلهای زبان بزرگ (LLM) پیشرفته جمینای ساخته شده است. این عامل به درک مقاومت به انسولین، تسهیل تفسیر و ارائه توصیههای شخصیسازی شده و ایمن کمک میکند. این کار پتانسیل تشخیص زودهنگام افراد در معرض خطر دیابت نوع ۲ را فراهم میآورد و از این طریق اجرای زودهنگام استراتژیهای پیشگیرانه را تسهیل میکند. لازم به ذکر است که مدلها، پیشبینیها و عامل سواد و درک مقاومت به انسولین تنها برای اهداف اطلاعاتی و تحقیقاتی در نظر گرفته شدهاند.
پیشبینی مقاومت به انسولین با استفاده از نشانگرهای زیستی دیجیتال و آزمایشهای خون معمول
ما مطالعهای با عنوان WEAR-ME را طراحی کردیم تا پتانسیل پیشبینی مقاومت به انسولین (از طریق پیشبینی HOMA-IR) را با استفاده از دادههای به راحتی قابل دسترس بررسی کنیم. برای خودکارسازی فرآیند جمعآوری دادهها برای نشانگرهای زیستی معمول خون، با شرکت Quest Diagnostics همکاری کردیم. این مطالعه با تأیید هیئت بازبینی سازمانی (IRB) انجام شد و همه ۱,۱۶۵ شرکتکننده از سراسر ایالات متحده، از طریق برنامه Google Health Studies، رضایت الکترونیکی آگاهانه و مجوز HIPAA را پیش از ثبتنام ارائه دادند.
گروه شرکتکنندگان از نظر سن، جنسیت، جغرافیا و شاخص توده بدنی (BMI) متنوع بود؛ میانگین BMI ۲۸ کیلوگرم بر متر مربع، میانگین سنی ۴۵ سال و میانگین HbA1c 5.4% بود. شرکتکنندگان رضایت دادند تا دادههای پوشیدنی از دستگاههای Fitbit یا Google Pixel Watch (مانند ضربان قلب در حالت استراحت، تعداد قدمها، الگوهای خواب)، نتایج نشانگرهای زیستی معمول خون (مانند گلوکز ناشتا و انسولین، پانل لیپید) و اطلاعات جمعیتشناختی و نظرسنجیها را به اشتراک بگذارند. این دادهها به صورت مستعار برای حفظ حریم خصوصی جمعآوری شدند.
با استفاده از این مجموعه داده غنی و چندوجهی که ما آن را “دادههای WEAR-ME” مینامیم، مدلهای شبکه عصبی عمیق را برای پیشبینی امتیازات HOMA-IR توسعه و آموزش دادیم. هدف ما بررسی میزان دقت تخمین این نشانگر کلیدی IR با استفاده از ترکیبهای مختلف دادههای موجود بود. این رویکرد به ما امکان میدهد تا به دنبال راههای جدیدی برای تشخیص زودهنگام مقاومت به انسولین باشیم، که میتواند به مداخلات سبک زندگی به موقع برای جلوگیری یا به تأخیر انداختن شروع دیابت نوع ۲ منجر شود.
زیرگروههای متابولیک دیابت نوع 2. مقاومت مزمن به انسولین پیشساز تقریباً ۷۰٪ از موارد دیابت نوع 2 است و از ترکیبی از چاقی، سبک زندگی بیتحرک و عوامل ژنتیکی ناشی میشود.
تصویری از خط لوله مدلسازی پیشنهادی ما برای پیشبینی HOMA-IR، و تفسیر نتایج با عامل آموزش و درک مقاومت به انسولین.
پیشبینیهای قدرتمند از منابع داده ترکیبی
نتایج ما، با استفاده از معیار سطح زیر منحنی مشخصه عملکرد گیرنده (auROC)، نشان میدهد که ترکیب جریانهای داده به طور قابل توجهی دقت پیشبینی را در مقایسه با استفاده از هر منبع به تنهایی بهبود بخشید. این یافته بر اهمیت دیدگاه جامعنگر به سلامت تأکید دارد، جایی که دادههای مختلف از منابع گوناگون میتوانند به یکدیگر کمک کرده و تصویری دقیقتر از وضعیت متابولیک فرد ارائه دهند.
به طور خاص، ترکیب دادههای پوشیدنی و اطلاعات جمعیتشناختی قدرت پیشبینی قابل قبولی برای طبقهبندی مقاومت به انسولین (auROC = 0.70) نشان داد. افزودن نتایج گلوکز ناشتا به این ترکیب، ارزش بسیار بالایی را به مدل اضافه کرد و عملکرد را به طور چشمگیری افزایش داد (auROC = 0.78). گلوکز ناشتا یک آزمایش خون معمول و نسبتاً ارزان است که اطلاعات مهمی در مورد تنظیم قند خون ارائه میدهد.
در نهایت، ترکیب دادههای پوشیدنی، اطلاعات جمعیتشناختی و نتایج کامل پانلهای خون روتین (شامل لیپیدها و سایر نشانگرها) بهترین نتایج را به دست آورد. این مدل با دقت بالایی مقادیر HOMA-IR را پیشبینی کرد (R² = 0.50) و افراد مبتلا به مقاومت به انسولین را به طور مؤثر طبقهبندی کرد (auROC = 0.80، حساسیت = ۷۶%، ویژگی = ۸۴%، جایی که مقدار HOMA-IR 2.9 یا بالاتر به عنوان آستانه مقاومت به انسولین در نظر گرفته شد). این نتایج نشاندهنده پتانسیل بالای این رویکرد ترکیبی برای ارائه یک ابزار غربالگری قوی و غیرتهاجمی برای مقاومت به انسولین است.
سمت چپ: ارزیابی عملکرد پیشبینی IR (طبقهبندی). سمت راست: تجسم منحنی دقت-بازیابی برای مجموعههای ویژگی انتخاب شده. مقادیر میانگین با رنگها مشخص شدهاند، با نواحی خاکستری اطراف هر خط که انحراف معیار در پنج بخش را نشان میدهد.
مهمترین عوامل مؤثر بر دقت پیشبینی
نتایج ما نشان میدهد که ویژگیهای استخراج شده از دادههای پوشیدنی، مانند ضربان قلب در حالت استراحت، به طور مداوم در میان مهمترین پیشبینیکنندهها، در کنار BMI و گلوکز ناشتا، قرار داشتند. این یافته بر اهمیت بالای سیگنالهای مربوط به سبک زندگی که توسط دستگاههای پوشیدنی ثبت میشوند، تأکید میکند.
شاخص توده بدنی (BMI) که یک معیار ساده اما قدرتمند از چاقی است، نقش حیاتی در پیشبینی مقاومت به انسولین ایفا میکند، چرا که چاقی از قویترین عوامل خطر برای مقاومت به انسولین و دیابت نوع ۲ است. این نشان میدهد که حتی بدون اندازهگیریهای پیچیده، اطلاعات اساسی بدن میتواند بینشهای ارزشمندی را ارائه دهد.
گلوکز ناشتا، به عنوان یک نشانگر زیستی سنتی خون، نیز به طور قوی با مقاومت به انسولین مرتبط است. این سه عامل – دادههای پوشیدنی، BMI و گلوکز ناشتا – به نظر میرسد ترکیبی قدرتمند را برای ساخت مدلهای پیشبینی دقیق تشکیل میدهند. این بینشها نه تنها به ما در ساخت مدلهای بهتر کمک میکنند، بلکه مسیرهایی را برای مداخلات هدفمندتر برای افراد در معرض خطر مقاومت به انسولین نشان میدهند.
نمودار سانکی نشاندهنده اهمیت نسبی ویژگی (مقادیر SHAP) برای هر یک از مدلهای رگرسیون مستقیم XGBoost پیشنهادی غیرخطی.
عملکرد بهبود یافته در گروههای پرخطر
از آنجایی که افراد دارای چاقی و سبک زندگی بیتحرک به ویژه در برابر ابتلا به دیابت نوع ۲ آسیبپذیر هستند، ما به طور خاص عملکرد مدل خود را در این زیرگروهها ارزیابی کردیم. هدف این بود که بفهمیم آیا مدل ما میتواند به طور مؤثرتری این جمعیتهای در معرض خطر را شناسایی کند، جایی که تشخیص زودهنگام میتواند بیشترین تأثیر را داشته باشد.
در میان شرکتکنندگان چاق، مدل دقت بالاتری را در مقایسه با کل جمعیت نشان داد (حساسیت = ۸۶% در مقابل ۷۶%). برای شرکتکنندگان بیتحرک، دقت حتی بالاتر از زیرگروه چاق بود (حساسیت = ۸۸%). این یافته بر اهمیت دادههای پوشیدنی در تشخیص خطر مقاومت به انسولین در افرادی که ممکن است به دلیل عدم فعالیت بدنی مستعد این وضعیت باشند، تأکید میکند.
قابل توجه است که در گروهی که هم چاق و هم بیتحرک بودند، مدل عملکرد بسیار خوبی از خود نشان داد (حساسیت = ۹۳%، ویژگی تنظیم شده = ۹۵%). این نتایج نشان میدهد که رویکرد ما میتواند به ویژه در شناسایی کسانی که بیشترین بهره را از مداخلات زودهنگام سبک زندگی میبرند، مؤثر باشد.
نتایج عملکرد طبقهبندی برای لایهبندیهای مختلف سبک زندگی.
اعتبارسنجی و تعمیمپذیری در دنیای واقعی
برای اطمینان از اینکه یافتههای ما صرفاً مختص مجموعه داده اولیه ما نیست، بهترین مدل عملکردی خود را (آموزشدیده بر روی دادههای WEAR-ME) بر روی یک گروه اعتبارسنجی کاملاً مستقل (N=72) آزمایش کردیم. این گروه از طریق یک مطالعه جداگانه و با تأیید IRB جذب شده بود و شرکتکنندگان دادههای پوشیدنی و نشانگر زیستی خون را به اشتراک گذاشتند.
نتایج ما در این گروه اعتبارسنجی نشان میدهد که مدلهای آموزشدیده ما عملکرد پیشبینی قوی خود را حفظ کردند (حساسیت = ۸۴%، ویژگی = ۸۱%)، که پتانسیل تعمیمپذیری آن را اثبات میکند. این به این معنی است که مدل میتواند در جمعیتهای مختلف و با استفاده از دادههای جمعآوری شده به روشهای متفاوت، به طور مؤثر عمل کند. این اعتبارسنجی خارجی، اعتماد به قابلیتهای مدل را افزایش میدهد و مسیر را برای تحقیقات بیشتر و در نهایت، کاربرد بالینی هموار میسازد.
با این حال، باید توجه داشت که این هنوز یک نمونه اولیه تحقیقاتی است و ایمنی و اثربخشی آن برای هر هدف مرتبط با سلامتی، هنوز اثبات نشده است. ما متعهد به ادامه تحقیق و توسعه این مدلها هستیم تا از دقت، ایمنی و اثربخشی آنها در مقیاس وسیع اطمینان حاصل کنیم، با این درک که هر فناوری مرتبط با سلامت، نیازمند آزمایشهای دقیق و تأییدیههای نظارتی است.
مروری بر مطالعه گروه اعتبارسنجی مستقل. ما دقت مدلها را از گروه آموزش و آزمایش اولیه با گروه اعتبارسنجی خارجی مقایسه میکنیم و پتانسیل تعمیمپذیری آن را نشان میدهیم.
فراتر از پیشبینی: به سوی درک و اقدامات پیشگیرانه
پیشبینی خطر مقاومت به انسولین ارزشمند است، اما چگونه میتوانیم این اطلاعات را برای افراد قابل درک و قابل اقدام کنیم؟ ما بررسی کردیم که چگونه میتوان مدلهای پیشبینی خود را با مدلهای زبان بزرگ (LLM) ادغام کرد تا کاربران را در درک بهتر سلامت متابولیک خود توانمند سازیم. ما عامل سواد و درک مقاومت به انسولین (یک عامل اولیه IR) را توسعه دادیم که بر پایه LLMهای پیشرفته جمینای ساخته شده است.
هنگامی که سوالی در مورد سلامت متابولیک از آن پرسیده میشود، عامل IR پاسخهای شخصیسازی شده و متنی را برای اهداف آموزشی ارائه میدهد که بر اساس دادههای مطالعاتی فرد و وضعیت پیشبینی شده IR او استوار است. با رضایت کاربر، این عامل قابلیت دسترسی به نقاط داده خاص، جستجو برای اطلاعات بهروز و انجام محاسبات را دارد. این قابلیت تعاملی، عامل را به ابزاری قدرتمند برای آموزش و توانمندسازی افراد تبدیل میکند.
ما از پنج متخصص غدد درونریز دارای بورد تخصصی خواستیم تا پاسخهای عامل IR را در مقایسه با یک مدل پایه ارزیابی کنند. آنها به شدت پاسخهای عامل IR را ترجیح دادند و آنها را به طور قابل توجهی جامعتر، قابل اعتمادتر و شخصیسازیشدهتر یافتند. این نشاندهنده پتانسیل ترکیب مدلهای پیشبینی سلامت با LLMها برای توانمندسازی افراد با درک بهتر سلامت است. لازم به ذکر است که تعامل با این مدلها یا عامل IR صرفاً برای اهداف اطلاعاتی و آموزشی است و جنبه پزشکی ندارد.
تصویری از معماری عامل پیشنهادی که از مدل پیشبینی HOMA-IR برای ارزیابی خطر مقاومت به انسولین برای آموزش کاربران استفاده میکند.
مروری بر عامل سواد و درک مقاومت به انسولین (IR Agent). تصویری از عامل IR پیشنهادی (سمت چپ)، همراه با نتایج (نرخ برد) عامل IR ما در برابر مدل پایه که توسط متخصصان غدد درونریز ارزیابی شده است (سمت راست).
نتیجهگیری و کارهای آتی
تحقیقات ما نشان میدهد که مدلهای یادگیری ماشین که دادههای پوشیدنی به راحتی در دسترس و نشانگرهای زیستی معمول خون را ترکیب میکنند، پتانسیل پیشبینی مؤثر مقاومت به انسولین را دارند. این رویکرد مزایای مهمی از جمله دسترسی بالا، تشخیص زودهنگام (حتی در افراد با قند خون طبیعی)، و مقیاسپذیری بالا برای غربالگری ارائه میدهد. همچنین، عملکرد قوی در زیرگروههای پرخطر و پتانسیل برای ادغام در ابزارهای سلامت شخصیسازی شده را نشان میدهد.
این کار مسیر را برای غربالگری زودهنگام و در دسترستر خطر ابتلا به دیابت نوع ۲ هموار میکند و به طور بالقوه مداخلات سبک زندگی به موقع را که میتواند از این بیماری جلوگیری کند یا آن را به تأخیر اندازد، به ویژه برای کسانی که ناآگاهانه به سمت آن پیش میروند، فعال میسازد.
کارهای آینده شامل اعتبارسنجی طولی این مدلها، بررسی تأثیر مداخلات، گنجاندن دادههای ژنتیکی و میکروبیوم، و همچنین پالایش بیشتر مدلها برای جمعیتهای خاص برای اطمینان از عملکرد عادلانه در گروههای متنوع است. ما معتقدیم که این خط تحقیقاتی، نویدبخش قابل توجهی برای مدیریت فعال و شخصیسازی شده سلامت متابولیک است.
سلب مسئولیت: در حالی که رویکرد پیشنهادی ما، از جمله عامل IR، برای کاربردهای مختلف سلامت امیدبخش است، این تحقیق به طور خاص به نیاز حیاتی برای تشخیص زودهنگام مقاومت به انسولین میپردازد و مدلهای مورد بحث در اینجا را به عنوان دستگاهها یا راهحلهای پزشکی تأیید شده ارائه نمیدهد. مدلها و عامل IR دستگاه پزشکی نیستند و توسط سازمان غذا و داروی ایالات متحده (FDA) یا هیچ سازمان نظارتی دیگری تأیید، تصویب یا بررسی نشدهاند. این کار به عنوان جایگزینی برای مشاوره، تشخیص یا درمان حرفهای پزشکی در نظر گرفته نشده است و نباید مورد استفاده قرار گیرد. استقرار واقعی چنین فناوریهایی مستلزم آزمایشهای دقیق، اعتبارسنجی و تأییدیه نظارتی خواهد بود.
تشکر و قدردانی: تحقیقات شرح داده شده در اینجا کار مشترک گوگل ریسرچ و تیمهای همکار است. محققان زیر در این کار مشارکت داشتهاند: احمد متولی، علی حیدری، دانیل مکدافی، الکساندرو سولات، زینب اسماعیلپور، آنتونی فارانش، منگلیان ژو، دیوید بیساواژ، کانور هنهان، شوتاک پاتل، کتی اسپید، و خاویر ال. پریهتو. گوگل با Quest Diagnostics همکاری کرد تا شرکتکنندگان واجد شرایط بتوانند دادههای نشانگر زیستی خود را که به عنوان بخشی از یک آزمایش خون رایگان دریافت کرده بودند، به اشتراک بگذارند.