مقدمه: چالش دادههای ناقص در حسگرهای پوشیدنی
دستگاههای پوشیدنی انقلابی در نظارت بر سلامت ایجاد کردهاند و دادههای فیزیولوژیکی و رفتاری پیوسته و چندوجهی را ارائه میدهند. این دادهها شامل سیگنالهای قلبی، الگوهای خواب، سطوح فعالیت و شاخصهای استرس است. با پیشرفت فناوری حسگرها، امکان جمعآوری حجم وسیعی از دادهها بهطور فزایندهای فراهم شده است. با این حال، هزینه برچسبگذاری این دادهها بالا باقی میماند و اغلب نیاز به حاشیهنویسیهای لحظهای کاربر یا مطالعات بالینی پرزحمت دارد. در اینجاست که یادگیری خودنظارتی (SSL) وارد عمل میشود و با استفاده مستقیم از دادههای بدون برچسب، ساختارهای زیربنایی، مانند روابط ظریف فیزیولوژیکی را کشف میکند. هنگامی که SSL در مقیاس بزرگ به کار گرفته شود، میتواند به ایجاد مدلهای بنیادی منجر شود که بازنماییهای غنی و قابل تعمیم را برای طیف گستردهای از وظایف سلامتی پاییندستی تولید میکنند.
اما، در کاربرد SSL در حوزه دستگاههای پوشیدنی، یک محدودیت بحرانی وجود دارد: روشهای پیشرفته SSL فرض میکنند که دادهها کامل و بدون وقفه هستند، حال آنکه این وضعیت در جریانهای داده حسگر پوشیدنی در دنیای واقعی نادر است. شکافها به ناچار به دلیل برداشتن دستگاه، شارژ، شل شدن متناوب، آرتیفکتهای حرکتی، حالتهای صرفهجویی در باتری یا نویز محیطی رخ میدهند که ما آن را “ناقص بودن” مینامیم. در حقیقت، ما دریافتیم که هیچ یک از 1.6 میلیون پنجره یک روزه ما، 0% ناقصی نداشته است.
از لحاظ تاریخی، چالش دادههای تکهتکه، محققان را مجبور کرده است که یا به روشهای جایگزینی (imputation) برای پر کردن بخشهای از دست رفته تکیه کنند، یا به فیلترینگ شدید برای حذف نمونههای دارای دادههای ناقص بپردازند. هیچ یک از این روشها راهحل بهینهای نیستند، زیرا اولی ممکن است سوگیریهای ناخواستهای را ایجاد کند، در حالی که دومی دادههای ارزشمند را دور میریزد. این پارادایمهای سنتی مانع از بهرهبرداری کامل از پتانسیل دادههای جمعآوریشده توسط دستگاههای پوشیدنی میشوند و نیاز به رویکردی نوآورانه را برجسته میسازند که بتواند ذاتاً با واقعیتهای دادههای دنیای واقعی کنار بیاید.
ناقص بودن دادهها در ضبطهای حسگر پوشیدنی امری فراگیر است. حالتهای رایج ناقص بودن در بالا در یک نمونه یک روزه از دادههای حسگر پوشیدنی چندوجهی برجسته شدهاند. ما خاطرنشان میکنیم که هیچ نمونهای از بین 1.6 میلیون پنجره یک روزه ما، 0% ناقصی نداشته است.
معرفی LSM-2 و رویکرد AIM
در مقاله “LSM-2: Learning from Incomplete Wearable Sensor Data”، ما Adaptive and Inherited Masking (AIM) را معرفی میکنیم، یک چارچوب جدید آموزش SSL که مستقیماً از دادههای ناقص یاد میگیرد. AIM به جای آنکه شکافهای داده را اندازهگیریهای اشتباهی بداند که باید پر شوند، با ناقص بودن به عنوان یک مصنوع طبیعی از دادههای دنیای واقعی برخورد میکند و مستقیماً از ضبطهای ناقص یاد میگیرد. با استفاده از AIM، ما یک مدل حسگر بزرگ (LSM-2) توسعه دادیم که مدل بنیادی قبلی ما برای دادههای حسگر پوشیدنی (LSM-1، ارائه شده در ICLR ‘25) را بهبود میبخشد.
ما نشان میدهیم که LSM-2 حتی زمانی که حسگرها از کار میافتند یا پنجرههای زمانی حذف میشوند، عملکرد قوی از خود نشان میدهد و تخریب قابل توجهی کمتری نسبت به مدلهای آموزشدیده بر روی دادههای جایگزین شده دارد. این توانایی LSM-2 برای مدیریت بومی ناقص بودن دادهها، آن را به ابزاری قدرتمند برای کاربردهای عملی در حوزه سلامت تبدیل میکند. نوآوری اصلی در اینجا در تغییر رویکرد از اجتناب یا “تعمیر” ناقص بودن دادهها به “پذیرش” و یادگیری از آن نهفته است. این امر به مدل اجازه میدهد تا یک درک عمیقتر و واقعیتر از الگوهای دادهای که در محیطهای پوشیدنی رخ میدهند، ایجاد کند.
هدفگذاری با پوشش انطباقی و موروثی (AIM)
در قلب نوآوری AIM، رویکرد منحصربهفرد آن در مدیریت شکافهای اجتنابناپذیر در دادههای حسگر دنیای واقعی قرار دارد. بر خلاف روشهای سنتی SSL که دادههای ناقص را دور میاندازند یا تلاش میکنند مقادیر از دست رفته را پر کنند، AIM این شکافها را به عنوان ویژگیهای طبیعی دادههای پوشیدنی میپذیرد. AIM به عنوان توسعهای از چارچوب پیشآموزشی masked autoencoder (MAE)، ساختار زیربنایی دادههای حسگر را با بازسازی نمونههای ورودی پوشانده شده یاد میگیرد. این بازسازی به مدل کمک میکند تا روابط زمانی و مکانی را حتی در حضور دادههای ناقص، به طور مؤثر درک کند.
با این حال، در حالی که روشهای سنتی MAE به یک نسبت پوشش ثابت برای فعال کردن حذف مؤثر توکنهای پوشانده شده (یعنی تعداد ثابتی از توکنهای پوشانده شده از طریق رمزگذار عبور نمیکنند و در نتیجه پیچیدگی محاسباتی کاهش مییابد) متکی هستند، تکهتکه شدن در دادههای حسگر غیرقابل پیشبینی است و منجر به تعداد متغیری از توکنهای پوشانده شده میشود. AIM این چالش اساسی دادههای پوشیدنی را با ترکیب حذف توکن با پوشش توجه برطرف میکند. در طول پیشآموزش، مجموعه توکنهایی که باید پوشانده شوند شامل توکنهای موروثی و ذاتی در دادههای حسگر پوشیدنی به علاوه توکنهایی است که به عمد برای هدف آموزش بازسازی پوشانده شدهاند.
AIM ابتدا حذف را برای تعداد ثابتی از توکنهای پوشانده شده اعمال میکند و کارایی محاسباتی پیشآموزش را با کاهش طول دنباله پردازش شده توسط رمزگذار بهبود میبخشد. سپس AIM با هر توکن پوشانده شده باقیمانده – چه به طور طبیعی از دست رفته باشد و چه بخشی از وظیفه بازسازی باشد – از طریق پوشش توجه در بلوک ترانسفورمر رمزگذار به طور انطباقی برخورد میکند. در طول تنظیم دقیق و ارزیابی وظایف تمایزدهنده، جایی که توکنهای پوشانده شده صرفاً شامل شکافهای دادهای طبیعی هستند، AIM از پوشش توجه برای همه توکنهای پوشانده شده استفاده میکند. از طریق این رویکرد پوشش دوگانه، و با برخورد با توکنهای طبیعی و مصنوعی پوشانده شده به عنوان معادل، AIM به مدل میآموزد که با تکهتکه شدن متغیر ذاتی حسگرهای پوشیدنی کار کند.
پیشآموزش (A) و ارزیابی (B) AIM برای LSM-2. در طول پیشآموزش، AIM از ماسک مصنوعی برای یادگیری بازسازی و از ماسک موروثی برای مدلسازی ناقص بودن در دنیای واقعی استفاده میکند. سپس، در طول ارزیابی، میتوانیم از جاسازی آگاه از ناقص بودن برای پیشبینی اهداف سلامتی، مانند فشار خون بالا، مستقیماً از دادههای حسگر ذاتاً تکهتکه استفاده کنیم.
آموزش و ارزیابی مدل
ما از مجموعه دادهای با 40 میلیون ساعت داده پوشیدنی که از بیش از 60,000 شرکتکننده در دوره مارس تا مه 2024 نمونهبرداری شده است، استفاده میکنیم. این مجموعه داده به طور کامل ناشناس یا شناساییزدایی شده است تا اطمینان حاصل شود که اطلاعات شرکتکنندگان حذف شده و حریم خصوصی حفظ میشود. افراد از انواع ساعتهای هوشمند و ردیابهای Fitbit و Google Pixel استفاده میکردند و رضایت خود را برای استفاده از دادههایشان برای تحقیق و توسعه محصولات و خدمات جدید سلامتی و تندرستی اعلام کردند. از افراد خواسته شد تا جنسیت، سن و وزن خود را گزارش کنند.
برای پیشآموزش LSM-2، ما از تکنیک SSL AIM استفاده میکنیم. AIM یک هدف آموزش بازسازی پوشانده شده را پیادهسازی میکند و یاد میگیرد دادههایی را که به طور طبیعی از دست رفتهاند درک کند و دادههایی را که به طور مصنوعی پوشانده شدهاند، پر کند. این چارچوب یکپارچه به LSM-2 اجازه میدهد تا ساختار زیربنایی (از جمله ناقص بودن) ذاتی در دادههای حسگر پوشیدنی را یاد بگیرد. این رویکرد جامع به مدل امکان میدهد تا الگوهای پیچیده و وابستگیهای زمانی را در دادههای پوشیدنی، حتی در حضور چالشهای رایج دنیای واقعی، کشف کند.
ما مجموعهای از وظایف پاییندستی را برای ارزیابی مدل پیشآموزشدیده، با استفاده از ابردادههایی که همراه با سیگنالهای حسگر برای اهداف تحقیق و توسعه جمعآوری شده بودند، تنظیم کردیم. این وظایف شامل فعالیتهای برچسبگذاری شده توسط کاربر از مجموعهای متشکل از 20 دسته مختلف (مانند دویدن، اسکی، قایقرانی و گلف بازی کردن) و تشخیصهای خودگزارشی فشار خون بالا و اضطراب بود. این دادهها به مجموعههای تنظیم دقیق و ارزیابی تقسیم شدند، به طوری که دادههای هر فرد فقط در یکی از مجموعههای تنظیم یا ارزیابی قرار داشت و نه هر دو. دادههای افراد مورد استفاده در مرحله پیشآموزش نیز در مراحل تنظیم دقیق یا ارزیابی گنجانده نشدند تا از نشت داده و ارزیابی عینی اطمینان حاصل شود.
قابلیتهای مولد LSM-2 از طریق وظایف جایگزینی تصادفی، درونیابی زمانی، برونیابی زمانی (پیشبینی) و جایگزینی حسگر، که در کار LSM-1 ما توضیح داده شدهاند، ارزیابی میشوند. علاوه بر این، کاربرد جاسازیهای LSM-2 از طریق یک کاوشگر خطی بر روی تعدادی از وظایف تمایزدهنده ارزیابی میشود. به طور خاص، ما کاربرد جاسازیهای LSM-2 را برای وظایف طبقهبندی دوتایی فشار خون بالا، طبقهبندی دوتایی اضطراب و شناسایی فعالیت 20 کلاسه اندازهگیری میکنیم. همچنین قابلیت LSM-2 برای مدلسازی فیزیولوژی را از طریق وظایف رگرسیون سن و BMI ارزیابی میکنیم.
نتایج کلیدی
مدل LSM-2 مبتنی بر AIM تطبیقپذیری قابل توجهی را نشان میدهد و از سلف خود، LSM-1، در سه حوزه کلیدی پیشی میگیرد: طبقهبندی شرایط و فعالیتهای سلامتی (مانند فشار خون بالا، اضطراب و تشخیص فعالیت 20 کلاسه)، بازسازی دادههای از دست رفته (مانند بازیابی سیگنالهای حسگر از دست رفته) و پیشبینی معیارهای سلامت پیوسته (مانند BMI با همبستگی بهبود یافته). مقایسههای بیشتر با خطوط پایه نظارتشده و پیشآموزشدیده را میتوانید در مقاله ما بیابید.
LSM-2 ناقص بودن در دنیای واقعی را بدون جایگزینی مدلسازی میکند، که به آن امکان میدهد خطای بازسازی پایینتر (چپ) و امتیازات طبقهبندی بالاتر (راست) را در مقایسه با LSM-1 به دست آورد.
LSM-2 در سناریوهای واقعبینانه که حسگرها از کار میافتند یا دادهها ناقص هستند، برتری مییابد. شکل زیر وضعیتهایی را شبیهسازی میکند که در آن ممکن است کل فیدهای حسگر یا دادهها برای کل بخشهایی از روز از دست رفته باشند. این امر واقعیت را منعکس میکند که دستگاههای پوشیدنی مختلف ممکن است بار حسگرهای متفاوتی داشته باشند، یا اینکه یک فرد ممکن است دستگاه خود را فقط برای بخشهایی از روز استفاده کند. در اینجا ما دریافتیم که LSM-2 مبتنی بر AIM در برابر این حذفها نسبت به LSM-1 مقاومتر است و تخریب عملکرد کمتری را نشان میدهد. این نشاندهنده توانایی بالای LSM-2 در حفظ دقت و کارایی حتی در شرایط دادههای نامطلوب است.
LSM-2 نسبت به دادههای از دست رفته مقاومتر از LSM-1 است و هنگامی که کل فیدهای حسگر یا دورههایی از روز حذف میشوند، کمتر از عملکرد اصلی خود (خط نقطهچین) نسبت به سلف خود تخریب میشود.
در نهایت، LSM-2 مقیاسپذیری بهبود یافتهای را در میان کاربران، حجم داده، محاسبات و اندازه مدل در مقایسه با LSM-1 نشان میدهد. در حالی که سلف آن نشانههایی از فلاتزدگی را نشان میدهد، LSM-2 با دادههای بیشتر به بهبود خود ادامه میدهد و هنوز به اشباع نرسیده است. این توانایی مقیاسپذیری به این معنی است که LSM-2 پتانسیل بیشتری برای تبدیل شدن به یک مدل بنیادی جهانی برای دادههای حسگر پوشیدنی دارد، زیرا میتواند با حجمهای فزایندهای از دادهها و کاربردها سازگار شود. این یک گام مهم به سوی توسعه سیستمهای سلامت هوشمندتر و جامعتر است.
LSM-2 مقیاسپذیری بهبود یافتهای را نسبت به LSM-1 در میان افراد، دادهها، محاسبات و اندازه مدل نشان میدهد.
نتیجهگیری
مدل بنیادی LSM-2، که با AIM پیشآموزش دیده است، نشاندهنده پیشرفت در جهت فناوری سلامت پوشیدنی مفیدتر و قابل استفادهتر است. اساساً، AIM به LSM-2 میآموزد که شکافهای طبیعی در جریانهای حسگر دنیای واقعی را درک و از آنها استفاده کند تا بینشهای قابل اعتمادی از دادههای ناقص به دست آورد. این نوآوری به این معنی است که هوش مصنوعی پوشیدنی میتواند سرانجام واقعیت آشفته دادههای حسگر را بپذیرد، یکپارچگی دادهها را حفظ کند، در حالی که از تمام اطلاعات موجود استفاده میکند. این امر گامی بزرگ به سوی دستگاههای پوشیدنی هوشمندتر است که میتوانند بدون نیاز به مداخله دستی یا پردازشهای پیچیده، اطلاعات ارزشمندی را حتی در شرایط دشوار نیز ارائه دهند.
این رویکرد نشاندهنده یک تغییر پارادایم از تلاش برای کامل کردن دادهها به سمت یادگیری از آنچه موجود است، است. این امر نه تنها پیچیدگی مدلسازی را کاهش میدهد، بلکه به مدلها امکان میدهد تا در سناریوهای واقعی، جایی که دادههای کامل یک استثنا هستند نه یک قاعده، بهتر عمل کنند. نتایج نشاندهنده پتانسیل عظیم LSM-2 برای بهبود دقت و قابلیت اطمینان سیستمهای نظارت بر سلامت مبتنی بر پوشیدنیها است، و راه را برای نسل جدیدی از برنامههای کاربردی هوش مصنوعی در این زمینه هموار میسازد.
سپاسگزاریها
تحقیقات شرح داده شده در اینجا کار مشترک Google Research، Google Health، Google DeepMind و تیمهای همکار است. محققان زیر در این کار مشارکت داشتهاند: Maxwell A. Xu, Girish Narayanswamy, Kumar Ayush, Dimitris Spathis, Shun Liao, Shyam Tailor, Ahmed Metwally, A. Ali Heydari, Yuwei Zhang, Jake Garrison, Samy Abdel-Ghaffar, Xuhai Xu, Ken Gu, Jacob Sunshine, Ming-Zher Poh, Yun Liu, Tim Althoff, Shrikanth Narayanan, Pushmeet Kohli, Mark Malhotra, Shwetak Patel, Yuzhe Yang, James M. Rehg, Xin Liu, and Daniel McDuff. همچنین از شرکتکنندگانی که دادههای خود را برای این مطالعه به اشتراک گذاشتند، صمیمانه سپاسگزاریم.