LSM-2: آموزش از داده‌های حسگر پوشیدنی ناقص

مقدمه: چالش داده‌های ناقص در حسگرهای پوشیدنی دستگاه‌های پوشیدنی انقلابی در نظارت بر سلامت ایجاد کرده‌اند و داده‌های فیزیولوژیکی و رفتاری پیوسته و چندوجهی را ارائه می‌دهند. این داده‌ها شامل...

فهرست مطالب

مقدمه: چالش داده‌های ناقص در حسگرهای پوشیدنی

دستگاه‌های پوشیدنی انقلابی در نظارت بر سلامت ایجاد کرده‌اند و داده‌های فیزیولوژیکی و رفتاری پیوسته و چندوجهی را ارائه می‌دهند. این داده‌ها شامل سیگنال‌های قلبی، الگوهای خواب، سطوح فعالیت و شاخص‌های استرس است. با پیشرفت فناوری حسگرها، امکان جمع‌آوری حجم وسیعی از داده‌ها به‌طور فزاینده‌ای فراهم شده است. با این حال، هزینه برچسب‌گذاری این داده‌ها بالا باقی می‌ماند و اغلب نیاز به حاشیه‌نویسی‌های لحظه‌ای کاربر یا مطالعات بالینی پرزحمت دارد. در اینجاست که یادگیری خودنظارتی (SSL) وارد عمل می‌شود و با استفاده مستقیم از داده‌های بدون برچسب، ساختارهای زیربنایی، مانند روابط ظریف فیزیولوژیکی را کشف می‌کند. هنگامی که SSL در مقیاس بزرگ به کار گرفته شود، می‌تواند به ایجاد مدل‌های بنیادی منجر شود که بازنمایی‌های غنی و قابل تعمیم را برای طیف گسترده‌ای از وظایف سلامتی پایین‌دستی تولید می‌کنند.

اما، در کاربرد SSL در حوزه دستگاه‌های پوشیدنی، یک محدودیت بحرانی وجود دارد: روش‌های پیشرفته SSL فرض می‌کنند که داده‌ها کامل و بدون وقفه هستند، حال آنکه این وضعیت در جریان‌های داده حسگر پوشیدنی در دنیای واقعی نادر است. شکاف‌ها به ناچار به دلیل برداشتن دستگاه، شارژ، شل شدن متناوب، آرتیفکت‌های حرکتی، حالت‌های صرفه‌جویی در باتری یا نویز محیطی رخ می‌دهند که ما آن را “ناقص بودن” می‌نامیم. در حقیقت، ما دریافتیم که هیچ یک از 1.6 میلیون پنجره یک روزه ما، 0% ناقصی نداشته است.

از لحاظ تاریخی، چالش داده‌های تکه‌تکه، محققان را مجبور کرده است که یا به روش‌های جایگزینی (imputation) برای پر کردن بخش‌های از دست رفته تکیه کنند، یا به فیلترینگ شدید برای حذف نمونه‌های دارای داده‌های ناقص بپردازند. هیچ یک از این روش‌ها راه‌حل بهینه‌ای نیستند، زیرا اولی ممکن است سوگیری‌های ناخواسته‌ای را ایجاد کند، در حالی که دومی داده‌های ارزشمند را دور می‌ریزد. این پارادایم‌های سنتی مانع از بهره‌برداری کامل از پتانسیل داده‌های جمع‌آوری‌شده توسط دستگاه‌های پوشیدنی می‌شوند و نیاز به رویکردی نوآورانه را برجسته می‌سازند که بتواند ذاتاً با واقعیت‌های داده‌های دنیای واقعی کنار بیاید.

LSM2-1

ناقص بودن داده‌ها در ضبط‌های حسگر پوشیدنی امری فراگیر است. حالت‌های رایج ناقص بودن در بالا در یک نمونه یک روزه از داده‌های حسگر پوشیدنی چندوجهی برجسته شده‌اند. ما خاطرنشان می‌کنیم که هیچ نمونه‌ای از بین 1.6 میلیون پنجره یک روزه ما، 0% ناقصی نداشته است.

معرفی LSM-2 و رویکرد AIM

در مقاله “LSM-2: Learning from Incomplete Wearable Sensor Data”، ما Adaptive and Inherited Masking (AIM) را معرفی می‌کنیم، یک چارچوب جدید آموزش SSL که مستقیماً از داده‌های ناقص یاد می‌گیرد. AIM به جای آنکه شکاف‌های داده را اندازه‌گیری‌های اشتباهی بداند که باید پر شوند، با ناقص بودن به عنوان یک مصنوع طبیعی از داده‌های دنیای واقعی برخورد می‌کند و مستقیماً از ضبط‌های ناقص یاد می‌گیرد. با استفاده از AIM، ما یک مدل حسگر بزرگ (LSM-2) توسعه دادیم که مدل بنیادی قبلی ما برای داده‌های حسگر پوشیدنی (LSM-1، ارائه شده در ICLR ‘25) را بهبود می‌بخشد.

ما نشان می‌دهیم که LSM-2 حتی زمانی که حسگرها از کار می‌افتند یا پنجره‌های زمانی حذف می‌شوند، عملکرد قوی از خود نشان می‌دهد و تخریب قابل توجهی کمتری نسبت به مدل‌های آموزش‌دیده بر روی داده‌های جایگزین شده دارد. این توانایی LSM-2 برای مدیریت بومی ناقص بودن داده‌ها، آن را به ابزاری قدرتمند برای کاربردهای عملی در حوزه سلامت تبدیل می‌کند. نوآوری اصلی در اینجا در تغییر رویکرد از اجتناب یا “تعمیر” ناقص بودن داده‌ها به “پذیرش” و یادگیری از آن نهفته است. این امر به مدل اجازه می‌دهد تا یک درک عمیق‌تر و واقعی‌تر از الگوهای داده‌ای که در محیط‌های پوشیدنی رخ می‌دهند، ایجاد کند.

آیا نوشابه‌های "سالم" واقعا وجود دارند؟ نگاهی به سوداهای پری‌بیوتیک پپسی و نظرات کارشناسان

هدف‌گذاری با پوشش انطباقی و موروثی (AIM)

در قلب نوآوری AIM، رویکرد منحصربه‌فرد آن در مدیریت شکاف‌های اجتناب‌ناپذیر در داده‌های حسگر دنیای واقعی قرار دارد. بر خلاف روش‌های سنتی SSL که داده‌های ناقص را دور می‌اندازند یا تلاش می‌کنند مقادیر از دست رفته را پر کنند، AIM این شکاف‌ها را به عنوان ویژگی‌های طبیعی داده‌های پوشیدنی می‌پذیرد. AIM به عنوان توسعه‌ای از چارچوب پیش‌آموزشی masked autoencoder (MAE)، ساختار زیربنایی داده‌های حسگر را با بازسازی نمونه‌های ورودی پوشانده شده یاد می‌گیرد. این بازسازی به مدل کمک می‌کند تا روابط زمانی و مکانی را حتی در حضور داده‌های ناقص، به طور مؤثر درک کند.

با این حال، در حالی که روش‌های سنتی MAE به یک نسبت پوشش ثابت برای فعال کردن حذف مؤثر توکن‌های پوشانده شده (یعنی تعداد ثابتی از توکن‌های پوشانده شده از طریق رمزگذار عبور نمی‌کنند و در نتیجه پیچیدگی محاسباتی کاهش می‌یابد) متکی هستند، تکه‌تکه شدن در داده‌های حسگر غیرقابل پیش‌بینی است و منجر به تعداد متغیری از توکن‌های پوشانده شده می‌شود. AIM این چالش اساسی داده‌های پوشیدنی را با ترکیب حذف توکن با پوشش توجه برطرف می‌کند. در طول پیش‌آموزش، مجموعه توکن‌هایی که باید پوشانده شوند شامل توکن‌های موروثی و ذاتی در داده‌های حسگر پوشیدنی به علاوه توکن‌هایی است که به عمد برای هدف آموزش بازسازی پوشانده شده‌اند.

AIM ابتدا حذف را برای تعداد ثابتی از توکن‌های پوشانده شده اعمال می‌کند و کارایی محاسباتی پیش‌آموزش را با کاهش طول دنباله پردازش شده توسط رمزگذار بهبود می‌بخشد. سپس AIM با هر توکن پوشانده شده باقی‌مانده – چه به طور طبیعی از دست رفته باشد و چه بخشی از وظیفه بازسازی باشد – از طریق پوشش توجه در بلوک ترانسفورمر رمزگذار به طور انطباقی برخورد می‌کند. در طول تنظیم دقیق و ارزیابی وظایف تمایزدهنده، جایی که توکن‌های پوشانده شده صرفاً شامل شکاف‌های داده‌ای طبیعی هستند، AIM از پوشش توجه برای همه توکن‌های پوشانده شده استفاده می‌کند. از طریق این رویکرد پوشش دوگانه، و با برخورد با توکن‌های طبیعی و مصنوعی پوشانده شده به عنوان معادل، AIM به مدل می‌آموزد که با تکه‌تکه شدن متغیر ذاتی حسگرهای پوشیدنی کار کند.

LSM2-3

پیش‌آموزش (A) و ارزیابی (B) AIM برای LSM-2. در طول پیش‌آموزش، AIM از ماسک مصنوعی برای یادگیری بازسازی و از ماسک موروثی برای مدل‌سازی ناقص بودن در دنیای واقعی استفاده می‌کند. سپس، در طول ارزیابی، می‌توانیم از جاسازی آگاه از ناقص بودن برای پیش‌بینی اهداف سلامتی، مانند فشار خون بالا، مستقیماً از داده‌های حسگر ذاتاً تکه‌تکه استفاده کنیم.

آموزش و ارزیابی مدل

ما از مجموعه داده‌ای با 40 میلیون ساعت داده پوشیدنی که از بیش از 60,000 شرکت‌کننده در دوره مارس تا مه 2024 نمونه‌برداری شده است، استفاده می‌کنیم. این مجموعه داده به طور کامل ناشناس یا شناسایی‌زدایی شده است تا اطمینان حاصل شود که اطلاعات شرکت‌کنندگان حذف شده و حریم خصوصی حفظ می‌شود. افراد از انواع ساعت‌های هوشمند و ردیاب‌های Fitbit و Google Pixel استفاده می‌کردند و رضایت خود را برای استفاده از داده‌هایشان برای تحقیق و توسعه محصولات و خدمات جدید سلامتی و تندرستی اعلام کردند. از افراد خواسته شد تا جنسیت، سن و وزن خود را گزارش کنند.

ایلان ماسک از بازگشت اپلیکیشن Vine مبتنی بر هوش مصنوعی خبر داد

برای پیش‌آموزش LSM-2، ما از تکنیک SSL AIM استفاده می‌کنیم. AIM یک هدف آموزش بازسازی پوشانده شده را پیاده‌سازی می‌کند و یاد می‌گیرد داده‌هایی را که به طور طبیعی از دست رفته‌اند درک کند و داده‌هایی را که به طور مصنوعی پوشانده شده‌اند، پر کند. این چارچوب یکپارچه به LSM-2 اجازه می‌دهد تا ساختار زیربنایی (از جمله ناقص بودن) ذاتی در داده‌های حسگر پوشیدنی را یاد بگیرد. این رویکرد جامع به مدل امکان می‌دهد تا الگوهای پیچیده و وابستگی‌های زمانی را در داده‌های پوشیدنی، حتی در حضور چالش‌های رایج دنیای واقعی، کشف کند.

ما مجموعه‌ای از وظایف پایین‌دستی را برای ارزیابی مدل پیش‌آموزش‌دیده، با استفاده از ابرداده‌هایی که همراه با سیگنال‌های حسگر برای اهداف تحقیق و توسعه جمع‌آوری شده بودند، تنظیم کردیم. این وظایف شامل فعالیت‌های برچسب‌گذاری شده توسط کاربر از مجموعه‌ای متشکل از 20 دسته مختلف (مانند دویدن، اسکی، قایقرانی و گلف بازی کردن) و تشخیص‌های خودگزارشی فشار خون بالا و اضطراب بود. این داده‌ها به مجموعه‌های تنظیم دقیق و ارزیابی تقسیم شدند، به طوری که داده‌های هر فرد فقط در یکی از مجموعه‌های تنظیم یا ارزیابی قرار داشت و نه هر دو. داده‌های افراد مورد استفاده در مرحله پیش‌آموزش نیز در مراحل تنظیم دقیق یا ارزیابی گنجانده نشدند تا از نشت داده و ارزیابی عینی اطمینان حاصل شود.

قابلیت‌های مولد LSM-2 از طریق وظایف جایگزینی تصادفی، درون‌یابی زمانی، برون‌یابی زمانی (پیش‌بینی) و جایگزینی حسگر، که در کار LSM-1 ما توضیح داده شده‌اند، ارزیابی می‌شوند. علاوه بر این، کاربرد جاسازی‌های LSM-2 از طریق یک کاوشگر خطی بر روی تعدادی از وظایف تمایزدهنده ارزیابی می‌شود. به طور خاص، ما کاربرد جاسازی‌های LSM-2 را برای وظایف طبقه‌بندی دوتایی فشار خون بالا، طبقه‌بندی دوتایی اضطراب و شناسایی فعالیت 20 کلاسه اندازه‌گیری می‌کنیم. همچنین قابلیت LSM-2 برای مدل‌سازی فیزیولوژی را از طریق وظایف رگرسیون سن و BMI ارزیابی می‌کنیم.

نتایج کلیدی

مدل LSM-2 مبتنی بر AIM تطبیق‌پذیری قابل توجهی را نشان می‌دهد و از سلف خود، LSM-1، در سه حوزه کلیدی پیشی می‌گیرد: طبقه‌بندی شرایط و فعالیت‌های سلامتی (مانند فشار خون بالا، اضطراب و تشخیص فعالیت 20 کلاسه)، بازسازی داده‌های از دست رفته (مانند بازیابی سیگنال‌های حسگر از دست رفته) و پیش‌بینی معیارهای سلامت پیوسته (مانند BMI با همبستگی بهبود یافته). مقایسه‌های بیشتر با خطوط پایه نظارت‌شده و پیش‌آموزش‌دیده را می‌توانید در مقاله ما بیابید.

LSM2-4

LSM-2 ناقص بودن در دنیای واقعی را بدون جایگزینی مدل‌سازی می‌کند، که به آن امکان می‌دهد خطای بازسازی پایین‌تر (چپ) و امتیازات طبقه‌بندی بالاتر (راست) را در مقایسه با LSM-1 به دست آورد.

LSM-2 در سناریوهای واقع‌بینانه که حسگرها از کار می‌افتند یا داده‌ها ناقص هستند، برتری می‌یابد. شکل زیر وضعیت‌هایی را شبیه‌سازی می‌کند که در آن ممکن است کل فیدهای حسگر یا داده‌ها برای کل بخش‌هایی از روز از دست رفته باشند. این امر واقعیت را منعکس می‌کند که دستگاه‌های پوشیدنی مختلف ممکن است بار حسگرهای متفاوتی داشته باشند، یا اینکه یک فرد ممکن است دستگاه خود را فقط برای بخش‌هایی از روز استفاده کند. در اینجا ما دریافتیم که LSM-2 مبتنی بر AIM در برابر این حذف‌ها نسبت به LSM-1 مقاوم‌تر است و تخریب عملکرد کمتری را نشان می‌دهد. این نشان‌دهنده توانایی بالای LSM-2 در حفظ دقت و کارایی حتی در شرایط داده‌های نامطلوب است.

وعده بزرگ ایلان ماسک: نرم‌افزار واین با هوش مصنوعی برمی‌گردد

LSM2-2

LSM-2 نسبت به داده‌های از دست رفته مقاوم‌تر از LSM-1 است و هنگامی که کل فیدهای حسگر یا دوره‌هایی از روز حذف می‌شوند، کمتر از عملکرد اصلی خود (خط نقطه‌چین) نسبت به سلف خود تخریب می‌شود.

در نهایت، LSM-2 مقیاس‌پذیری بهبود یافته‌ای را در میان کاربران، حجم داده، محاسبات و اندازه مدل در مقایسه با LSM-1 نشان می‌دهد. در حالی که سلف آن نشانه‌هایی از فلات‌زدگی را نشان می‌دهد، LSM-2 با داده‌های بیشتر به بهبود خود ادامه می‌دهد و هنوز به اشباع نرسیده است. این توانایی مقیاس‌پذیری به این معنی است که LSM-2 پتانسیل بیشتری برای تبدیل شدن به یک مدل بنیادی جهانی برای داده‌های حسگر پوشیدنی دارد، زیرا می‌تواند با حجم‌های فزاینده‌ای از داده‌ها و کاربردها سازگار شود. این یک گام مهم به سوی توسعه سیستم‌های سلامت هوشمندتر و جامع‌تر است.

LSM2-5

LSM-2 مقیاس‌پذیری بهبود یافته‌ای را نسبت به LSM-1 در میان افراد، داده‌ها، محاسبات و اندازه مدل نشان می‌دهد.

نتیجه‌گیری

مدل بنیادی LSM-2، که با AIM پیش‌آموزش دیده است، نشان‌دهنده پیشرفت در جهت فناوری سلامت پوشیدنی مفیدتر و قابل استفاده‌تر است. اساساً، AIM به LSM-2 می‌آموزد که شکاف‌های طبیعی در جریان‌های حسگر دنیای واقعی را درک و از آنها استفاده کند تا بینش‌های قابل اعتمادی از داده‌های ناقص به دست آورد. این نوآوری به این معنی است که هوش مصنوعی پوشیدنی می‌تواند سرانجام واقعیت آشفته داده‌های حسگر را بپذیرد، یکپارچگی داده‌ها را حفظ کند، در حالی که از تمام اطلاعات موجود استفاده می‌کند. این امر گامی بزرگ به سوی دستگاه‌های پوشیدنی هوشمندتر است که می‌توانند بدون نیاز به مداخله دستی یا پردازش‌های پیچیده، اطلاعات ارزشمندی را حتی در شرایط دشوار نیز ارائه دهند.

این رویکرد نشان‌دهنده یک تغییر پارادایم از تلاش برای کامل کردن داده‌ها به سمت یادگیری از آنچه موجود است، است. این امر نه تنها پیچیدگی مدل‌سازی را کاهش می‌دهد، بلکه به مدل‌ها امکان می‌دهد تا در سناریوهای واقعی، جایی که داده‌های کامل یک استثنا هستند نه یک قاعده، بهتر عمل کنند. نتایج نشان‌دهنده پتانسیل عظیم LSM-2 برای بهبود دقت و قابلیت اطمینان سیستم‌های نظارت بر سلامت مبتنی بر پوشیدنی‌ها است، و راه را برای نسل جدیدی از برنامه‌های کاربردی هوش مصنوعی در این زمینه هموار می‌سازد.

سپاسگزاری‌ها

تحقیقات شرح داده شده در اینجا کار مشترک Google Research، Google Health، Google DeepMind و تیم‌های همکار است. محققان زیر در این کار مشارکت داشته‌اند: Maxwell A. Xu, Girish Narayanswamy, Kumar Ayush, Dimitris Spathis, Shun Liao, Shyam Tailor, Ahmed Metwally, A. Ali Heydari, Yuwei Zhang, Jake Garrison, Samy Abdel-Ghaffar, Xuhai Xu, Ken Gu, Jacob Sunshine, Ming-Zher Poh, Yun Liu, Tim Althoff, Shrikanth Narayanan, Pushmeet Kohli, Mark Malhotra, Shwetak Patel, Yuzhe Yang, James M. Rehg, Xin Liu, and Daniel McDuff. همچنین از شرکت‌کنندگانی که داده‌های خود را برای این مطالعه به اشتراک گذاشتند، صمیمانه سپاسگزاریم.

منبع مقاله

دیگر هیچ مقاله‌ای را از دست ندهید

محتوای کاملاً انتخاب شده، مطالعات موردی، به‌روزرسانی‌های بیشتر.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مدیریت حرفه‌ای شبکه‌های اجتماعی با رسا وب آفرین

  • افزایش تعامل و دنبال‌کننده در اینستاگرام و تلگرام

  • تولید محتوا بر اساس الگوریتم‌های روز شبکه‌های اجتماعی

  • طراحی پست و استوری اختصاصی با برندینگ شما

  • تحلیل و گزارش‌گیری ماهانه از عملکرد پیج

  • اجرای کمپین تبلیغاتی با بازده بالا

محبوب ترین مقالات

آماده‌اید کسب‌وکارتان را دیجیتالی رشد دهید؟

از طراحی سایت حرفه‌ای گرفته تا کمپین‌های هدفمند گوگل ادز و ارسال نوتیفیکیشن هوشمند؛ ما اینجاییم تا در مسیر رشد دیجیتال، همراه شما باشیم. همین حالا با ما تماس بگیرید یا یک مشاوره رایگان رزرو کنید.