فناوری

رمزگشایی فکر به متن با بزرگ‌ترین مجموعه داده نوروزبانی Conduit

کارشناسان می‌گویند بزرگ‌ترین مجموعه داده نوروزبانی Conduit می‌تواند کیفیت رمزگشایی فعالیت‌های عصبی را در شرایط واقعی افزایش چشمگیری دهد.

به گزارش سرویس هوش مصنوعی مگ دید، استارت‌آپ سان‌فرانسیسکویی Conduit از اجرای یکی از پروژه‌های بلندپروازانه داده خود در حوزه هوش مصنوعی خبر داده است. این شرکت با جمع‌آوری تقریباً ۱۰ هزار ساعت داده عصبی غیرتهاجمی از هزاران فرد منحصربه‌فرد در استودیویی زیرزمین، بزرگ‌ترین مجموعه داده نوروزبانی (Neurolinguistic) شناخته‌شده تا‌به‌امروز را ایجاد کرده است.

هدف اصلی این پروژه آموزش مدل‌های هوش مصنوعی پیشرفته‌ای است که می‌توانند محتوای معنایی را از فعالیت مغزی افراد ثانیه‌های قبل‌از صحبت یا تایپ‌کردن آن‌ها رمزگشایی و آن را به متن تبدیل کنند. شرکت‌کنندگان در پروژه یادشده در جلسات دوساعته در غرفه‌های کوچک ازطریق گفتار یا تایپ روی کیبوردهای ساده‌شده با مدل زبان بزرگ (LLM) آزادانه گفت‌وگو می‌کنند.

Conduit ابتدا بر وظایف سخت و سنگین متمرکز بود؛ اما پس‌از مشاهده تأثیر مثبت مشارکت فعال بر کیفیت داده‌ها، رویکرد خود را به گفت‌وگوی رفت‌و‌برگشتی شخصی‌سازی‌شده تغییر داد. این روش حداکثرسازی میزان زبان طبیعی تولیدشده در طول هر ضبط را هدف قرار می‌دهد؛ در‌حالی‌که هم‌ترازی زمانی دقیق بین متن و صدا و سیگنال‌های عصبی حفظ می‌شود.

ازآنجاکه هدست چندوجهی تجاری نمی‌توانست الزامات Conduit را برآورده کند، تیم مهندسی شرکت مجبور شد سخت‌افزار خود را توسعه دهد. آن‌ها حسگرهای EEG و fNIRS و سایر حسگرهای برتر را در پوسته‌های سه‌بعدی سفارشی‌سازی‌شده ترکیب کردند.

دو طرح مجزا برای هدست‌ها ایجاد شد: ۱. هدست‌های آموزشی و وسایلی متراکم و سنگین (چهارپوندی) با هدف حداکثرسازی پوشش سیگنال؛ ۲. هدست‌های استنتاجی که پس‌از بلوغ مدل‌ها و با انجام مطالعات حذف (Ablation) شکل خواهند گرفت. تمام داده‌ها اکنون ازطریق فرمت Zarr 3 جریان می‌یابند که ورودی چندین نوع حسگر را در چهارچوبی واحد یکپارچه می‌کند.

زنی که یک هدست کلاه ایمنی‌مانندِ مشکی (مفهومی) برای اسکن مغز و آموزش هوش مصنوعی پوشیده است.

در ابتدا، Conduit تداخل الکتریکی را به‌عنوان تهدید اصلی کیفیت داده‌ها شناسایی کرد. تیم توسعه‌دهنده با استفاده از عایق‌بندی تجهیزات در لاستیک و آزمایش تهویه‌کننده‌های برق، تلاش کرد این مشکل را حل کند. در نهایت، با قطع کامل برق اصلی و تکیه بر بسته‌های باتری، توانست پیک ۶۰ هرتزی رایج در ضبط‌های EEG را حذف کند.

هرچند این رویکرد مشکلات خاص خود ازجمله فریم‌های ازدست‌رفته و نیاز به تعویض ثابت باتری‌های سنگین را ایجاد کرد، Conduit بعداً با افزایش مقیاس عملیات به برق عادی بازگشت. زمانی که مجموعه داده از مرز ۴,۰۰۰ تا ۵,۰۰۰ ساعت عبور کرد، مدل قابلیت تعمیم‌پذیری بین افراد و غرفه‌ها و تنظیمات را آغاز کرد و ارزش کاهش نویز تهاجمی کاهش یافت.

تامزهاردور می‌نویسد که با افزایش مقیاس فرایند، هزینه‌های عملیاتی کاهش درخورتوجهی یافت. Conduit موفق شد هزینه نهایی به‌ازای هر ساعت داده کاربردی را بین ماه‌های می و اکتبر، حدود ۴۰ درصد کاهش دهد. این کاهش هزینه با بازطراحی بک‌اند برای شناسایی جلسات خراب در زمان واقعی و اجازه‌دادن به مدیران جلسه برای نظارت هم‌زمان بر چندین غرفه از طریق دوربین‌ها محقق شد.

همچنین، سیستم رزرو سفارشی و قیمت‌گذاری پویا و رزرو بیش‌از‌حد را برای پر نگه‌داشتن هدست‌ها در طول یک برنامه روزانه ۲۰ ساعته معرفی کرد. Conduit اعلام کرده است که اکنون تقریباً به‌طور کامل بر آموزش مدل خود متمرکز است و برنامه‌هایی برای ارائه جزئیات سیستم رمزگشایی خود در انتشار بعدی دارد. این پیشرفت‌ها می‌توانند گام بزرگی در تحقق رابط‌های مغزکامپیوتر (BCI) و ارتباط مستقیم فکر به متن بردارند.

Source link

تیم تحریریه مگ دید

تیم تحریریه magdid.ir با هدف ارائه محتوای دقیق، به‌روز و جذاب در حوزه‌های مختلف، تلاش می‌کند تجربه‌ای مفید و الهام‌بخش برای خوانندگان فراهم کند. این تیم متشکل از نویسندگان و متخصصانی است که با تحقیق و بررسی دقیق، مطالب آموزشی، خبری و تحلیلی را با زبان ساده و قابل فهم به مخاطب ارائه می‌دهند. تعهد ما، اطلاع‌رسانی صادقانه و ارتقای دانش و آگاهی جامعه است.

نوشته های مشابه

دکمه بازگشت به بالا