[ فردا را به امروز می آوریم ]
  • آخرین شماره ۲۳۱۳
  • دوره جدید

یک هوش مصنوعی جدید می‌تواند متون ۱۰هزار کلمه‌ای تولید کند، روزنامه شیراز نوین

یکی از مشکلات عمده‌ای که مدل‌های زبان بزرگ با آن مواجه هستند، طول خروجی متنی است که تولید می‌کنند. مدل‌های زبانی کنونی ادعا می‌کنند که ورودی‌ها را تا ۱۰۰هزار کلمه پردازش می‌کنند اما برای تولید خروجی‌هایی با طول متوسط ۲۰۰۰ کلمه با مشکلاتی مواجه هستند. اما اکنون به نظر می‌رسد یک مدل هوش مصنوعی جدید این توانایی را ارتقا داده است.
به گزارش ایسنا، برای حل این مشکل، گروهی از محققان هوش مصنوعی در دانشگاه چینهوا (Tsinghua)، یک مدل زبانی بزرگ (LLM) به نام لانگ رایتر (LongWriter) توسعه داده‌اند.

این هوش مصنوعی می‌تواند پاسخ‌های طولانی ایجاد کند
این گروه ادعا می‌کنند که مدل زبان بزرگ آن‌ها می‌تواند خروجی متن تا ۱۰هزار کلمه تولید کند.
به نقل از آی‌ای، ازآنجایی‌که مدل‌های زبانی بزرگ جریان‌ساز شده‌اند، بسیاری متوجه شده‌اند که آن‌ها نمی‌توانند پاسخ‌های بسیارطولانی مانند کتاب‌های کامل یا نسخه‌های خطی تولید کنند و حد فعلی تولید متن آن‌ها به نظر می‌رسد تقریباً ۲۰۰۰ کلمه باشد.
محققان می‌گویند که احتمالاً این به این دلیل است که همه آن‌ها با استفاده از داده‌های کوتاه آموزش دیده‌اند. آن‌ها در تلاش جدید خود دریافتند که اگر مدل‌های زبانی بزرگ را کمی تغییر دهند و با استفاده از اسناد بسیارطولانی‌تر آموزش دهند، می‌توان متون طولانی‌تری تولید کرد.
آزمایش نظریه
محققان برای آزمایش نظریه خود، ابتدا یک مدل ‌زبانی بزرگ را با ۹میلیارد پارامتر با استفاده از یک مجموعه داده معمولی، که شامل اسنادی بود که عمدتاً کمتر از ۲۰۰۰ کلمه بودند، آموزش دادند.
همان‌طور که انتظار می‌رفت، هنگام پرس‌وجو، این هوش مصنوعی می‌توانست متن‌هایی با حداکثر ۲۰۰۰ کلمه ایجاد کند.
سپس، محققان یک مدل زبانی بزرگ سنتی را با استفاده از یک کانال ارتباطی به نام AgentWrite اصلاح کردند تا داده‌های آموزشی را به وظایف فرعی تجزیه کنند.
آن‌ها سپس مجموعه داده‌ای را به نام LongWriter-۶k جمع‌آوری کردند که حاوی ۶۰۰۰ سند مکتوب با طول ۲۰۰۰ تا ۳۲هزار کلمه بود. آن‌ها سپس مدل زبانی بزرگ اصلاح‌شده را با استفاده از مجموعه داده جدید آموزش دادند و دریافتند که با انجام این کار، طول متنی که این هوش مصنوعی می‌تواند تولید کند به تقریباً ۱۰هزار کلمه افزایش می‌یابد.

قابلیت استفاده در زمینه‌های مختلف
در بررسی مطالب طولانی جدید تولیدشده توسط مدل زبانی بزرگ، محققان آن‌ها را منسجم و قابل استفاده در زمینه‌های مختلف یافتند. آن‌ها همچنین ویدئویی را منتشر کردند که نشان می‌دهد لانگ رایتر یک راهنمای گردشگری ۱۰هزار کلمه‌ای برای افرادی که به چین سفر می‌کنند تولید می‌کند.
محققان اذعان می‌کنند که اکنون که مشخص شده است که مدل‌ زبانی بزرگ می‌تواند کل مقالات تحقیقاتی، کتاب‌ها، دست‌نوشته‌ها یا شاید حتی فیلم‌نامه‌های فیلم را تولید کند. با درک محدودیت‌ها و به‌کارگیری شیوه‌های استفاده مسئولانه، انسان‌ها می‌توانند از قدرت مدل زبانی بزرگ استفاده کنند و در عین حال خطرات بالقوه را کاهش دهند.

تاکنون نظری برای این خبر ثبت نشده است!
ثبت نظر جدید
نام و نام خانوادگی  

آدرس ایمیل    

متن نظر  

کد امنیتی