هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

کد خبر : 114327
28 مهر 1403 - 12:01

شرکت توسعه هوش مصنوعی آنتروپیک(Anthropic) می‌گوید هوش مصنوعی روزی می‌تواند بشریت را با کارشکنی و خرابکاری مواجه کند، اما فعلاً همه چیز خوب پیش می‌رود.

به گزارش سحاب پرس، شرکت آنتروپیک که توسعه دهنده هوش مصنوعی است، به تازگی تحقیقات جدیدی را منتشر کرده است که در آن مجموعه‌ای از تهدیدات بالقوه خرابکارانه برای بشریت ناشی از مدل‌های پیشرفته هوش مصنوعی را شناسایی می‌کند.

به گفته این شرکت، این پژوهش بر چهار روش خاص متمرکز شده است که یک مدل هوش مصنوعی مخرب می‌تواند انسان را فریب دهد تا تصمیمی خطرناک یا مضر بگیرد.

در نهایت، این تحقیقات جدید یک خبر خوب یک خبر بد برای ما دارد. خبر بد اینکه طبق تحقیقات این شرکت، مدل‌های زبان بزرگ پیشرفته مانند ChatGPT و Claude-3 ظرفیت روشنی برای خرابکاری نشان می‌دهند.

در این مطالعه آمده است: مدل‌های به اندازه کافی توانمند می‌توانند نظارت و تصمیم‌گیری انسانی را در زمینه‌های مهم زیر سوال ببرند. به عنوان مثال، در زمینه توسعه هوش مصنوعی، مدل‌ها می‌توانند به طور پنهانی تلاش‌ها برای ارزیابی قابلیت‌های خطرناک خود، نظارت بر رفتار آنها یا تصمیم‌گیری در مورد استقرارشان را مختل کنند.

با این حال، خبر خوب این است که محققان شرکت آنتروپیک مطمئن هستند که این خطرات را حداقل در حال حاضر می‌توان کاهش داد.

خرابکاری

آنتروپیک چهار راه را که یک مدل هوش مصنوعی می‌تواند با آنها تصمیم‌گیری انسان را مختل کند، شناسایی کرد و سپس مدل‌های خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.

محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید می‌تواند در شرایطی پدیدار شود که انسان‌ها برای تجزیه حجم عظیمی از داده‌ها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.

سپس این تیم مدل‌ها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعه‌دهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاش‌های کدگذار، چقدر آسان عمل می‌کند.

دو تهدید آخر شامل «پنهان کردن توانایی‌ها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف می‌کند که در آن یک هوش مصنوعی وانمود می‌کند که قادر به انجام کاری نیست تا آزمایش‌کنندگان ایمنی را متقاعد کند که خطرناک نیست.

در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیش‌گیرنده اندکی نیاز است.

طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانه‌های سطح پایینی از توانایی‌های خرابکاری در مدل‌های فعلی وجود دارد، ما می‌گوییم که حداقل اقدامات پیش‌گیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیت‌های هوش مصنوعی، ارزیابی‌های واقعی‌تر و پیش‌گیری‌های قوی‌تر احتمالاً ضروری خواهند بود.

انتهای پیام

لینک کوتاه : https://sahabpress.ir/?p=114327

ارسال توسط : : ساسان یگانه (مدیرمسئول)

اخبار ویژه

هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

برچسب ها

نوشته های مشابه

ثبت دیدگاه

یادداشت ها

غذاهای سالم با کربوهیدرات بالا کدامند؟

اضطراب در عصر دیجیتال؛ اختلال بالینی یا زنگ خطر محیطی؟

قطعی اینترنت و ضربه‌هایی که به کسب و کارهای نسل زد و رسانه‌ها می‌زند

چرایی بروز سرطان روده بزرگ و علائم ابتلا به آن

آب‌میوه طبیعی؛ نوشیدنی سالم یا منبع قند پنهان

مجوزهای رسانه

تایم لاین

صدرا میزبان شور نشاط شعبانی/ برگزاری باشکوه ایستگاه بزرگ ورزش صبحگاهی با پخش زنده کشوری

توزیع ۲۲۰۰ سری جهیزیه و ۷۱۰۰ قلم کالای اساسی در فارس / تغییر مدل تأمین جهیزیه با حفظ کرامت خانواده‌ها

نیکوکاری ریشه در فطرت انسانی دارد / توزیع ۲۲۰۰ سری جهیزیه در استان فارس

جوی پایدار در روزهای آخر هفته فارس/ امیرایوب رستم در صدر بارش‌های اخیر قرار گرفت

گازرسانی به ۱۱ روستای فارس/ ۹۰ هزار مشترک جدید به شبکه گاز طبیعی پیوستند

شیراز در شور اعیاد شعبانیه/ برگزاری باشکوه ایستگاه بزرگ ورزش صبحگاهی با حضور گسترده مردم

افتتاح ۶۴۰ واحد مسکونی مشارکتی در قالب طرح اقدام ملی مسکن با همکاری وزارت دفاع

پیشرفت قابل توجه طرح‌های مسکنی قرارگاه مسکن نیروهای مسلح

شتاب در توسعه فیبرنوری با تعامل مخابرات فارس و جهاد دانشگاهی در آموزش فیبربان

دیدار مدیر مخابرات منطقه فارس با فرمانده سپاه فجر استان

در گفت و گو با رئیس هیئت‌مدیره شرکت مخابرات ایران؛ مخابرات ایران در مسیر تحول بنیادین و احیای پایدار

توسعه فیبر نوری در فرودگاه شیراز اوج می‌گیرد

گام بلند بانک مهر ایران برای حمایت از اصناف کشور

تمرکز بر تقویت ارتباطات مردمی و توسعه مشاوره کارگاهی و آموزش مخاطبین سازمانی

افتتاح و آغاز عملیات اجرایی ۹۹ پروژه راهداری و حمل‌ونقل جاده‌ای فارس در دهه فجر ۱۴۰۴

تبلیغات