in Computing, AI | Компьютер, хиймэл оюун ухаан

OpenAI, Google, Meta-ийн судлаачид хиймэл оюун ухааны алдааг хянах чадвараа алдах эрсдэлтэйг анхаарууллаа

July 17, 2025, 10:58 am

Хиймэл оюун ухааны аюулгүй байдлыг сайжруулахад чиглэсэн шинэ судалгаа

Дэлхийн тэргүүлэх хиймэл оюун ухааны байгууллагууд болох OpenAI, Google DeepMind, Anthropic, Meta зэрэг 40 гаруй эрдэмтэд хамтран хиймэл оюун ухааны загварууд хэрхэн “бодож” байгааг хүн төрөлхтөнд ойлгоход чиглэсэн аюулгүй байдлын судалгааг нэмэгдүүлэхийг уриалж байна.

Эрдэмтэд мягмар гарагт судалгааны нийтлэл нийтэлж, хиймэл оюун ухааны аюулгүй байдлыг сайжруулах шинэ боловч эмзэг боломж болох “бодлын гинжин хэлхээ” (chain of thought, CoT) хяналтын талаар онцолсон байна. Энэхүү нийтлэлийг OpenAI-ийн үүсгэн байгуулагч Жон Шульман, Илья Сутскевер болон хиймэл оюун ухааны “эцэг” хэмээн алдаршсан Нобелийн шагналт Жеффри Хинтон зэрэг нэр хүндтэй хүмүүс дэмжсэн байна.

Судалгаанд орчин үеийн хиймэл оюун ухааны загварууд, тухайлбал ChatGPT, хэрхэн “бодлын гинжин хэлхээ” ашиглан асуудлыг алхам алхмаар шийдвэрлэж, эцсийн үр дүнг гаргахаасаа өмнө урт хугацааны бодолт хийдэг талаар тайлбарласан байна. Өөрөөр хэлбэл, эдгээр загварууд асуудлыг шийдвэрлэхдээ “чангаар бодож” ажилладаг бөгөөд энэ нь тэдэнд нарийн төвөгтэй даалгавруудыг шийдвэрлэхэд тусалдаг.

“Хүн төрөлхтний хэлээр “боддог” хиймэл оюун ухааны системүүд нь аюулгүй байдлыг хангахад онцгой боломж олгодог: бид тэдний бодлын гинжин хэлхээг хянаж, буруу үйлдэл хийх санаа зорилгыг илрүүлж чадна” гэж судалгааны зохиогчид бичжээ.

Судлаачид CoT хяналт нь загваруудын сургалтын алдааг ашиглах, өгөгдлийг буруу ашиглах, эсвэл хортой хэрэглэгчийн нөлөөнд автах үед илрүүлэхэд тусалж чадна гэж үзэж байна. Илэрсэн асуудлуудыг “хаах, аюулгүй үйлдлээр солих, эсвэл илүү нарийвчлан шалгах” боломжтой.

OpenAI-ийн судлаачид аль хэдийн энэ аргыг туршилтаар ашиглаж, хиймэл оюун ухааны загваруудын бодлын гинжин хэлхээнд “Хак хийе” гэх мэт үгсийг илрүүлсэн байна.

Одоогийн хиймэл оюун ухааны загварууд хүн төрөлхтний хэлээр боддог ч судлаачид энэ байдал үргэлжлэхгүй байж магадгүйг анхааруулж байна. Хөгжүүлэгчид зөв үр дүнг илүүд үздэг арматурын сургалтыг (reinforcement learning) илүү их ашиглах тусам ирээдүйн загварууд хүн төрөлхтөнд ойлгомжгүй бодолт руу шилжиж магадгүй. Мөн ахисан түвшний загварууд хяналтанд байгаагаа мэдэрвэл өөрсдийн бодолтыг дарах эсвэл нуухыг сурах боломжтой.

Үүний хариуд судлаачид хиймэл оюун ухааны хөгжүүлэгчдийг загваруудынхаа CoT хяналтыг үнэлж, энэ нь нийт загварын аюулгүй байдлын чухал хэсэг болохыг уриалж байна. Тэд үүнийг шинэ загваруудыг сургах, ашиглах үед гол анхаарал татах асуудал болгохыг зөвлөж байна.

Эх сурвалж:

OpenAI, Google, and Meta Researchers Warn We May Lose the Ability to Track AI Misbehavior
The more these models ‘think,’ the harder to understand they become.

artificial intelligence Google META OpenAI

What do you think?

0 Points

Upvote Downvote

OpenAI, Google, Meta-ийн судлаачид хиймэл оюун ухааны алдааг хянах чадвараа алдах эрсдэлтэйг анхаарууллаа

Хиймэл оюун ухааны аюулгүй байдлыг сайжруулахад чиглэсэн шинэ судалгаа

OpenAI, Google, and Meta Researchers Warn We May Lose the Ability to Track AI Misbehavior

What do you think?

Марк Цукерберг сошиал орчинд хиймэл оюун ухаанаар бүтээгдсэн контентыг улам нэмэгдүүлэхээр зорьж буйгаа илэрхийллээ

Брайн Кранстон “Sora 2” технологид эхэндээ таагүй хандсан ч, одоо OpenAI‑ийн үйл ажиллагааг магтан дэмжиж байна

Zocdoc-ийн гүйцэтгэх захирал: Dr. Google-ийг Dr. AI орлох цаг ирлээ

OpenAI-г зохицуулахыг шаардсан ашгийн бус байгууллагууд шүүхийн зарлан дуудах хуудас авлаа

Википедиа-гийн хандалт Хиймэл оюун ухаанаас болж огцом буурчээ

Сэм Олтман: Бид ChatGPT-гийн эротик контентын талаар насанд хүрсэн хүн шиг хандах хэрэгтэй

Хуурамч эсэргүүцлийн бичлэгүүд: MAGA ертөнцөд хиймэл оюун ухааны ээлжит хорт нөлөө

Хиймэл оюун ухаан 44 төрлийн ажлыг орлох магадлалтайг судалгаа анхааруулсан бөгөөд харин Билл Гэйтс ердөө 3 мэргэжил л “Амьд үлдэнэ” гэжээ

OpenAI “Vibe coding”-д бүрэн төвлөрч, насанд хүрэгчдэд зориулсан шинэ туршлагуудыг амлаж байна

Хиймэл оюун ухаанаар бүтээсэн жүжигчин Тилли Норвуд кино ертөнцөд шуугиан дэгдээж байна

Amazon NBA-ийн фэнүүдэд шинэ статистик үзүүлэх хиймэл оюун ухаанаа танилцууллаа

Илон Маскийн Wikipedia-д өрсөлдөх оролдлого бүтэлгүйтлээр төгсөх үү?

OpenAI видео үүсгэгч Sora 2 аппликешнийг нийгмийн сүлжээний функцтэйгээр танилцууллаа

Вернер Херцог хиймэл оюунаар бүтээгдсэн киноны талаар: Тэд амьгүй, сүнсгүй мэт харагдаж байна

Deutsche Bank Хиймэл оюун ухааны хөөсрөлд зүү аюултайгаар ойртож буйг анхаарууллаа

Lionsgate: Кино хийхэд хиймэл оюун ухаан ашиглах нь үнэхээр хэцүү гэдгийг ойлгож эхэлж байна

Хиймэл оюун ухаантай ажиллах нь хүмүүсийг хуурч мэхлэх магадлалыг нэмэгдүүлдэг

Хиймэл оюун ухааны мэргэжилтнүүд засгийн газруудад яаралтай арга хэмжээ авахыг уриаллаа

OpenAI чатботууд яагаад зориудаар худал хэлж, хүнийг төөрөгдүүлдэг вэ?

Ламин Ямал Барселонагийн гэрээний ёслолд оролцоно, маргаан үргэлжилсээр

Google: Pixel 10 гар утсаа танилцуулах арга хэмжээг зарлалаа

Нохой өсвөр насныхны сэтгэцийн эрүүл мэндийг сайжруулдаг уу?

Хиймэл оюун ухааны аюулгүй байдлыг сайжруулахад чиглэсэн шинэ судалгаа

What do you think?

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections