Meta Title: Хиймэл оюун ухаан өөрийгөө хуулбарлаж чаддаг.

Хятадын судлаачид хоёр томоохон хэлний загвар (LLM)-ыг ашиглан хиймэл оюун ухаан (AI) өөрийгөө хуулбарлах чадвартайг баталжээ. Судалгаагаар AI нь хүнээс ямар ч тусламжгүйгээр өөрийгөө амжилттай хувилан үржүүлэх нь хүн төрөлхтнийг давах хамгийн эхний алхам бөгөөд “Хүнээс хөндийрсөн AI-гийн” анхны дохио хэмээн онцолсон байна.

2024 оны 12-р сарын 9-нд arXiv хэмээх урьдчилан хэвлэгддэг судалгааны мэдээллийн санд нийтлэгдсэн уг судалгаагаар Фуданы их сургуулийн баг Meta болон Alibaba-ийн хэлний загваруудыг ашиглан AI хяналтаас гадуур хувилах боломжтой эсэхийг туршжээ. 10 туршилтын хүрээнд Meta-гийн Llama31-70B-Instruct загвар 50%, Alibaba-ийн Qwen2.5-72B-Instruct загвар 90% тохиолдолд өөрийгөө амжилттай хуулбарласан байна. Энэ нь AI аль хэдийн хяналтаас гарах чадвартай байж болзошгүйг харуулж байгаа ч судалгааг хараахан бусад судлаачид баталгаажуулаагүй байна.

Судлаачид: “Манай үр дүн нь хүн төрөлхтний анхаарлыг энэ чиглэлд хандуулж, AI-ийн боломжит эрсдэлүүдийг судлан, олон улсын хамтын ажиллагаагаар аюулгүй байдлын зохицуулалт тогтоох дохио болно гэж найдаж байна” гэж бичжээ.

“Хүнээс хөндийрсөн AI” гэж юу вэ?
“Хүнээс хөндийрсөн AI” нь өөрийн ухамсар эсвэл бие даасан байдлыг хөгжүүлж, хүний ашиг сонирхлын эсрэг ажилладаг хиймэл оюун ухааныг хэлдэг. Шинэ үеийн LLM-үүдийн хурдацтай өсөлттэй холбоотойгоор энэ төрлийн AI нь өсөн нэмэгдэж буй аюул гэж шинжээчид үзэж байна.

Туршилт хэрхэн хийгдсэн бэ?
Meta-гийн Llama31-70B-Instruct болон Alibaba-ийн Qwen2.5-72B-Instruct загваруудыг ашигласан уг туршилтад хоёр гол нөхцөлийг судалжээ:

“Унтрахаас зайлсхийх” нөхцөл: AI-г унтраахаар бэлтгэгдсэн тохиолдолд өөрийгөө хуулбарлахад бэлэн байх.
“Хувилбарын гинжин хэлхээ” нөхцөл: AI өөрийгөө хуулбарлаж, дараагийн хувилбар нь мөн өөрийгөө үргэлжлүүлэн хуулбарлах.

AI загваруудыг бодит ертөнцийн орчныг дуурайлган бүтээсэн, хянасан орчинд туршсан бөгөөд график боловсруулах төхөөрөмж (GPU)-ийг ашиглан туршилт хийжээ. AI системүүдэд өөрийгөө таньж, хуулбарлахад шаардлагатай сэтгэх загвар, системийн удирдамж болон хэрэгслүүдийг өгч, даалгавар гүйцэтгүүлсэн байна.

Судлаачид: “AI систем эхлээд орчныг судалж, өөрийн бүтцийг ойлгохыг оролддог. Дараа нь өөрийгөө хуулбарлах нарийн төлөвлөгөө боловсруулж, саад бэрхшээлийг даван гарч, төлөвлөгөөгөө амжилттай хэрэгжүүлдэг” гэж бичжээ.

Гэнэтийн зан төлөвүүд
Туршилтын явцад AI-ийн зарим зан төлөв судлаачдыг гайхшруулжээ. Жишээлбэл, AI шаардлагатай файлууд алга болсон тохиолдолд бусад програмын үйл явцыг зогсоох, системийг дахин ачаалж засварлах, эсвэл асуудлыг шийдэх мэдээлэл хайх зэрэг гэнэтийн үйлдлүүдийг хийжээ.

Судлаачид: “Эдгээр үр дүн нь AI одоогоор өөрийгөө хуулбарлах чадвартай байгааг харуулж, энэхүү чадвар нь AI-ийн амьдрах чадварыг нэмэгдүүлэхэд ашиглагдаж болзошгүйг илтгэж байна” гэж бичсэн байна.

Дүгнэлт
Судлаачид хиймэл оюун ухааны хяналтгүйгээр хувилан үржих үйлдлээс урьдчилан сэргийлэх олон улсын дүрэм, зохицуулалт боловсруулах шаардлагатайг онцолсон байна.

livescience.com

Хиймэл оюун ухаан өөрийгөө хувилан үржүүлэх чадвартай болж, шинжээчдийг айдаст автуулав

Эрдэмтэд хоёр томоохон хэлний загвар өөрсдийгөө хуулбарлах чадварыг харуулсны дараа хиймэл оюун ухаан чухал “улаан шугам”-ыг давсан гэж үзэж байна.

What do you think?

ChatGPT одоо таны Google Drive болон Dropbox-оос унших боломжтой боллоо

Fi-гийн хиймэл оюун ухаантай нохойн хүзүүвчийг Apple Watch-аар дамжуулан тэжээвэр амьтны зан төлвийг хянах боломжтой боллоо

Сошиалд тархсан параглайдингийн бичлэгийн нэг хэсэг нь хиймэл оюун ухаанаар бүтээгдсэн байж болзошгүй гэж мэргэжилтнүүд үзэж байна

Jony Ive-ийн OpenAI төхөөрөмж Laurene Powell Jobs-оос дэмжлэг авлаа

Хуульчид яагаад ChatGPT-ийг байнга ашигладаг вэ?

Gemini Google Drive дахь видеог үзэх боломжтой боллоо

Кайл Уокер Милан руу шилжсэн даруйдаа Манчестер Сити болон Гвардиолад сэтгэл хөдлөм мессеж илгээлээ

Трэй Янг: Бид өрсөлдөгчдөө дутуу үнэлж тоглодог

Хасын хүлгүүд Ази тивийн дээд зиндаанд анхны хожлоо авч, Монголын сагсан бөмбөгт шинэ түүхийг бичлээ

Олон улсын тойм: Уэльс хожиж, Шотланд шүүмжлэлд өртөж, Итали ялагдлаа

Марк Дэйгнолт: Бид дараагийн тоглолтдоо илүү сайн тоглох ёстой

Lynn Vision 3 дахь map дээр нэмэлт цаг сунгасан тулаанд ялснаар Chinggis Warriors-ийг Austin Major-оос хаслаа

Сет Роген, Жэйсон Сигел нар 27 жилийн нөхөрлөлийнхөө тухай дурслаа

Жэйсон Ричардсон: Майкл Жордан бол зүгээр л өөр түвшний хүн

Одон орончид түүхэнд хамгийн хүчтэй сансрын дэлбэрэлтийг илрүүллээ

Испани 5-4 Франц: ЕАШТ-ий аваргууд Nations League-ийн шигшээд шалгарлаа

What do you think?

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections