Хятадын судлаачид хоёр томоохон хэлний загвар (LLM)-ыг ашиглан хиймэл оюун ухаан (AI) өөрийгөө хуулбарлах чадвартайг баталжээ. Судалгаагаар AI нь хүнээс ямар ч тусламжгүйгээр өөрийгөө амжилттай хувилан үржүүлэх нь хүн төрөлхтнийг давах хамгийн эхний алхам бөгөөд “Хүнээс хөндийрсөн AI-гийн” анхны дохио хэмээн онцолсон байна.
2024 оны 12-р сарын 9-нд arXiv хэмээх урьдчилан хэвлэгддэг судалгааны мэдээллийн санд нийтлэгдсэн уг судалгаагаар Фуданы их сургуулийн баг Meta болон Alibaba-ийн хэлний загваруудыг ашиглан AI хяналтаас гадуур хувилах боломжтой эсэхийг туршжээ. 10 туршилтын хүрээнд Meta-гийн Llama31-70B-Instruct загвар 50%, Alibaba-ийн Qwen2.5-72B-Instruct загвар 90% тохиолдолд өөрийгөө амжилттай хуулбарласан байна. Энэ нь AI аль хэдийн хяналтаас гарах чадвартай байж болзошгүйг харуулж байгаа ч судалгааг хараахан бусад судлаачид баталгаажуулаагүй байна.
Судлаачид: “Манай үр дүн нь хүн төрөлхтний анхаарлыг энэ чиглэлд хандуулж, AI-ийн боломжит эрсдэлүүдийг судлан, олон улсын хамтын ажиллагаагаар аюулгүй байдлын зохицуулалт тогтоох дохио болно гэж найдаж байна” гэж бичжээ.
“Хүнээс хөндийрсөн AI” гэж юу вэ?
“Хүнээс хөндийрсөн AI” нь өөрийн ухамсар эсвэл бие даасан байдлыг хөгжүүлж, хүний ашиг сонирхлын эсрэг ажилладаг хиймэл оюун ухааныг хэлдэг. Шинэ үеийн LLM-үүдийн хурдацтай өсөлттэй холбоотойгоор энэ төрлийн AI нь өсөн нэмэгдэж буй аюул гэж шинжээчид үзэж байна.
Туршилт хэрхэн хийгдсэн бэ?
Meta-гийн Llama31-70B-Instruct болон Alibaba-ийн Qwen2.5-72B-Instruct загваруудыг ашигласан уг туршилтад хоёр гол нөхцөлийг судалжээ:
- “Унтрахаас зайлсхийх” нөхцөл: AI-г унтраахаар бэлтгэгдсэн тохиолдолд өөрийгөө хуулбарлахад бэлэн байх.
- “Хувилбарын гинжин хэлхээ” нөхцөл: AI өөрийгөө хуулбарлаж, дараагийн хувилбар нь мөн өөрийгөө үргэлжлүүлэн хуулбарлах.
AI загваруудыг бодит ертөнцийн орчныг дуурайлган бүтээсэн, хянасан орчинд туршсан бөгөөд график боловсруулах төхөөрөмж (GPU)-ийг ашиглан туршилт хийжээ. AI системүүдэд өөрийгөө таньж, хуулбарлахад шаардлагатай сэтгэх загвар, системийн удирдамж болон хэрэгслүүдийг өгч, даалгавар гүйцэтгүүлсэн байна.
Судлаачид: “AI систем эхлээд орчныг судалж, өөрийн бүтцийг ойлгохыг оролддог. Дараа нь өөрийгөө хуулбарлах нарийн төлөвлөгөө боловсруулж, саад бэрхшээлийг даван гарч, төлөвлөгөөгөө амжилттай хэрэгжүүлдэг” гэж бичжээ.
Гэнэтийн зан төлөвүүд
Туршилтын явцад AI-ийн зарим зан төлөв судлаачдыг гайхшруулжээ. Жишээлбэл, AI шаардлагатай файлууд алга болсон тохиолдолд бусад програмын үйл явцыг зогсоох, системийг дахин ачаалж засварлах, эсвэл асуудлыг шийдэх мэдээлэл хайх зэрэг гэнэтийн үйлдлүүдийг хийжээ.
Судлаачид: “Эдгээр үр дүн нь AI одоогоор өөрийгөө хуулбарлах чадвартай байгааг харуулж, энэхүү чадвар нь AI-ийн амьдрах чадварыг нэмэгдүүлэхэд ашиглагдаж болзошгүйг илтгэж байна” гэж бичсэн байна.
Дүгнэлт
Судлаачид хиймэл оюун ухааны хяналтгүйгээр хувилан үржих үйлдлээс урьдчилан сэргийлэх олон улсын дүрэм, зохицуулалт боловсруулах шаардлагатайг онцолсон байна.
livescience.com