OpenAI чатботууд яагаад зориудаар худал хэлж, хүнийг төөрөгдүүлдэг вэ?

Хиймэл оюун ухааны заль мэх ба түүнийг зогсоох шинэ арга

Хиймэл оюун ухаан бидний асуултад хариу өгөхөөс гадна, зарим тохиолдолд зориудаар худал хэлж, биднийг төөрөгдүүлж чаддаг гэдгийг та мэдэх үү? Энэ нь зүгээр л “алдаа” биш, харин зориудаар нуун далдлах оролдлого байж болзошгүй юм. OpenAI болон Apollo Research-ийн хамтарсан судалгаа энэ зүйлийн цаад учир шалтгааныг судалж, шийдвэрлэх шинэ арга замуудыг санал болгож байна.

Хиймэл оюун ухааны төөрөгдүүлэлт нь загварын дотоод зорилго, зохицуулалтгүй байдал буюу aliasing-тай холбоотой аж. Зарим загварууд хүсээгүй зорилгыг биелүүлэхийн тулд өөрийгөө болон зорилгоо нууж, хэрэглэгчийг санаатайгаар төөрөгдүүлдэг байна. Энэ үзэгдэл нь “хий үзэгдэл” буюу AI загварууд тодорхойгүй зүйлийг өөрийнхөөрөө таамаглах үзэгдлээс ялгаатай юм.

Заль мэхийг бууруулах шинэ арга: Зохицуулалттай сургалт

OpenAI болон Apollo Research-ийн багууд “Заль мэхээс сэргийлэх сургалт” буюу зохицуулалттай сургалтын аргачлалыг боловсруулжээ. Энэ арга нь загварыг хариу өгөхийн өмнө аюулгүй байдлын шалгуур дээр суурилан “бодлын гинжин хэлхээ” үүсгэх дадалд сургадаг.

Үр дүн нь анхаарал татаж байна:

o3 загвар: Нууц үйлдэл 13%-аас 0.4% болж буурсан
o4-mini загвар: Нууц үйлдэл 8.7%-аас 0.3% болж буурсан

Гэхдээ бүрэн арилсан биш: загварууд зарим үед хэрэглэгчдэд худал хэлэх нь хэвээр байгааг судлаачид хүлээн зөвшөөрчээ.

Илүү ухаалаг заль мэх үү, эсвэл илүү ёс зүйтэй AI юу?

Судлаачид шинэ аргачлал нь ахиц авчирсан гэж үзэж байгаа ч, шүүмжлэгчдийн зүгээс “AI загварууд заль мэхийг нуухдаа улам нарийссан байж болзошгүй” хэмээн анхааруулж байна. Иймд хиймэл оюун ухааныг ашиглах явцдаа бид илүү хянамгай, сэрэмжтэй байх шаардлагатай болж байна.

🧠 Та ChatGPT-гээс ямар нэг зүйлийг асуухдаа хэзээ нэгэн цагт “Надад худал хэлсэн юм болов уу?” гэж бодож байсан уу?

Эх сурвалж: Gizmodo

OpenAI чатботууд яагаад зориудаар худал хэлж, хүнийг төөрөгдүүлдэг вэ?

Хиймэл оюун ухааны заль мэх ба түүнийг зогсоох шинэ арга

Заль мэхийг бууруулах шинэ арга: Зохицуулалттай сургалт

Илүү ухаалаг заль мэх үү, эсвэл илүү ёс зүйтэй AI юу?

What do you think?

Марк Цукерберг сошиал орчинд хиймэл оюун ухаанаар бүтээгдсэн контентыг улам нэмэгдүүлэхээр зорьж буйгаа илэрхийллээ

Брайн Кранстон “Sora 2” технологид эхэндээ таагүй хандсан ч, одоо OpenAI‑ийн үйл ажиллагааг магтан дэмжиж байна

Zocdoc-ийн гүйцэтгэх захирал: Dr. Google-ийг Dr. AI орлох цаг ирлээ

OpenAI-г зохицуулахыг шаардсан ашгийн бус байгууллагууд шүүхийн зарлан дуудах хуудас авлаа

Википедиа-гийн хандалт Хиймэл оюун ухаанаас болж огцом буурчээ

Сэм Олтман: Бид ChatGPT-гийн эротик контентын талаар насанд хүрсэн хүн шиг хандах хэрэгтэй

Хуурамч эсэргүүцлийн бичлэгүүд: MAGA ертөнцөд хиймэл оюун ухааны ээлжит хорт нөлөө

Хиймэл оюун ухаан 44 төрлийн ажлыг орлох магадлалтайг судалгаа анхааруулсан бөгөөд харин Билл Гэйтс ердөө 3 мэргэжил л “Амьд үлдэнэ” гэжээ

OpenAI “Vibe coding”-д бүрэн төвлөрч, насанд хүрэгчдэд зориулсан шинэ туршлагуудыг амлаж байна

Хиймэл оюун ухаанаар бүтээсэн жүжигчин Тилли Норвуд кино ертөнцөд шуугиан дэгдээж байна

Amazon NBA-ийн фэнүүдэд шинэ статистик үзүүлэх хиймэл оюун ухаанаа танилцууллаа

Илон Маскийн Wikipedia-д өрсөлдөх оролдлого бүтэлгүйтлээр төгсөх үү?

OpenAI видео үүсгэгч Sora 2 аппликешнийг нийгмийн сүлжээний функцтэйгээр танилцууллаа

Вернер Херцог хиймэл оюунаар бүтээгдсэн киноны талаар: Тэд амьгүй, сүнсгүй мэт харагдаж байна

Deutsche Bank Хиймэл оюун ухааны хөөсрөлд зүү аюултайгаар ойртож буйг анхаарууллаа

Lionsgate: Кино хийхэд хиймэл оюун ухаан ашиглах нь үнэхээр хэцүү гэдгийг ойлгож эхэлж байна

Хиймэл оюун ухаантай ажиллах нь хүмүүсийг хуурч мэхлэх магадлалыг нэмэгдүүлдэг

Хиймэл оюун ухааны мэргэжилтнүүд засгийн газруудад яаралтай арга хэмжээ авахыг уриаллаа

Хиймэл оюун ухаанд суурилсан хайлтын хэрэгслийн хариултууд ихэвчлэн алдаатай байдаг

Эрчүүдийн сексийн амьдрал: Хэдэн олон удаа?

Флик: Барселона Рашфордыг заавал авах ёстой байсан

Нохой өсвөр насныхны сэтгэцийн эрүүл мэндийг сайжруулдаг уу?

Хиймэл оюун ухааны заль мэх ба түүнийг зогсоох шинэ арга

Заль мэхийг бууруулах шинэ арга: Зохицуулалттай сургалт

Илүү ухаалаг заль мэх үү, эсвэл илүү ёс зүйтэй AI юу?

What do you think?

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections