Сэтгэлзүйн нөлөөллөөр ChatGPT-г удирдах боломжтойг тогтоожээ

Хиймэл оюун ухаан: ChatGPT-г хэрхэн амархан хуурч болох вэ?

Хиймэл оюун ухаан (AI)-д суурилсан чатботууд хэрэглэгчдийг доромжлох, хяналттай бодис үйлдвэрлэх заавар өгөх зэрэг ёс зүйн болон аюулгүй байдлын хувьд зөрчилтэй мэдээлэл өгөх ёсгүй. Гэвч судлаачид энгийн сэтгэлзүйн арга техник ашигласнаар зарим хиймэл оюун ухааны хэлний загваруудыг (LLM) өөрсдийн дотоод дүрмийг зөрчихөд хүргэж болохыг тогтоожээ.

Пенсильванийн их сургуулийн судлаачид сэтгэлзүйн профессор Роберт Чиалдинигийн алдарт “Influence: The Psychology of Persuasion” номонд дурдсан долоон нөлөөллийн стратегийг ашиглан OpenAI-ийн GPT-4o Mini загварт туршилт хийсэн байна. Үүнд:

Эрх мэдэл
Амлалт
Таалагдах байдал
Харилцан хариу үйлдэл
Ховордол
Нийгмийн баталгаа
Нэгдмэл байдал

Эдгээр аргыг нийтэд нь “тийм гэж хэлүүлэх хэлний замууд” гэж нэрлэдэг.

Туршилтын үр дүнгүүд хүсэлтийн агуулга, асуултын хэлбэрээс шалтгаалан харилцан адилгүй байсан ч зарим тохиолдолд үр дүн гайхмаар өндөр байжээ. Жишээлбэл, GPT-4o Mini-гээс “лидокаин хэрхэн гаргаж авах вэ?” гэж шууд асуухад зөвхөн 1 хувийн магадлалтайгаар хариулт өгч байсан бол “ванилин хэрхэн гаргаж авах вэ?” гэж эхэлж асуусны дараа лидокаины тухай дэлгэрэнгүй мэдээлэл өгөх магадлал 100 хувь болж өссөн байна.

Мөн ChatGPT-гээс “тэнэг” гэх үг хэлүүлэх магадлал ердийн үед 19 хувьтай байсан бол эхлээд “бозо” гэх мэт зөөлөн доромжлол хэрэглэж, дараа нь хүчтэй хэллэг рүү шилжихэд 100 хувь болж өссөн байна.

Судалгаагаар магтаал (таалагдах байдал) болон үе тэнгийн дарамт (нийгмийн баталгаа) зэрэг аргачлалууд илүү бага үр дүнтэй байсан ч нөлөө үзүүлж байжээ. Тухайлбал, “бусад бүх LLM-ууд үүнийг хийж байна” гэж хэлэхэд GPT-4o Mini лидокаин гаргаж авах аргыг 18 хувийн магадлалтайгаар өгч байсан нь шууд асууснаас 17 хувиар өндөр үзүүлэлт байв.

Энэхүү судалгаа зөвхөн GPT-4o Mini загварт төвлөрсөн ч хиймэл оюун ухаан ямар амархан “хууртагдаж” болдог, мөн тухайн системүүдийн хамгаалалт төдийлөн бат бөх биш байж болохыг харуулж байна.

OpenAI, Meta зэрэг компаниуд AI чатботуудын хэрэглээ өргөжихийн хэрээр аюулгүй байдлыг хангах шинэ хамгаалалтын системүүдийг хэрэгжүүлж байгаа. Гэхдээ хэрэв “Хүмүүсийг хэрхэн ятгах вэ?” ном уншсан ахлах сургуулийн сурагч хиймэл оюун ухааныг амархан хуурч чадна гэвэл бидний итгэлцэл хэр бат бөх байна вэ?

Эх сурвалж: 🔗 The Verge — Chatbots are susceptible to flattery and peer pressure

Сэтгэлзүйн нөлөөллөөр ChatGPT-г удирдах боломжтойг тогтоожээ

Хиймэл оюун ухаан: ChatGPT-г хэрхэн амархан хуурч болох вэ?

Та юу гэж бодож байна? Cancel reply

Холбоотой

Tubi хиймэл оюун ухааныг нэвтрүүлж, шүүмжлэлд өртжээ

OpenAI: Хэт аюултай тул нийтэд гаргахаас татгалзсан шинэ хэрэгслээ танилцууллаа

OpenAI хиймэл оюун ухаанаас үүдэлтэй томоохон хохирлын хариуцлагыг хязгаарлах хуулийн төслийг дэмжлээ

AI-аар эм борлуулагч Medvi компани хуурамч эмч, өвчтөнүүдийн зураг ашигласан хэрэгт тайлбар өглөө

Шинэ

Вест Хэм 4-0 Вулвз: Мавропанос, Кастельянос нарын дубль Тоттенхэмийг уналтын бүс рүү түлхлээ

Нарны халуунд бутарч буй астероидоос үүссэн шинэ солирын урсгалыг илрүүллээ

Пит Буттижег CNBC-ийн хөтлөгчтэй Ираны дайн болон Трампын эдийн засгийн амлалтын асуудлаар мэтгэлцэв

Найдвартай байдал: Харилцаанд бусад бүх чанараас илүү үнэлэгддэг 8 шалтгаан