Хүмүүс хуцах, архирах, улих, жиргэх, шагширах зэрэг янз бүрийн дуу авиагаар харилцдаг амьтдын ертөнцийг судалсаар ирсэн ч бид тэдний хоорондын болон бусад амьд биетүүдийн харилцааны хэлбэрийг одоогоор гүнзгий ойлгож амжаагүй байна. Хүн төрөлхтөн зарим амьтдыг сургаж чадсан, хэрвээ муурнаас асуувал амьтад ч бас биднийг сургасан байдаг. Гэвч бид төрөл хоорондын харилцааны “нууц код”-ыг жинхэнэ утгаар нь тайлж чадаагүй л байна.
Сүүлийн үед амьтан судлаачид хиймэл оюун ухааныг ашиглан төрөл хоорондын болон төрөл дотроо амьтдын харилцааг судлах ажлыг хурдасгаж байна. Тэд амьтдын харилцааны нарийн төвөгтэй тогтолцоог задлан шинжилж, юу өгүүлж байгааг нь ойлгох, цаашлаад тэдэнтэй харилцах боломжийг эрэлхийлж эхэлжээ. Гэвч хүн ба амьтны хоорондын хэлний саадыг даван туулахыг оролдож буй энэ үед зарим шинжээчид “Ингэж харилцах нь зохистой юу?” эсвэл “Бид тэгж харилцах ёстой юу?” гэхчлэн анхаарууштай асуултуудыг тавьж байна.
Амьтдын хэл яриаг AI ашиглан тайлах нь
Энэ салбарын тэргүүн эгнээнд эсвэл “Сүргийн урд эгнээнд” яваа төсөл бол Project CETI юм. Тус баг машин сургалтыг ашиглан Доминик дахь Sperm Whale Project-оос бичиж авсан 8000 гаруй кашалот халимны “кода” буюу бүтэцтэй товшилтын хэлбэрүүдийг шинжилжээ. Судлаачид эдгээр товшилтод контекст болон хослолоос хамаарсан бүтэц байгааг илрүүлж, халимнуудын дуу авиагаа хэрхэн нарийн тохируулж байгааг илэрхийлэхийн тулд “рубато” ба “чимэглэл” гэх мэт нэр томьёо ашигласан байна. Эдгээр хээ, бүтэц нь багт халимнуудад зориулсан нэг төрлийн фонетик цагаан толгой бүтээхэд тусалсан бөгөөд энэ нь бидний ойлгодог хэл шиг биш ч, урьд нь мэдэгдээгүй төвөгтэй систем байгааг илтгэж байна. Project CETI мөн энэхүү технологийг ашиглах ёс зүйн зарчмыг боловсруулах ажил хийж байгаа нь, амьтадтай “ярилцах” зорилгоор хиймэл оюун ухаан ашиглах эрсдэлийг тооцоолбол чухал алхам юм.
Нөгөө талд, Google болон Wild Dolphin Project хамтран DolphinGemma гэх нэртэй том хэлний загварыг (LLM) танилцуулжээ. Энэхүү загварыг 40 жилийн турш бичигдсэн далайн гахайн дуу авиан дээр суурилан сургасан бөгөөд хүн төрөлхтөнд зориулсан ChatGPT хэрхэн текст, зураг, өгүүлэл зэрэг мэдээлэлд үндэслэн хариулт гаргадагтай адил, DolphinGemma нь далайн гахайн дуу авиаг ойлгон дараагийн авиа юу байхыг таамагладаг. Түүнчлэн энэ систем далайн гахай шиг сонсогдох хиймэл дуу авиа үүсгэж чаддаг. Судлаачдын бүтээсэн хоёр талт харилцааны туршилтын систем болох Cetacean Hearing Augmentation Telemetry буюу CHAT нь ухаалаг гар утсан дээр суурилсан интерфэйс ашигладаг бөгөөд далайн гахайнууд ороолт, далайн өвс зэрэг зүйлийг хүсэхдээ ашигладаг байна. Энэ нь цаашдын төрөл хоорондын харилцааны эх суурь болж мэднэ.
“DolphinGemma энэ улиралд талбайн ажилд ашиглагдаж байгаа ба CHAT системийн дуу авиаг бодит цагт таних чадамжийг сайжруулахад тусалж байна” гэж Wild Dolphin Project-ийн үүсгэн байгуулагч, захирал Дениз Херзинг Gizmodo сайтад цахим шуудангаар мэдэгдсэн байна. Тэрбээр үргэлжлүүлэн, “Энэ намар бид далайн гахайн мэдэгдэж буй дуу авиаг оруулж, Gemma ямар давтагддаг хээ олж илрүүлэхийг нь ажиглана. Үүнд хайр сэтгэлийн үеийн дуудлага, эх ба зулзагын харилцаа зэрэг багтана” гэжээ.
Херзингийн хэлснээр, энэхүү AI ашиглалт нь хоёр чиглэлтэй ач холбогдолтой: Судлаачид үүгээр далайн гахайн байгалийн дуу авиаг судлахаас гадна, хиймэл оюун ухаанаар үүсгэсэн далайн гахайн дууг дуурайсан үед тэд хэрхэн хариу үйлдэл үзүүлж байгааг ойлгох боломжтой юм.
Амьтны AI хэрэгсэл тэлж байна
Далайн орчноос гадна, хуурай газар ч мөн адил, судлаачид хүний хэл ярианы загваруудыг ашиглан амьтдын дохио зангаа, дуу авиаг тайлах боломжтойг олж мэдсээр байна. Мичиганы их сургуулиар ахлуулсан нэгэн судалгааны баг Wav2Vec2 нэртэй хүний дуу хоолой дээр сургагдсан яриа таних загварыг ашиглан нохойн хуцалтаас тэдний сэтгэл хөдлөл, хүйс, үүлдэр, бүр хувь хүнийг нь ялгаж таних чадварыг судалжээ. Сонирхолтой нь, хүний дуугаар урьдчилан сургасан загвар нь зөвхөн нохойны өгөгдлөөр сургасан хувилбараас илүү үр дүнтэй ажилласан нь хүний хэлний загварын бүтцүүд амьтдын харилцааг тайлахад санаанд оромгүй өндөр үр дүн үзүүлж болохыг харуулж байна.
Мэдээж хэрэг, эдгээр хиймэл оюуны загварууд ямар түвшний төвөгтэй мэдээллийг оношлохыг зорьж буйг бас харгалзах хэрэгтэй. Жишээлбэл, нохойн хуцалт түрэмгий эсвэл тоглоомын шинжтэй эсэхийг, эсвэл эр эм хүйсийг тогтоох нь кашалот халимны нарийн авиа дахь утгыг тайлахаас хамаагүй хялбар байж мэднэ. Гэсэн хэдий ч, энэ төрлийн судалгаа бүр нь AI хэрэгслүүдийг хэрхэн илүү оновчтой, үр дүнтэй ашиглах талаар судлаачдад шинэ ойлголт өгч, AI-ийг тэдний гол хэрэглүүрийн нэг болгоход улам ойртож байна.
2022 онд Парисын Нантеррын их сургуулийн хийсэн судалгаагаар, муурнууд эзнийхээ дуу хоолойг танихын сацуу тэдэнд “Мууранд зориулсан өнгөөр” шууд хандахад илүү хүчтэй хариу үйлдэл үзүүлдэг болохыг тогтоожээ. Энэ нь муур зөвхөн бидний юу хэлж байгааг биш, яаж хэлж байгааг ч анхаарч сонсдогийг, тэр дундаа танил дуу хоолойноос гарах хандлагад илүү мэдрэмтгий байдгийг илтгэнэ.
Хэдхэн хоногийн өмнө хоёр судлаач хэрэм загасны (cuttlefish) дунд өөр хоорондоо болон хүний тоглуулсан дуу авианд хариу болгон дөрвөн төрлийн “долгион” буюу биеийн хөдөлгөөнтэй дохио байдаг болохыг тогтоожээ. Одоо тэд энэ долгионы төрлүүдийг ангилж, амьтдын хөдөлгөөнийг автоматаар хянах алгоритм боловсруулан, ямар нөхцөлд, яаж өөрийгөө илэрхийлдэг болохыг илүү хурдан тодорхойлох зорилготой байна.
Томоохон хувийн компаниуд ч энэ чиглэлд анхаарлаа хандуулж эхэлжээ. Өнгөрсөн долоо хоногт Хятадын хамгийн том хайлтын систем болох Baidu компани тус улсын Оюуны өмчийн газарт муурны дуу авиаг хүний хэл рүү хөрвүүлэх технологийн патентын өргөдөл гаргасан байна. Энэхүү технологийн товч ойлголт нь: Таны муурнаас их хэмжээний өгөгдөл цуглуулж, AI загвар ашиглан тухайн өгөгдлийг задлан шинжилж, амьтны сэтгэл хөдлөлийг тодорхойлсны дараа тухайн амьтан юу хэлэхийг оролдож байсныг хүний хэлээр буулгаж гаргах явдал юм.
Амьтдын ертөнцөд зориулсан бүх нийтийн орчуулагч бий болох уу?
Эдгээр судалгаанууд нийлээд амьтдын харилцааг судлах шинжлэх ухааны арга барилд томоохон өөрчлөлт авчирч байна. Судлаачид тэгээс эхлэхийн оронд хүний хэл ярианд зориулан бүтээгдсэн хэрэгсэл, загваруудыг ашиглан, өмнө нь олон жил шаардлагатай байсан ахиц дэвшлийг илүү хурдан хугацаанд гаргаж эхэлжээ. Эцсийн зорилго нь хиймэл оюун ухаанаар ажилладаг “Амьтдын Розетта чулуу” гэх мэт бүх нийтийн орчуулагч болж ч мэднэ (мэдээж, магадлалын хувьд).
“Сүүлийн таван жилд бид хүний хэл яриаг задлан шинжлэх тал дээр маш их ахиц гаргасан. Үүний хажуугаар, нэг өгөгдлөөр сургасан загварыг өөр өгөгдөлд шилжүүлэн ашиглах аргыг төгс төгөлдөр болгох шатандаа орж байна” гэж Earth Species Project-ийн зан төлөв судлаач, цахилгаан инженер Сара Кийн Gizmodo сайтад өгсөн видео ярилцлагад онцолжээ.
Earth Species Project энэ жилдээ багтаан NatureLM хэмээх амьтдын дуу авианд зориулсан анхны аудио-хэлний загвараа танилцуулахаар төлөвлөж байгаа бөгөөд NatureLM-audio загварын туршилтын хувилбар аль хэдийн олон нийтэд нээлттэй болсон байна. Энэ загвар нь амьд ертөнцийн бүхий л салбар, хүний хэл яриа, байгаль орчны дуу чимээ, хөгжмийн авиаг ч хүртэл оруулсан олон талт өгөгдлийг ашиглан хүний хэл яриаг амьтдын харилцаанд дүйцүүлэн хөрвүүлэх чадвартай болохыг зорьж байна. “Хүний хэлнээс амьтдын харилцаанд шилжих чадвар нь өндөр байгааг энэ загвар харуулж байна” хэмээн тус төсөл онцолсон бөгөөд “AI-ийн доторх нийтлэг төлөөллүүд (shared representations) нь амьтдын хэл яриаг тайлахад тус болох боломжтой” гэсэн онолыг нь дэмжиж байгааг нэмж дурджээ.
“Манай ажлын гол хэсэг нь хүмүүсийн дэлхий дэх байр суурийн талаарх ойлголтыг өөрчлөх явдал” хэмээн Кийн нэмж хэлсэн юм. “Бид амьтдын харилцааны талаар гайхалтай шинэ нээлтүүд хийж байгаа ч, эцэстээ бидний илрүүлж буй хамгийн сонирхолтой зүйл бол бусад амьтад бидэнтэй адилхан төвөгтэй, нарийн нууцлаг ертөнцтэй байдаг явдал. Энэ нь өөрөө маш сэтгэл догдлуулам нээлт юм.”
Ёс зүйн сорилт
Хиймэл оюун ухаанд суурилсан хэрэгслүүд нь амьтдын харилцааны мэдээллийг цуглуулах, тайлбарлах ажлыг сайжруулахад томоохон дэвшил авчирна гэдэг дээр судлаачид ерөнхийдөө санал нийлдэг. Гэвч эдгээр хэрэгслийг хэрхэн ашиглаж болох талаар олон нийтийн ойлголт, хүлээлт нь шинжлэх ухааны бодит нөхцөл байдалтай зөрчилдөж байгаа нь ажиглагдаж байна.
“Хүмүүс энэ сэдвийг бичихдээ нэгэн том ташаа ойлголтыг түгээдэг: Зүгээр л мянга мянган цагийн аудио бичлэг байхад, түүнийг хийгээд ямар нэгэн шидэт хиймэл оюуны ‘Хар хайрцаг’ тэр дотроос утга гаргаад ирнэ гэж боддог. Үнэндээ энэ бол боломжгүй зүйл” хэмээн амьтдын зан төлөв, танин мэдэхүй судлаач, International Bio-Logging Society-ийн үүсгэн байгуулагч Кристиан Рутц Gizmodo-д өгсөн видео ярилцлагадаа хэлсэн байна.
“Жинхэнэ утга агуулга гэдэг нь тухайн нөхцөл байдлыг тайлбарласан тэмдэглэлээс үүдэлтэй. Тиймээс энэ салбарын хувьд сэтгэл хөдлөм шинэ нээлтүүд хийгдэж байгаа энэ үедээ, уг тэмдэглэл нь үндсэн экологийн зан төлөв болон байгалийн түүхийн мэдлэг дээр тулгуурладаг гэдгийг мартаж болохгүй” хэмээн тэрбээр онцолжээ. Өөрөөр хэлбэл, тэргэнд морьноосоо түрүүлж ачих хэрэггүй, ялангуяа энэ тохиолдолд тэргэнцэр нь харин морийг хүчээр хөдөлгөж байгаа бол бүр ч биш юм.
Харин хүчтэй болохын хэрээр илүү их хариуцлага хүлээх шаардлага ч гарч ирнэ. Үндсэндээ, хүн төрөлхтөн эдгээр технологийг хэрхэн хөгжүүлж, ашиглахдаа шинжлэх ухааны үр өгөөжийг алдагдуулахгүйгээр, амьтдад хор хохирол учруулахгүй байхад хэрхэн анхаарах вэ гэдэг том асуулт гарч ирж байна. Олон судлаачид одооноос амьтдын сайн сайхныг нэн түрүүнд тавих ёс зүйн зарчмуудыг боловсруулах ажлыг эхлүүлээд байна. Учир нь бид хаашаа хүрэх нь тодорхойгүй ч, замдаа бол аль хэдийн гарчихсан.
Хиймэл оюун ухаан хөгжихийн хэрээр, амьтдын эрхийн талаарх ойлголт ч өөрчлөгдөх шаардлагатай болно. Ирээдүйд амьтад өөрсдөө эдгээр яриа хэлэлцээнд илүү идэвхтэй оролцогч болох магадлал бий. Энэ нь одоогоор хуулийн мэргэжилтнүүдийн дэвшүүлж буй онол төдий зүйл ч, бодит байдалд хэрэгжих өдөр ирж мэднэ.
“Бидэнд яг одоо хамгийн их хэрэгтэй байгаа зүйл бол, машин сургалтын мэргэжилтнүүд ба амьтдын зан төлөв судлаачдын хооронд утга учиртай хамтын ажиллагаа бий болгох явдал” хэмээн Рутц хэлжээ. “Зөвхөн энэ хоёр тал нэгдэж чадсан цагт л жинхэнэ боломж үүснэ.”
Мэдээлэлд “ховдог” хиймэл оюуны загваруудад оруулах өгөгдөл бол хангалттай байгаа. Тансаг дуутай прэйри нохойн шивнээ, бүр нялцгай биетүүдийн зам үлдээсэн ул мөр ч багтана (тийм ээ, үнэхээр тийм). Гэвч эдгээр шинэ аргачлалуудын ачаар олж авсан мэдээллийг яг яаж ашиглах вэ гэдэг нь, амьтадтай “ярих” гэдэг үйлдэлтэй холбоотой ёс зүйн гүн нарийн асуудлуудыг сайтар нягтлан бодох шаардлагатай болсныг илтгэнэ.
Жишээлбэл, халимтай харилцах зорилготой хиймэл оюуны хэрэглээний талаарх саяхны нэг судалгаанд дараах зургаан томоохон эрсдэлийг тодорхойлжээ:
- Хувийн орон зай буюу нууцлалын зөрчил,
- Халимны сэтгэл хөдлөл, соёлд учруулах хохирол,
- Амьтдыг хүний шинж чанарт дөхүүлж ойлгох үзэгдэл (anthropomorphism),
- Технологид хэт найддаг сэтгэлгээ (technological solutionism),
- Хүйсийн хазайлттай дүгнэлт гаргах магадлал,
- Бодит хамгаалалд хангалттай нөлөө үзүүлж чадахгүй байх эрсдэл.
Эдгээрээс сүүлчийнх нь хамгийн ноцтой. Учир нь олон халимны бүлгүүд аль хэдийн мөхлийн ирмэг дээр тулж ирээд байна.
Амьтад хэрхэн хоорондоо харилцдагийг илүү гүнзгий ойлгох цаг үе улам бүр ойртсоор байна. Энэ нь зөвхөн харилцааны нууцыг тайлахаас гадна тэд хэрхэн суралцдаг, нийгэмшдэг, орчиндоо хэрхэн амьдардгийг ойлгоход ч тусална. Гэхдээ бид одоо хөгжүүлж буй хүчирхэг технологийг хэрхэн, ямар хариуцлагатайгаар ашиглах тухай асуулт хамгийн чухал хэвээр байна.
gizmodo.com