DeepSeek R1 vs OpenAI: Шинэ өрсөлдөгчийн үнэлгээ

Хятадын DeepSeek компани нээлттэй жингүүд (open-weights R1) бүхий R1 логик загвараа танилцуулаад ердөө долоо хонож байгаа ч энэхүү загвар нь OpenAI-ийн дэвшилтэт o1 загваруудтай өрсөлдөхүйц хүчин чадалтай гэж үзэж байна. Түүнчлэн, сургалтын өртөг нь харьцангуй бага байсан ч энэ загвар нь Америкийн хиймэл оюун ухааны компаниудад төдийгүй зах зээлд шинэ эргэлтийг бий болгож, томоохон өөрчлөлтийн эхлэл болж магадгүй байна.

DeepSeek компани нийтлэг шалгуур үзүүлэлтүүд болон Chatbot Arena-ийн тэргүүлэх жагсаалтыг ашиглан загварынхаа өрсөлдөх чадварыг нотолж байгаа ч бодит хэрэглээний кейсүүд нь шинэ загварын ашигтай байдлыг үнэлэхэд илүү тохиромжтой. Үүний тулд бид DeepSeek-ийн R1 загварыг OpenAI-ийн ChatGPT загваруудтай харьцуулан туршиж үзэхээр шийдсэн. Энэ нь өмнө нь ChatGPT болон Google Bard/Gemini хоёрын хооронд хийсэн харьцуулалтын хэв маягийг баримталсан юм.

Энэхүү туршилт нь хамгийн хүнд асуудлуудыг шалгах зорилготой биш байсан бөгөөд харин хэрэглэгчид өдөр тутамдаа хиймэл оюун ухааны загваруудаас асууж болох асуултуудын жишээг багтаасан.

Энэ удаад бид DeepSeek-ийн хариултуудыг ChatGPT-ийн $20/сарын o1 загвар болон $200/сарын o1 Pro загварын хариултуудтай харьцуулан OpenAI-ийн “Орчин үеийн шилдэг” бүтээгдэхүүн болон ихэнх хэрэглэгчдийн ашигладаг “Өдөр тутмын” загвартай хэрхэн өрсөлдөхийг харсан. Өмнөх туршилтуудад ашигласан зарим асуултуудыг дахин хэрэглэсэн бөгөөд Chatbot Arena-ийн “төрөл” хавсралтаас гарган авсан бүтээлч бичлэг, математикийн бодлого, заавар дагах, мөн илүү нарийн төвөгтэй, шаардлага өндөртэй “Хүнд асуултууд” гэх мэт хэсгүүдийг хамарсан шинэ асуултуудыг нэмж оруулсан.

Бид зөвхөн хариултын “Зөв байдал”-д анхаарахаас гадна илүү субъектив шинж чанаруудыг ч мөн харгалзан үзсэн. Түүнчлэн, шаардлагатай тохиолдолд загваруудын хариултын “Сэтгэх урсгал”-ыг судалж, тухайн хариулт хэрхэн гарч ирснийг илүү нарийвчлан ойлгохыг зорьсон. DeepSeek R1-ийн хувьд, энэ нь заримдаа эцсийн хариултад хүрэх дотоод алхмуудыг маш нарийн, дэлгэрэнгүй тайлбарласан урт хэлэлцүүлгүүдийг үүсгэхэд хүргэсэн байна.

DeepSeek R1 vs OpenAI: Шинэ өрсөлдөгч хэрхэн үнэлэгдэх вэ?

Бид энэхүү хиймэл оюун ухааны загваруудыг бүтээлч бичлэгээс эхлээд нарийн төвөгтэй даалгавар биелүүлэх хүртэл олон төрлийн сорилтод оруулсан.

What do you think?

Хуульчид яагаад ChatGPT-ийг байнга ашигладаг вэ?

Gemini Google Drive дахь видеог үзэх боломжтой боллоо

Gmail-ийн AI тоймууд автоматаар харагдах боллоо

OpenAI ChatGPT-ийг амьдралын бүх хэсэгт зориулсан ‘супер туслах’ болгохоор зорьж байна

RFK Jr.-ийн ‘Make America Healthy Again’ тайлан хиймэл оюун ухааны алдаатай байна уу?

New York Times анхны генератив хиймэл оюун ухааны гэрээгээ Amazon-той байгууллаа

Дэлхийн II дайны үеийн “Хамгийн хатуу Ford-ууд”

Дэлхийн хамгийн том мөсөн уул оцон шувуунуудын чухал орчинтой мөргөлдөж болзошгүй байна

Манчестер Сити баг Раян Аит-Нури-г клубын дэлхийн аваргын өмнө авах яриа хэлэлцээрээ эхлүүллээ

Volkswagen Tiguan R эргэн ирэх магадлалтайг илтгэв

Жаз багийн сагсан бөмбөгийн үйл ажиллагааны ерөнхийлөгчөөр Селтиксийн туслах ерөнхий менежер Остин Эйнжийг томилжээ: эх сурвалж

karate kid: legends киноны эхлэл, төгсгөл хоёр сэтгэл хөдөлгөнө

АНУ-ын 15 мужид хойд туйлын гэрэл ажиглагдах боломжтой

Данн: Пепийн баг ирэх жил сорилттой нүүр тулна

Шинэ симуляци: Сүүн зам Андромеда галактиктай мөргөлдөхгүй байж магадгүй

Gkids Америк дахь эрхийг авлаа: ‘Shin Godzilla’-ийн шинэ алхам

What do you think?

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections