Čínská technologická společnost Alibaba ve středu vydala novou verzi svého modelu umělé inteligence Qwen 2.5, o kterém tvrdí, že překonal vysoce uznávaný DeepSeek-V3.
Neobvyklé načasování vydání modelu Qwen 2.5-Max na první den lunárního nového roku, kdy většina Číňanů nepracuje a je s rodinami, poukazuje na tlak, který raketový vzestup čínského startupu DeepSeek v oblasti umělé inteligence v posledních třech týdnech vyvíjí nejen na zahraniční rivaly, ale i na domácí konkurenci.
„Qwen 2.5-Max překonává … téměř ve všech oblastech GPT-4o, DeepSeek-V3 a Llama-3.1-405B,“ uvedla cloudová jednotka společnosti Alibaba v oznámení zveřejněném na svém oficiálním účtu WeChat s odkazem na nejpokročilejší open-source modely AI OpenAI a Meta.
Vydání asistenta umělé inteligence DeepSeek 10. ledna, poháněného modelem DeepSeek-V3, stejně jako vydání jeho modelu R1 20. ledna šokovalo Silicon Valley a způsobilo propad akcií technologických firem, přičemž údajně nízké náklady na vývoj a používání čínského startupu přiměly investory zpochybnit obrovské výdajové plány předních firem zabývajících se umělou inteligencí ve Spojených státech.
Úspěch společnosti DeepSeek však také vedl k tomu, že se její domácí konkurenti začali předhánět v modernizaci svých vlastních modelů umělé inteligence.
Dva dny po vydání DeepSeek-R1 vydal vlastník TikToku, společnost ByteDance, aktualizaci svého vlajkového modelu AI, který podle něj překonal model o1 společnosti OpenAI podporované společností Microsoft v AIME, srovnávacím testu, který měří, jak dobře modely AI chápou a reagují na složité instrukce.
Společnost DeepSeek tak zopakovala své tvrzení, že její model R1 soupeří s modelem o1 společnosti OpenAI v několika výkonnostních benchmarcích.
فوری رابطے