
อาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัล และหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป ประกาศเปิดตัวนวัตกรรมปัญญาประดิษฐ์ (AI) ครบวงจรชุดล่าสุด ในงาน Apsara Conference 2025 งานประชุมประจำปี เพื่อโชว์เคสเทคโนโลยีและนวัตกรรมล่าสุด การประกาศครั้งนี้ครอบคลุมตั้งแต่โมเดลภาษาขนาดใหญ่รุ่นใหม่จากตระกูล Qwen3, โมเดลสร้างภาพ Wan 2.5 ที่กำลังจะเปิดตัว, ชุดแพลตฟอร์มที่ปรับใหม่สำหรับการพัฒนาเอเจนต์และแอปพลิเคชัน ไปจนถึงการอัปเกรดโครงสร้างพื้นฐาน AI ครั้งใหญ่ ซึ่งเป็นการตอกย้ำตำแหน่งผู้นำระดับโลกของอาลีบาบา คลาวด์ ในฐานะบริษัทแถวหน้าของโลก AI ยุคใหม่
เอ็ดดี้ วู ประธานและหัวหน้าเจ้าหน้าที่บริหารของ อาลีบาบา คลาวด์ อินเทลลิเจนซ์ กล่าวว่า
"ในอนาคต โมเดล AI ขนาดใหญ่จะมีการผสานรวมเข้ากับอุปกรณ์ต่าง ๆ อย่างลึกซึ้ง โดยทำหน้าที่เหมือนระบบปฏิบัติการ ซึ่งมาพร้อมกับความจำที่ถาวร การประสานงานระหว่างคลาวด์ถึงปลายขอบเครือข่ายที่ราบรื่น และความสามารถในการพัฒนาอย่างต่อเนื่อง เรายังคงมุ่งมั่นในการเปิดโค้ดต้นฉบับของ Qwen และพัฒนาให้เป็น 'ระบบปฏิบัติการแห่งยุค AI' เพื่อเสริมพลังให้นักพัฒนาทั่วโลกสร้างแอปพลิเคชัน AI เพื่อเปลี่ยนแปลงโลก"
"ในเวลาเดียวกัน อาลีบาบา คลาวด์ ได้วางตำแหน่งเชิงกลยุทธ์ในฐานะผู้ให้บริการ AI แบบ Full-Stack โดยมุ่งมั่นในการมอบพลังประมวลผลที่แข็งแกร่งและมีประสิทธิภาพสูงสุดสำหรับการฝึก AI และการนำโมเดล AI ขนาดใหญ่ไปใช้งานบนคลาวด์ เพื่อเน้นย้ำถึงความมุ่งมั่นระยะยาวของเราในการพัฒนา AI เราจะดำเนินการตามแผนการลงทุน 380,000 ล้านหยวนในโครงสร้างพื้นฐาน AI และคลาวด์ในอีก 3 ปีข้างหน้า"
ตั้งแต่เปิดตัวเจเนอเรชั่นแรกของ Qwen ในปี 2023 อาลีบาบาได้เปิดโค้ดต้นฉบับของโมเดล AI มากกว่า 300 โมเดลที่สร้างขึ้นจากโมเดลพื้นฐาน 2 ตัว คือ โมเดลภาษาขนาดใหญ่ Qwen และโมเดลการสร้างภาพ Wan ด้วยจำนวนการดาวน์โหลดมากกว่า 600 ล้านครั้งและการสร้างโมเดลย่อยมากกว่า 170,000 โมเดล โมเดล AI ของอาลีบาบาได้กลายเป็นหนึ่งในซีรีส์ AI โอเพนซอร์สที่ใช้กันอย่างแพร่หลายที่สุดในโลก สถิติที่โดดเด่นคือบริษัทและบุคคลมากกว่า 1 ล้านรายใช้ Qwen บน Model Studio ซึ่งเป็นแพลตฟอร์มการพัฒนา AI ของอาลีบาบา
เปิดตัว Qwen3-Max สุดยอด LLM ที่ทรงพลังที่สุดจาก Alibaba
อาลีบาบา ได้เปิดตัว Qwen3-Max อย่างเป็นทางการในฐานะโมเดล LLM ขนาดใหญ่ที่สุดที่มีพารามิเตอร์กว่า 1 ล้านล้านตัว ด้วยโหมด Instruct (non-thinking) และ Thinking โมเดลนี้บรรลุประสิทธิภาพที่น่าประทับใจในการทำเบนช์มาร์ก (benmarks) ที่หลากหลาย โดยเฉพาะอย่างยิ่งในการสร้างโค้ดและความสามารถของเอเจนต์ สำหรับโหมด instruct ได้คะแนน 69.6 ใน SWE-Bench ซึ่งเป็นเบนช์มาร์กมาตรฐานสำหรับการประเมิน LLM ในประเด็นการใช้งานซอฟต์แวร์จริง ซึ่งเทียบเท่ากับโมเดลปิดชั้นนำบางรุ่น นอกจากนี้ยังทำสถิติคะแนนประสิทธิภาพที่โดดเด่นใน Tau2-Bench ซึ่งเป็นเบนช์มาร์กที่ประเมิน เอเจนต์สนทนา แสดงให้เห็นถึงความเชี่ยวชาญพิเศษในการใช้เครื่องมือ ที่ถือเป็นความสามารถพื้นฐานสำหรับการสร้างเอเจนต์ที่ชาญฉลาดและเน้นการดำเนินการ

นอกจากนี้ ในงานยังมีการเปิดตัวชุดโมเดล Qwen3 ที่ครอบคลุมการประมวลผลภาษาภาพและมัลติโมดอล (multimodols) ประกอบด้วย
ขณะเดียวกัน ยังมีการอัพเกรด Qwen3-Coder และ Qwen3-Image-Edit ครั้งใหญ่ โดย Qwen3-Coder ใหม่ให้ความเร็วในการอนุมานที่เร็วขึ้นและความปลอดภัยของโค้ดที่เพิ่มขึ้น ในขณะที่ Qwen3-Image-Edit ได้รับการอัปเดตเพื่อรองรับการแก้ไขหลายภาพ พร้อมการปรับปรุงความสอดคล้องของภาพอย่างมีนัยสำคัญ
อาลีบาบา ยังได้เปิดตัว Fun น้องใหม่ในตระกูล LLM เสียงที่มาพร้อมกับความสามารถการรู้จำ และสังเคราะห์เสียงพูดหลายภาษาขั้นสูง ซีรี่ส์นี้ประกอบด้วย Fun-ASR ซึ่งเป็นโมเดลการรู้จำเสียงพูดอัตโนมัติ (ASR) แบบ end-to-end ที่ปรับให้เหมาะสำหรับการนำไปใช้ในองค์กรธุรกิจจริง และ Fun-CosyVoice ซึ่งเป็นโมเดลสังเคราะห์เสียงพูดคุณภาพสูงและสื่อความหมายได้ดี ออกแบบมาเพื่อสร้างเสียงพูดที่ฟังธรรมชาติในหลายภาษา
Wan2.5 ยกระดับการสร้างสรรค์เนื้อหามัลติมีเดีย
ในงาน Apsara Conference ปีนี้ อาลีบาบา ยังได้แสดง 4 ตัวอย่างโมเดลของ Wan2.5 ประกอบด้วย 2 โมเดลสร้างวิดีโอล่าสุด, โมเดลสร้างรูปภาพ และโมเดลแก้ไขภาพ โมเดลสร้างวิดีโอรองรับการสร้างเสียงที่มีความเที่ยงตรงสูงสำหรับวิดีโอ โดยเพิ่มระยะเวลาจาก 5 เป็น 10 วินาที ทำให้สามารถสร้างเรื่องราวที่สมบูรณ์และสอดคล้องกันมากขึ้น ด้วยคุณภาพของภาพที่เพิ่มขึ้น โมเดลเหล่านี้มีสถาปัตยกรรมมัลติโมดอลแบบรวมในตัว ซึ่งได้รับการฝึกอบรมร่วมกันจากข้อมูลที่เป็นข้อความ เสียง และภาพ ทำให้สามารถสร้างวิดีโอด้วยมัลติโมดอลที่สอดคล้องกัน รับประกันเนื้อหาเสียงและภาพที่สอดประสานกัน และเพิ่มความเข้าใจคำสั่งเพื่อติดตามพรอมป์หลายประโยคที่ผู้ใช้ป้อนเข้ามา
เฟรมเวิร์กการพัฒนาใหม่สำหรับปรับใช้เอเจนต์ทรงพลัง
เฟรมเวิร์กการพัฒนาตัวใหม่ได้รับการเพิ่มเข้าใน Model Studio ซึ่งเป็นแพลตฟอร์มการพัฒนา AI ของ Alibaba Cloud เพื่อเพิ่มประสิทธิภาพในการนำเอเจนต์ AI ไปใช้งานในวงกว้าง เฟรมเวิร์กล่าสุดนี้ประกอบด้วย Model Studio-ADK (ชุดพัฒนาเอเจนต์) ซึ่งเป็นเฟรมเวิร์กการพัฒนาโค้ดระดับสูงสำหรับมืออาชีพในองค์กร ที่จะแปลความต้องการทางธุรกิจที่ซับซ้อนให้เป็นตรรกะเอเจนต์ที่สามารถดำเนินการได้ เพื่อให้สามารถพัฒนาเอเจนต์ AI ที่ซับซ้อนได้อย่างรวดเร็ว ด้วยความสามารถในการตัดสินใจอัตโนมัติ การพิจารณาความเป็นไปของสภาพแวดล้อม (dynamic reflection) และการทำงานซ้ำไปมา ผู้ใช้สามารถสร้างโปรเจกต์ DeepResearch หรือ Agentic RAG (Retrieval-Augmented Generation) ได้ภายในหนึ่งชั่วโมงโดยใช้ชุดเครื่องมือที่แข็งแกร่งนี้ Model Studio ยังได้อัปเกรดแพลตฟอร์มการพัฒนาแบบเขียนโค้ดน้อย Model Studio-ADP ซึ่งเป็นแพลตฟอร์มพัฒนาเอเจนต์ ทำให้ผู้ใช้ที่มีพื้นฐานการเขียนโปรแกรมจำกัด สามารถสร้างเอเจนต์ AI ตัวเบาได้อย่างง่ายดาย
ทั้งนี้ Model Studio Agent จะมีบทบาทแก้ไขความท้าทายหลักขององค์กร เช่น การประมวลผลข้อมูลหลายแหล่ง ข้อจำกัดของทรัพยากร และการปรับใช้ข้ามสภาพแวดล้อม โดยนำเสนอฟีเจอร์ระดับองค์กรที่หลากหลาย ประกอบด้วยการเชื่อมต่อแบบไร้รอยต่อผ่าน Model Context Protocol (MCP) การผสานรวมมัลติโมดอล RAG การจัดตารางการอนุมานแบบไดนามิก และบริการแซนด์บ็อกซ์ ช่วยให้องค์กรสามารถเร่งการใช้งานเอเจนต์ AI
ปัจจุบัน ผู้ใช้สามารถเข้าถึงโมเดลชั้นนำกว่า 200 โมเดลผ่าน Model Studio รวมถึงโมเดล Qwen และ Wan ที่พัฒนาโดยอาลีบาบาเอง ท่ามกลางเอเจนต์มากกว่า 800,000 เอเจนต์ที่ถูกสร้างขึ้นบน Model Studio ซึ่งรองรับสถานการณ์ที่หลากหลายตั้งแต่การสร้างเนื้อหาและการตลาดอัตโนมัติ ไปจนถึงการจัดการบ้านอัจฉริยะและการเพิ่มประสิทธิภาพการผลิต และในช่วง 12 เดือนที่ผ่านมา การเรียกใช้โมเดลผ่าน Model Studio เพิ่มขึ้น 15 เท่า สะท้อนถึงความต้องการที่เพิ่มขึ้นสำหรับโซลูชัน AI ที่แข็งแกร่งและปรับขนาดได้
แพลตฟอร์ม AI ใหม่เพื่อรองรับองค์กรและครีเอเตอร์
อาลีบาบา คลาวด์ ยังได้อัปเกรด AgentBay ครั้งใหญ่ ซึ่งเป็นสภาพแวดล้อมการทำงานบนคลาวด์แบบมัลติโมดอลและแพลตฟอร์มเอเจนต์ผู้เชี่ยวชาญสำหรับองค์กร นักพัฒนา และพาร์ทเนอร์ AI ซึ่งเปิดตัวครั้งแรกในเดือนกรกฎาคม ฟีเจอร์ใหม่ที่เพิ่มเข้ามา ได้แก่ Self-Evolving Engine หรือเอ็นจิ้นการพัฒนาตัวเอง อิมเมจคอนเทนเนอร์ที่กำหนดได้เอง และการควบคุมความปลอดภัย และการปฏิบัติตามกฎระเบียบในตัว ช่วยให้เอเจนต์เปลี่ยนจากผู้ช่วยอย่างง่ายโมเดลเดี่ยว กลายเป็นเอเจนต์ที่ทำงานมัลติโมดอลแบบผสมผสานได้เหมือนมนุษย์และสามารถทำงานได้ตั้งแต่ต้นจนจบ
เพื่อตอบสนองความต้องการขององค์กรที่เพิ่มขึ้นสำหรับการเติบโตที่ขับเคลื่อนด้วย AI อาลีบาบา คลาวด์ ยังเปิดตัว Lingyang AgentOne ซึ่งเป็นแพลตฟอร์มแอปพลิเคชัน AI ขององค์กรแบบครบวงจร ที่ช่วยให้องค์กรสามารถเปลี่ยนจากการตอบสนองแบบปฏิกิริยา (reactive) เป็นแบบเชิงรุก (proactive) ขับเคลื่อนด้วยโมเดล Qwen ของอาลีบาบา และผสานรวมอย่างลึกซึ้งกับระบบนิเวศของอาลีบาบา ในอีกด้าน Lingyang AgentOne จะมีพื้นที่เพื่อการพัฒนาเอเจนต์แบบ End-to-End ที่เชื่อมต่อได้กับระบบที่มีอยู่ ช่วยเร่งเวลาในการสร้างมูลค่า ผ่านโซลูชันอิงสถานการณ์ในด้านการตลาด การวิเคราะห์ การบริการลูกค้า และการปฏิบัติการ โดย Lingyang AgentOne จะเชื่อมโยงวงจรคุณค่าหรือ value chain ทั้งก่อนการขาย การขาย และหลังการขายทั้งหมด เพื่อมอบผลลัพธ์ที่วัดได้และพร้อมใช้งานจริงสำหรับอุตสาหกรรม เช่น ธุรกิจต่อเติมซ่อมแซมบ้าน และธุรกิจอีคอมเมิร์ซ
นอกจากนี้ยังมีส่วนของ Quark แพลตฟอร์มแอปพลิเคชัน AI สำหรับผู้บริโภคของอาลีบาบา ที่ได้เปิดตัว Zaodian ซึ่งเป็นแพลตฟอร์มสร้างภาพและวิดีโอ AI แบบครบจบ ที่รวมโมเดล AI ชั้นนำของอุตสาหกรรม เช่น Wan โมเดลสร้างวิดีโอตัวเรือธงของอาลีบาบา เพื่อส่งมอบประสบการณ์ระดับมืออาชีพและมีคุณภาพสำหรับครีเอเตอร์ผู้สร้างสรรค์คอนเทนต์ ซึ่งนอกจากฟังก์ชันข้อความเป็นวิดีโอ (text-to-video) และภาพเป็นวิดีโอ (image-to-video) ที่รองรับโดย Wan แล้ว Zaodian มีฟังก์ชันการสร้างและแก้ไขภาพ AI พร้อมตัวเลือกโมเดลชั้นนำ ทั้งหมดนี้ครีเอเตอร์สามารถสัมผัสบริการจากแพลตฟอร์มได้ที่เว็บไซต์ zaodian.quark.cn หรือเข้าผ่านทางเมนู AI Image ในเวอร์ชันเดสก์ท็อปของ Quark ก็ได้
โครงสร้างพื้นฐาน AI รุ่นใหม่สำหรับ Agentic AI
ในงานประชุมนี้ อาลีบาบา คลาวด์ ยังได้เปิดตัวหลายการอัปเกรดโครงสร้างพื้นฐานที่เป็นนวัตกรรมซึ่งออกแบบใหม่เพื่อรองรับโลกของ AI แบบเอเจนต์ที่กำลังมาถึงโดยเฉพาะ ประกอบด้วย





