อาลีบาบา เปิดตัว Wan2.1-VACE โมเดลโอเพ่นซอร์สล่าสุดของบริษัทฯ เพื่อการรังสรรค์และตัดต่อวิดีโอ
19 May 2025

อาลีบาบา เปิดตัว Wan 2.1-VACE (Video All-in-one Creation and Editing) ซึ่งเป็นโมเดลโอเพ่นซอร์สที่ใช้รังสรรค์และตัดต่อวิดีโอโมเดลล่าสุดของอาลีบาบา เครื่องมือล้ำสมัยนี้ ผสานรวมฟังก์ชันการประมวลผลวิดีโอหลากหลายฟังก์ชันไว้ในโมเดลหนึ่งเดียว เพื่อปรับปรุงกระบวนการสร้างวิดีโอให้มีประสิทธิภาพและประสิทธิผลมากขึ้น

 

VACE เป็นโมเดลโอเพ่นซอร์สโมเดลแรกในอุตสาหกรรมที่มอบโซลูชันในการสร้างวิดีโอหลากหลายและโซลูชันสำหรับการตัดต่อวิดีโออย่างครบวงจร VACE เป็นส่วนหนึ่งของ Wan2.1 series ซึ่งเป็นโมเดลขนาดใหญ่ที่ใช้ในการสร้างวิดีโอของอาลีบาบา

 

Wan2.1-VACE รองรับการสร้างวิดีโอจากอินพุตหลายรูปแบบ ไม่ว่าจะเป็น ข้อความ รูปภาพ และวิดีโอ ทั้งยังช่วยให้ผู้สร้างสรรค์วิดีโอสามารถตัดต่อวิดีโอได้อย่างครบวงจร ฟีเจอร์ด้านการตัดต่อเหล่านี้ รวมถึง ฟีเจอร์การอ้างอิงภาพหรือเฟรม การปรับวิดีโอใหม่ (video repainting) การแก้ไขวิดีโอบางส่วนที่เลือกไว้ และการขยายพื้นที่และเวลา ซึ่งช่วยให้สามารถผสมผสานการทำงานต่าง ๆ ได้อย่างยืดหยุ่นคล่องตัว ทำให้เกิดความคิดสร้างสรรค์เพิ่มขึ้น

 

เครื่องมือล้ำสมัยนี้ช่วยให้ผู้ใช้สามารถสร้างวิดีโอที่มีเนื้อหาการปฏิสัมพันธ์อย่างเฉพาะเจาะจงตามตัวอย่างภาพต่าง ๆ และทำให้ภาพนิ่งมีชีวิตชีวาด้วยการเพิ่มเอฟเฟกต์เคลื่อนไหวที่เป็นธรรมชาติ สนุกสนานกับการใช้สุดยอดฟังก์ชัน video repainting ต่างๆ เช่น การสร้างภาพโดยใช้ท่าทางที่ต้องการโดยนำมาจากภาพอีกภาพหนึ่งของบุคคลนั้นที่มีการแสดงท่าทางที่ต้องการ (pose transfer) การควบคุมการเคลื่อนไหว (motion control) การควบคุมระยะชัดลึก (depth control) และการให้สีใหม่ (recolorization)

 

โมเดลนี้ยังรองรับการเพิ่ม แก้ไข หรือลบเนื้อหาส่วนที่เลือก โดยไม่กระทบต่อเนื้อหาที่แวดล้อมอยู่ และยังสามารถขยายขอบเขตวิดีโอ (video boundaries) ในขณะที่มีการใส่เนื้อหาอย่างชาญฉลาดเพื่อเพิ่มประสบการณ์การรับชม

 

Wan2.1-VACE เป็นโมเดล AI ครบวงจร ที่มีความสามารถรอบตัวแบบไม่มีใครเทียบได้ ช่วยให้ผู้ใช้รวมฟังก์ชันหลากหลายไว้ด้วยกันได้อย่างราบรื่น และปลดล็อกศักยภาพในการสร้างสรรค์สิ่งใหม่ ผู้ใช้สามารถเปลี่ยนภาพนิ่งให้เป็นวิดีโอ โดยสามารถควบคุมการเคลื่อนไหวของวัตถุต่างๆ ได้ด้วยการระบุเส้นทางการเคลื่อนที่ (motion trajectory) สามารถแทนที่บุคลิก/ลักษณะ (characters) หรือวัตถุต่าง ๆ (objects) ด้วยการอ้างอิงที่ระบุไว้ (specified references), สร้างภาพเคลื่อนไหวให้กับ characters ที่อ้างอิงไว้, ควบคุมท่าทาง และ ทำภาพแนวตั้งให้เป็นแนวนอน เพื่อสร้างวิดีโอแนวนอน ในขณะที่เพิ่มองค์ประกอบใหม่ๆ ผ่านการอ้างอิง

 

เทคโนโลยีต่างๆ ที่เป็นนวัตกรรม

 

Wan2.1-VACE ใช้เทคโนโลยีใหม่ๆ หลายอย่าง โดยคำนึงถึงความต้องการของงานตัดต่อวิดีโอที่แตกต่างกันที่เกิดขึ้นในระหว่างการคิดค้นโครงสร้างและการออกแบบ อินเทอร์เฟซครบวงจรที่เรียกว่า Video Condition Unit (VCU) รองรับการประมวลผลอินพุตต่อเนื่องหลายรูปแบบได้อย่างครบถ้วนผ่านอินเทอร์เฟซเดียว ไม่ว่าจะเป็นข้อความ ภาพ วิดีโอ และมาสก์ต่างๆ

 

โมเดลนี้ใช้โครงสร้าง Context Adapter ที่แทรกคอนเซปต์งานต่างๆ ด้วยการใช้การแสดงมิติทางเวลาและเชิงพื้นที่อย่างมีแบบแผน ซึ่งช่วยให้โมเดลสามารถจัดการงานการสังเคราะห์วิดีโอหลากหลายได้อย่างยืดหยุ่น

 

ความก้าวหน้าด้านสถาปัตยกรรมโมเดล ช่วยให้สามารถนำ Wan2.1-VACE ไปใช้อย่างกว้างขวาง เช่น ใช้ผลิตวิดีโอสั้นบนโซเชียลได้อย่างรวดเร็ว, สร้างคอนเทนต์เพื่อการโฆษณาและการตลาด, นำไปใช้ในกระบวนการ post-production และการประมวลผลเอฟเฟกต์พิเศษในวงการภาพยนต์และโทรทัศน์ และใช้ในการสร้างวิดีโอเพื่อการอบรมทางการศึกษา

 

โมเดลพื้นฐานของวิดีโอเพื่อการฝึกอบรม ต้องใช้ทรัพยากรด้านการประมวลผลปริมาณมหาศาล และต้องใช้ข้อมูลที่ใช้ฝึกอบรมที่มีคุณภาพสูงจำนวนมาก การเปิดให้สามารถเข้าใช้โมเดลได้แบบระบบเปิด ช่วยลดอุปสรรคในการใช้ประโยชน์จาก AI ให้กับธุรกิจต่าง ๆ ได้มากขึ้น ช่วยให้ธุรกิจสามารถสร้างคอนเทนต์ที่อยู่ในรูปแบบของรูปภาพและวิดีโอ (visual content) คุณภาพสูงที่ปรับให้ตรงตามความต้องการเฉพาะของตนได้อย่างรวดเร็วและคุ้มค่าใช้จ่าย

 

อาลีบาบา ได้เปิดโอเพ่นซอร์สโมเดล Wan2.1-VACE สองเวอร์ชัน คือ ขนาด 14-billion(B)-parameter และ ขนาด1.3-billion(B)-parameter โดยเปิดให้ดาวน์โหลดฟรีบน Hugging Face, GitHub และบน ModelScope ซึ่งเป็นคอมมิวนิตี้ด้านโอเพ่นซอร์สของอาลีบาบา คลาวด์

 

อาลีบาบา เป็นบริษัทเทคโนโลยีรายใหญ่ระดับโลกรายแรกๆ ที่เปิดโอเพ่นซอร์สโมเดล AI ขนาดใหญ่ที่พัฒนาขึ้นเอง โดยได้เปิดโอเพ่นซอร์สโมเดล Wan2.1 ไปแล้วสี่โมเดลเมื่อเดือนกุมภาพันธ์ พ.ศ.2568 และเมื่อเดือนที่ผ่านมาได้เปิดโอเพ่นซอร์สโมเดลสร้างวิดีโอที่รองรับการสร้างวิดีโอด้วยเฟรมเริ่มต้นและเฟรมสิ้นสุด ปัจจุบันโมเดลที่กล่าวมานี้มียอดดาวน์โหลดแล้วมากกว่า 3.3 ล้านครั้งบน Hugging Face และ ModelScope

 

[อ่าน 1,610]
ข่าวที่เกี่ยวข้อง
CEA เปิดเวที Creative Excellence Awards 2025 คัดสุดยอดผลงานสร้างสรรค์เปลี่ยนเศรษฐกิจ-สังคม-สิ่งแวดล้อม
“ชาบูชิ” ปรับโฉมครั้งใหญ่ในรอบ 20 ปี! ดึง “สกาย–นานิ” เสริมทัพ เจาะใจคนรุ่นใหม่ด้วยแคมเปญ All You Can กรี๊ด
ทรู คอร์ปอเรชั่น เตรียมเสนอขายหุ้นกู้ชุดใหม่ ชูเรตติ้ง A+ ล็อกผลตอบแทนมั่นคง จูงใจนักลงทุน
เอสซีจี ชูโซลูชันเพื่อโรงงานอุตสาหกรรมแบบครบวงจร ในงาน FACTECH 2025
ดิสนีย์ พิกซาร์ - มูลนิธิจูเนียร์อะชีฟเม้นท์ ร่วมส่งเสริมศักยภาพ นักเรียนนักศึกษาไทยผ่านเวิร์กช็อป Pixar Animation Studios
เอไอเอ ประเทศไทย จัดกิจกรรม Pride Week
 ส่งเสริมความความเท่าเทียมในที่ทำงาน
MAGAZINE UPDATE
Owner
DOUBLE D CREATION Co.,Ltd.
เอเวอร์กรีนวิว ทาวเวอร์ ชั้น 4
เลขที่ 22/43 ซอยบางนา-ตราด 56 ถนนบางนา-ตราด
แขวงบางนา เขตบางนา กรุงเทพมหานคร 10260
Tel : 0-2751-4995-6
Mobile : 062-194-4561
Advertising
ติดต่อโฆษณา และ การตลาด
คุณศุภากร ยาตพงศ์ (บู)
Mobile : 08-1355-3636
Tel : 0-2751-4995-6
E-mail : market-plus@hotmail.com
info@marketplus.in.th
PR News
ส่งข่าวประชาสัมพันธ์
E-mail : info@marketplus.in.th,
market-plus@hotmail.com,
marketplus@hotmail.co.th
Copyright © 2016 DOUBLE D CREATION Co.,Ltd. All rights Reserved