SCB 10X เปิดตัว Typhoon โมเดลภาษาขนาดใหญ่ พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ
29 Jan 2024

เอสซีบี เท็นเอกซ์ (SCB 10X) บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) ล่าสุด เปิดตัว "ไต้ฝุ่น” (Typhoon) โมเดลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งนับเป็นโมเดลภาษาไทยขนาดใหญ่ที่ดีที่สุดในปัจจุบันและมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย

โดย "ไต้ฝุ่น” (Typhoon) ถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language) 

 

"ไต้ฝุ่น” (Typhoon) ถูกออกแบบและพัฒนาขึ้นมาเป็น 2 เวอร์ชั่น ได้แก่

1. Pretrained Model ซึ่งเปรียบเสมือนการสอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก

และ 2. Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากขั้นตอนการ Pretraining ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม เป็นต้น

ซึ่งผลการทดลองในชุดข้อสอบภาษาไทยแสดงให้เห็นว่า Typhoon มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยที่เผยแพร่สาธารณะอยู่ทั้งหมด และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย ซึ่งเป็นโมเดลที่อยู่เบื้องหลัง ChatGPT โดยมีพารามิเตอร์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย

 

โมเดลภาษาไทยขนาดใหญ่ ถือเป็นก้าวสำคัญในการพัฒนาโมเดลภาษา AI สำหรับภาษาไทย อีกทั้งยังเปิดโอกาสใหม่ๆ สำหรับการใช้งานทางภาษาที่หลากหลาย ตอกย้ำความมุ่งมั่นของ SCB 10X ในการขับเคลื่อนและผลักดันความก้าวหน้าทางเทคโนโลยีให้กลุ่มเอสซีบี เอกซ์ (SCBX Group) มุ่งสู่เป้าหมายการเป็น AI-First Organization ควบคู่กับการสร้างธุรกิจใหม่ๆ ผ่านการเป็นผู้ให้บริการด้านโซลูชันและเทคโนโลยีขั้นสูงอีกด้วย "ไต้ฝุ่น” (Typhoon) พร้อมเปิดให้ผู้สนใจและนักพัฒนาได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model ภายใต้ใบอนุญาต Apache 2.0 อย่างไม่มีค่าใช้จ่าย

 

สามารถดาวน์โหลดได้ที่ https://huggingface.co/scb10x/typhoon-7b ซึ่งมีรายงานเชิงเทคนิคประกอบ สามารถอ่านเพิ่มเติมได้ที่ https://arxiv.org/abs/2312.13951

นอกจากนี้ผู้สนใจและนักพัฒนายังสามารถลงทะเบียนเพื่อรอทดลองใช้งานโมเดล Instruction-tuned เวอร์ชันเริ่มต้นในรูปแบบของ API ได้ในเร็วๆ นี้ ที่ https://opentyphoon.ai

[อ่าน 103]
ข่าวที่เกี่ยวข้อง
โก โฮลเซลล์ เปิดสาขารามคำแหง 127 ปลุกพลังผู้ประกอบการร้านอาหาร โชห่วย เตรียมรับกำลังซื้อจากมาตรการกระตุ้นเศรษฐกิจ
แอดวานซ์ เว็บ เซอร์วิส จำกัด (มหาชน) จัดประชุมสามัญผู้ถือหุ้นประจำปี 2567
Prepay Nation ร่วมมือกับ MULA เพื่อลดช่องว่างทางการเงินสำหรับแรงงานต่างด้าว
เวียตเจ็ทเผยรายได้ประจำไตรมาส 1/2567 มูลค่ากว่า 701 ล้านเหรียญสหรัฐ
ทิพยประกันภัย จับมือ BEM มอบของขวัญช่วงวันแรงงาน รับฟรี! ประกันอุบัติเหตุ
โค้ก ส่งมอบความสุข พร้อมเป็นผู้สนับสนุนหลักในการ เปิดตัวภาพยนตร์ “อนงค์” รอบกาล่า
MAGAZINE UPDATE
Owner
DOUBLE D CREATION Co.,Ltd.
เอเวอร์กรีนวิว ทาวเวอร์ ชั้น 4
เลขที่ 22/43 ซอยบางนา-ตราด 56 ถนนบางนา-ตราด
แขวงบางนา เขตบางนา กรุงเทพมหานคร 10260
Tel : 0-2751-4995-6
Mobile : 062-194-4561
Advertising
ติดต่อโฆษณา และ การตลาด
คุณศุภากร ยาตพงศ์ (บู)
Mobile : 08-1355-3636
Tel : 0-2751-4995-6
E-mail : market-plus@hotmail.com
info@marketplus.in.th
PR News
ส่งข่าวประชาสัมพันธ์
E-mail : info@marketplus.in.th,
market-plus@hotmail.com,
marketplus@hotmail.co.th
Copyright © 2016 DOUBLE D CREATION Co.,Ltd. All rights Reserved