ประเทศจีนเพิ่งสร้างโมเดล AI ขนาดใหญ่โดยไม่ใช้ชิป Nvidia และตอนนี้ OpenAI ก็หาวิธีลดการใช้งานชิปเหล่านี้ลงได้มากกว่าครึ่ง ช่วยลดต้นทุน Inference ได้มากกว่าครึ่ง ถึงอย่างนั้น ราคาหุ้น Nvidia ก็ยังคงปรับตัวเพิ่มขึ้น
นี่คือปริศนา เพราะ OpenAI เป็นหนึ่งในลูกค้ารายใหญ่ที่สุดของ Nvidia (NVDA) แต่ราคาหุ้นกลับเพิ่มขึ้น แม้จะมีการลดความต้องการใช้ชิปลง
OpenAI ลดต้นทุน Inference สองทางหลัก
ทางแรกคือซอฟต์แวร์ โดยสำนักข่าว The Information รายงานว่า วิศวกรของ OpenAI ได้ลดต้นทุน Inference มากกว่าครึ่งด้วยวิธีการปรับแต่งใหม่ OpenAI ยังไม่ได้เปิดเผยรายละเอียดทางเทคนิค
การประหยัดนี้ช่วยลดจำนวนชิป Nvidia ที่ต้องใช้ในการรองรับการใช้งาน ChatGPT บางส่วน และยังอาจเปิดโอกาสให้ OpenAI ลดราคา หรือเพิ่มจำนวนจำกัดการใช้งาน
ทางที่สองคือฮาร์ดแวร์ เมื่อวันที่ 24 มิถุนายน OpenAI และ Broadcom (AVGO) เปิดตัว Jalapeño ชิปแบบกำหนดเองตัวแรกของตนเอง โดย OpenAI ระบุว่าการทดสอบระยะแรกแสดงให้เห็นถึงประสิทธิภาพต่อวัตต์ที่ดีกว่าชิปชั้นนำในปัจจุบัน ด้วยการออกแบบเพียงเก้าเดือน
ชิปรุ่นแรกจะถูกนำมาใช้งานในระดับกิกะวัตต์ภายในสิ้นปี 2026 โดย Microsoft เป็นพันธมิตรหลัก Nvidia ยังคงจัดการ Inference ส่วนใหญ่ของ OpenAI แม้ OpenAI จะลงทุนกับ ความร่วมมือด้านชิปกับ Broadcom
บิ๊กเทคเร่งสร้างชิปของตัวเอง
OpenAI ไม่ได้เป็นรายเดียว เพราะ Google ได้พัฒนา Tensor Processing Unit มาตั้งแต่ปี 2016 และ Amazon ก็ได้พัฒนาของตัวเองเช่นกัน บริษัทวิจัย TrendForce คาดการณ์ว่า ระบบที่ใช้ ASIC จะมีส่วนแบ่งถึง 27.8% ของการจัดส่งเครื่องเซิร์ฟเวอร์ AI ในปี 2026 ซึ่งเป็นสัดส่วนสูงที่สุดตั้งแต่ปี 2023 เป็นต้นมา
ตามการสำรวจของ TrendForce ชิปแบบคัสตอมกำลังเติบโตเร็วกว่า GPU ของ Nvidia เป็นครั้งแรก ซัพพลายเออร์อย่าง Broadcom และ Marvell ได้กลายเป็น ผู้ผลิตชิปคัสตอมรายสำคัญ ในการผลักดันโครงสร้างพื้นฐานด้านนี้
มาตรการคว่ำบาตรก็กำลังผลักดันแนวโน้มเดียวกันในประเทศจีน เมื่อเร็ว ๆ นี้ Meituan ได้ฝึกสอนโมเดล LongCat-2.0 ขนาด 1.6 ล้านล้านพารามิเตอร์ของตนบน ชิปในประเทศจีน โดยไม่ต้องใช้ฮาร์ดแวร์ของ Nvidia เลย
เหตุผลที่หุ้น Nvidia ยังพุ่งขึ้นต่อเนื่อง
ภัยคุกคามมีอยู่จริง แต่ตัวเลขก็อธิบายความสบายใจได้ หุ้น Nvidia เพิ่มขึ้นเกือบ 2% ในวันที่ 30 มิถุนายน คิดเป็นมูลค่าประมาณ 4.8 ล้านล้าน USD รายงาน ผลประกอบการ ล่าสุดของ Nvidia เปิดเผยว่ารายได้จากศูนย์ข้อมูลเพิ่มขึ้น 75% เป็นสถิติใหม่ที่ 62.3 พันล้าน USD ในไตรมาสเดียว
แรงกดดันส่วนใหญ่จะอยู่ที่การใช้งาน (inference) ไม่ใช่การฝึกสอนโมเดล (training) Nvidia ยังคงครองส่วนแบ่งหลักในการฝึกสอนโมเดล โดยที่ซอฟต์แวร์ CUDA ได้ล็อกตัวนักพัฒนาตั้งแต่ปี 2006 ชิปแบบคัสตอมส่วนใหญ่ยังเทียบความยืดหยุ่นนี้ไม่ได้
Nvidia ยังปกป้องชั้นการประมวลผล inference ที่ถูกกล่าวหาว่ากำลังสูญเสียอยู่เช่นกัน ที่งาน GTC Nvidia ระบุว่าแพลตฟอร์ม Rubin ที่จะเปิดตัวเร็ว ๆ นี้สามารถลดต้นทุน inference ต่อโทเค็นได้ถึง 10 เท่าเมื่อเทียบกับ Blackwell ต้นทุนการ inference ที่ถูกลงก็มักจะทำให้มีการใช้งานและปริมาณการคำนวณรวมเพิ่มขึ้นตามด้วย
แต่ก็ยังมีบางคนไม่เชื่อมั่น นักลงทุนบางส่วนได้ขยับไปถือหุ้น ชิปคู่แข่ง โดยคาดว่าแนวโน้มการเปลี่ยนผ่านการ inference จะทวีความรุนแรงมากขึ้น อย่างไรก็ตาม Nvidia ให้เป้าหมายรายไตรมาสนี้โดยไม่นับยอดขายในจีนเลย และยังเห็นความต้องการสูงสุดเป็นประวัติการณ์
Nvidia ยังขายชิปที่ผลิตได้ทั้งหมด การทดสอบจริงก็คือ ลูกค้ารายใหญ่ที่สุดของบริษัทจะสามารถตัดสินใจเลิกใช้ Nvidia ได้เร็วกว่าอัตราการเติบโตของตลาดหรือไม่









