โดยแทบไม่มีใครให้ความสนใจ
0G ระบุว่าบริษัทได้ข้ามผ่านจุดสำคัญไปเมื่อหลายเดือนก่อน ตอนนี้บริษัทกำลังฝึกโมเดลเดิมซ้ำอีกครั้งในที่สาธารณะ โดยมีเป้าหมายเพื่อแสดงให้เห็นว่า AI แบบกระจายศูนย์สามารถมอบอะไรได้จริง และเหตุใดผลลัพธ์ก่อนหน้านี้จึงสมควรได้รับความสนใจมากกว่านี้
ในเดือนกรกฎาคม 2025 0G ได้ฝึกโมเดลที่มี 107 พันล้านพารามิเตอร์ชื่อ DiLoCoX-107B ร่วมกับ China Mobile ผลงานวิจัยนี้ต่อมาถูกตีพิมพ์ใน arXiv หลังผ่านการทบทวนโดยผู้ทรงคุณวุฒิ จากเอกสารฉบับนี้ ระบบสามารถเพิ่มประสิทธิภาพการสื่อสารได้ดีขึ้นถึง 357 เท่าเมื่อเทียบกับวิธี AllReduce แบบเดิม แม้กระนั้น ผลลัพธ์นี้แทบไม่ได้รับความสนใจในตลาดเลย
ทีมงานชี้ว่าเรื่องเวลานั้นส่งผลเสียอย่างมาก ช่วงกลางปี 2025 ความสนใจในวงการคริปโตส่วนใหญ่ไปอยู่กับการเปิดตัว mainnet และเรื่องราวของ token ขณะที่ผลทางเทคนิคกลับไม่ได้รับความสนใจเท่าที่ควร แม้งานนี้จะจริงจัง แต่ก็ได้รับความสนใจเฉพาะในกลุ่มแคบๆ ที่ติดตามสายงานนี้ใกล้ชิดเท่านั้น
ด้วยเหตุนี้ เมื่อ AI แบบกระจายศูนย์กลับมาอยู่ในความสนใจ 0G จึงต้องการนำผลลัพธ์นี้กลับมานำเสนออีกครั้ง
โครงการฝึกอบรมใหม่สำหรับประชาชน
ครั้งนี้ บริษัทได้เปิดกระบวนการฝึกซ้ำอย่างเปิดเผย
0G มีแผนที่จะบันทึกแต่ละขั้นตอนทั้งจุดตรวจ เมตริกการบรรจบ และแหล่งข้อมูล นอกจากนี้ยังระบุว่าการรันนี้จะได้รับการตรวจสอบผ่าน Trusted Execution Environments โดยใช้ zerogAuth เมื่อทำงานเสร็จแล้ว บริษัทจะเผยแพร่น้ำหนักโมเดลเป็นโอเพนซอร์ส
ในที่สุด 0G ต้องการแสดงให้เห็นว่า AI แบบกระจายศูนย์สามารถตรวจสอบ ทวนซ้ำ และยืนยันได้ในแบบที่ระบบปิดส่วนใหญ่ไม่สามารถเทียบเคียงได้
มากกว่าการแข่งขันเรื่องพารามิเตอร์
บทความเกี่ยวกับ AI ส่วนมากยังคงเน้นเรื่องจำนวนพารามิเตอร์ ตัวเลขที่มากขึ้นจะดึงดูดความสนใจ แต่ 0G โต้แย้งว่าคุณค่าของโมเดลขึ้นอยู่กับระบบโดยรวมที่ล้อมรอบมัน
สำหรับทีมงาน การทดสอบที่แท้จริงเริ่มต้นที่การฝึก และต่อเนื่องไปสู่กระบวนการยืนยันผล การจัดเก็บ การให้บริการ และการนำไปใช้งานกับผลิตภัณฑ์จริง
หนึ่งในประเด็นเทคนิคสำคัญคือประสิทธิภาพการสื่อสาร DiLoCoX ใช้การทำงานแบบ pipeline parallelism นโยบาย Optimizer คู่สำหรับอัปเดตแบบ local และ global กลไก one-step delay overlap และการบีบอัด gradient แบบปรับเปลี่ยนได้ กล่าวให้เข้าใจง่ายๆ คือ การออกแบบนี้ช่วยลดปริมาณการสื่อสารในระหว่างการฝึกแบบกระจายศูนย์ซึ่งมักเป็นจุดที่ระบบเหล่านี้ชะลอตัว
0G ยังนำโมเดลนี้ไว้ในโครงสร้างแบบครบวงจรซึ่งประกอบด้วยการยืนยันผลบนบล็อกเชน การจัดเก็บแบบกระจายศูนย์ ความพร้อมของข้อมูล การ inference และการชำระบัญชี ดังนั้น ผลลัพธ์คือสภาพแวดล้อมที่พร้อมใช้งานจริง ไม่ใช่แค่การสาธิตเพื่อการวิจัยชั่วคราว
การยืนยันผลเป็นอีกหนึ่งจุดเด่น ด้วย Trusted Execution Environments ผู้ใช้ตรวจสอบได้มากกว่าการมีอยู่ของโมเดล แต่ยังดูได้ว่าฝึกอย่างไร และข้อมูลอะไรที่ใช้ในกระบวนการนี้ สำหรับ AI แบบกระจายศูนย์ สิ่งนี้เปลี่ยนรูปแบบความไว้วางใจอย่างมีนัยสำคัญ
เรื่องจริงคือแบนด์วิดท์
0G ระบุว่าส่วนที่สำคัญที่สุดของผลลัพธ์ DiLoCoX-107B คือกระบวนการฝึกโมเดลนี้
ทีมงานระบุว่า โมเดล 107B ทำงานได้บนอินเทอร์เน็ตมาตรฐานความเร็ว 1 กิกะบิตต่อวินาที แทนที่จะต้องใช้โครงสร้างดาต้าเซ็นเตอร์ที่เฉพาะเจาะจง ประเด็นนี้มุ่งตรงไปยังสมมติฐานที่สำคัญในวงการ AI กล่าวคือ การเทรนฟรอนเทียร์ต้องอาศัยเงื่อนไขเครือข่ายที่หายากและมีราคาสูง
หากข้อสันนิษฐานนี้ยังเป็นจริงต่อเนื่อง ผลกระทบย่อมจะมีนัยสำคัญ เพราะข้อกำหนดทางเทคนิคที่ต่ำลงจะเปิดทางให้ผู้เข้าร่วมจำนวนมากยิ่งขึ้น ไม่ว่าจะเป็นกลุ่มวิจัย บริษัท หรือสถาบันสาธารณะ ด้วยโครงสร้างนี้ การประสานงานจะกลายเป็นความท้าทายหลัก และระบบแบบกระจายศูนย์ถูกสร้างมาเพื่อรับมือกับปัญหาประเภทนี้โดยตรง
โมเดลต้นทุนแบบใหม่
0G ยังกล่าวอีกว่า ระบบของบริษัทช่วยลดค่าใช้จ่ายลงประมาณ 95% เมื่อเทียบกับทางเลือกแบบรวมศูนย์
บริษัทให้น้ำหนักว่าการลดค่าใช้จ่ายนี้เกิดจากการตัดค่าบริหารจัดการรวมศูนย์ที่มีราคาแพงออก ไม่ใช่เพราะฮาร์ดแวร์ราคาถูกกว่า หากตัวเลขเหล่านี้ได้รับการยืนยันในสถานการณ์จริง การเทรนโมเดลขั้นสูงจะเข้าใกล้ผู้เข้าร่วมหลากหลายองค์กร ไม่ว่าจะเป็นมหาวิทยาลัย องค์กรธุรกิจ หรือรัฐบาลที่ไม่มีงบประมาณสำหรับ AI ระดับ hyperscale
ซึ่งประเด็นนี้สามารถเปลี่ยนแปลงว่าผู้ใดจะได้สร้างโมเดลขั้นสูงตั้งแต่แรก
AI แบบกระจายศูนย์แข่งได้ไหม
ผู้ที่ยังสงสัยมาโดยตลอดโต้แย้งว่า AI แบบกระจายศูนย์ไม่น่าจะทัดเทียมด้านประสิทธิภาพ 0G เชื่อว่าข้อแลกเปลี่ยนเก่าๆ กำลังค่อยๆ เสื่อมลง
เมื่อผลลัพธ์ดีขึ้นและต้นทุนลดลง บทสนทนาก็หันมาเน้นที่ประสิทธิผลมากกว่าอุดมการณ์ ระบบนี้จะเทรนโมเดลคุณภาพสูง ตรวจสอบได้ และทำทั้งหมดในงบประมาณที่ทีมต่างๆ เอื้อมถึงได้หรือไม่
การเปิดให้มีส่วนร่วมสาธารณะยังนำความเสี่ยงมาด้วย การเทรนแบบกระจายอาจทำให้ระบบเสี่ยงกับ data poisoning การปรับเปลี่ยน gradient และคุณภาพผู้ร่วมที่ไม่เท่าเทียม 0G ระบุว่าบริษัทรับมือประเด็นเหล่านี้ด้วยโครงสร้างป้องกัน การตรวจจับความผิดปกติ และการตรวจสอบด้วยคริปโตกราฟิก
เป้าหมายไม่ได้อยู่ที่ความปลอดภัยแบบไร้ข้อผิดพลาด แต่อยู่ที่การทำให้ข้อผิดพลาดปรากฏชัดและตรวจสอบย้อนกลับได้
ความหมายที่แท้จริงของ AI ที่ตรวจสอบได้
สำหรับ 0G AI แบบตรวจสอบกลับได้คือการแทนที่ความไว้ใจเชิงชื่อเสียง ด้วยความไว้ใจจากการตรวจสอบ
แทนที่ผู้ใช้จะต้องเชื่อผู้ให้บริการ พวกเขาสามารถตรวจสอบด้วยตนเองว่าโมเดลถูกเทรนอย่างไรและทำงานอย่างไร โดยแนวคิดนี้มีคุณค่าเห็นได้ชัด ในภาคที่ความรับผิดชอบมีน้ำหนักจริง ไม่ว่าจะเป็นการเงิน สาธารณสุข หรือภาครัฐ
นี่เองเป็นจุดที่ AI แบบกระจายศูนย์แตกต่างออกไป ด้วยระบบที่ผู้คนตรวจสอบได้ แทนที่จะเพียงแค่ต้องเชื่อถือ
จากเดโมวิจัยสู่ระบบที่ใช้งานได้จริง
วงการ AI แบบกระจายศูนย์ก้าวไกลอย่างมากในช่วงเวลาสั้นๆ งานต้นแบบในอดีตกำลังหลีกทางให้กับระบบที่ออกแบบมาเพื่อการเทรน การตรวจสอบ การจัดเก็บ การใช้งาน และการชำระเงินภายในสิ่งแวดล้อมเดียวกัน
0G ต้องการให้ DiLoCoX-107B เป็นหลักฐานของความก้าวหน้านั้น ความพยายามรีเทรนแบบสาธารณะสำคัญพอๆ กับประสิทธิภาพ บริษัทกำลังแสดงให้เห็นว่า AI แบบกระจายศูนย์สร้างโมเดลจริงจังได้ พร้อมเปิดให้ตรวจสอบเสมอ
เส้นทางข้างหน้า
โมเดลขนาดใหญ่กว่ายังคงรออยู่ในอนาคต 0G เชื่อว่าโมเดลที่มีขนาดหลักหลายร้อยพันล้าน หรือแม้แต่หลายล้านล้าน อยู่ในระยะเอื้อมถึง
ขั้นตอนถัดไปนี้ไม่ได้ขึ้นอยู่กับการก้าวกระโดดทางวิทยาศาสตร์เพียงอย่างเดียวอีกต่อไป แต่จะเน้นความร่วมมือที่มีประสิทธิภาพมากขึ้นและการมีส่วนร่วมในเครือข่ายที่แข็งแกร่งขึ้น ในวงการ AI แบบกระจายศูนย์ การจัดระบบอาจมีความสำคัญไม่แพ้ด้านศักยภาพการประมวลผลเลยทีเดียว
การฝึกอบรมใหม่ของ DiLoCoX-107B นี้ ถือเป็นความพยายามที่จะรื้อฟื้นการพูดคุยที่ 0G เชื่อว่าตลาดได้มองข้ามไปในครั้งแรก และยังเป็นการทดสอบด้วยว่า AI แบบเปิดโปร่งใสและสามารถตรวจสอบได้ สามารถดึงดูดความสนใจด้วยผลลัพธ์ที่แท้จริงแทนกระแสข่าวหรือไม่
ณ ตอนนี้ บริษัทกำลังเดิมพันว่า การฝึกอบรมแบบสาธารณะ เอกสารที่โปร่งใส และการเปิดให้เข้าถึงข้อมูล จะช่วยให้ AI แบบกระจายศูนย์มีรากฐานที่แข็งแกร่งยิ่งขึ้นในการแข่งขันรอบต่อไป