Anthropic และ OpenAI ได้เปิดศึกด่านใหม่ในการแข่งขันกันเมื่อวันอังคาร โดยทั้งสองบริษัทต่างมุ่งเป้าไปที่งานวิจัยทางวิทยาศาสตร์ Anthropic เปิดตัว Claude Science ซึ่งเป็นแพลตฟอร์ม AI สำหรับนักวิจัย ขณะที่ OpenAI เปิดตัว GeneBench-Pro ซึ่งเป็นตัวชี้วัดสำหรับชีววิทยาคอมพิวเตอร์
การเปิดตัวในวันเดียวกันนี้ได้ขยายการแข่งขัน AI ออกจากเวที chatbot และระบบเขียนโค้ด มาสู่การทำงานในห้องปฏิบัติการ โดยบริษัทหนึ่งได้เปิดตัวเครื่องมือสำหรับนักวิทยาศาสตร์ในวันนี้ ส่วนอีกบริษัทหนึ่งได้สร้างมาตรวัดเพื่อบอกว่ายังเหลือระยะทางอีกมากเพียงใดสำหรับเทคโนโลยีนี้
Claude Science ของ Anthropic ทำอะไรได้บ้าง
Claude Science ได้รวบรวมฐานข้อมูล โค้ด และพลังการประมวลผลที่นักวิทยาศาสตร์ใช้งานไว้ในแอปเดียว โดยสามารถเชื่อมต่อกับฐานข้อมูลทางวิทยาศาสตร์มากกว่า 60 ฐานข้อมูลครอบคลุมทั้งจีโนมิกส์ โปรตีโอมิกส์ และเคมีสารสนเทศ
Claude Science เป็นแอปพลิเคชัน ไม่ใช่โมเดลใหม่ โดยเปิดตัวในขณะที่โมเดลที่ทรงพลังที่สุดของ Anthropic อย่าง Fable 5 และ Mythos 5 ยังคงถูกจำกัด ตามกฎของการส่งออกของสหรัฐอเมริกา ทุกผลลัพธ์สามารถตรวจสอบย้อนกลับได้จนถึงโค้ดที่สร้างผลลัพธ์นั้น
แพลตฟอร์มนี้สานต่อทิศทางงานวิทยาศาสตร์ชีวภาพที่ Anthropic เริ่มมาตั้งแต่เดือนตุลาคม 2025 ในช่วงเบต้า Jérôme Lecoq แห่งสถาบัน Allen Institute ได้นำไปใช้ย่อบทวิจารณ์ที่แต่ก่อนอาจใช้เวลานานถึงสองปี
Anthropic ยังจะมอบทุนสนับสนุนให้กับโครงการวิจัยมากถึง 50 โครงการ โดยแต่ละโครงการจะได้รับเครดิตสูงสุดมูลค่า USD 30,000
GeneBench-Pro ของ OpenAI ยกระดับมาตรฐาน
หลังจาก Anthropic เปิดตัว Claude Science ไม่นาน OpenAI ก็ได้ปล่อย GeneBench-Pro ออกมา เพื่อทดสอบว่า agent AI จะสามารถตัดสินใจในแบบที่งานวิจัยชีววิทยาที่แท้จริงต้องการได้หรือไม่
ตัวชี้วัดนี้รวม 129 ปัญหา ครอบคลุมทั้งสาขาจีโนมิกส์ ชีววิทยาเชิงปริมาณ และเวชศาสตร์แปลผล
โมเดลที่แข็งแกร่งที่สุดของ OpenAI GPT-5.6 Sol สามารถแก้ปัญหาบนระดับการให้เหตุผลสูงสุดได้สำเร็จ 28.7% และเพิ่มขึ้นเป็น 31.5% ในโหมด Pro ส่วน การเปิดตัว GPT-5.6 แบบเว้นช่วงก่อนหน้านี้ เกิดขึ้นตามคำขอของกรุงวอชิงตัน
GPT-5 เคยได้คะแนนต่ำกว่า 5% ใน GeneBench ดั้งเดิม ส่วน Anthropic Opus 4.8 ทำได้ถึง 16% ในแบบทดสอบที่ยากกว่า
ติดตามเราได้ทาง X เพื่อรับข่าวสารล่าสุดแบบเรียลไทม์
สองกลยุทธ์ กับเป้าหมายเดียว
ความแตกต่างนี้เผยให้เห็นสองแนวทางสู่เป้าหมายเดียวกัน โดย Anthropic ส่งมอบผลิตภัณฑ์จริงให้ใช้ในห้องแล็บทุกวัน ขณะที่ OpenAI วัดความน่าเชื่อถือในการให้เหตุผลผ่านข้อมูลที่ซับซ้อนของโมเดล
การเปิดตัวทั้งสองนี้ก็เกิดขึ้นในช่วงที่โมเดลจากจีนกำลังได้รับความนิยมเพิ่มขึ้นในงานวิจัย AI เช่นกัน นอกจากนั้น ตัวเลขของ OpenAI เองก็ช่วยลดกระแสความตื่นเต้น เพราะโมเดลที่ดีที่สุดของบริษัทก็ยังสอบตกเกือบทุกข้อใน GeneBench-Pro อยู่ดี
แรงกดดันในประเด็นนี้จึงเป็นทั้งด้านภูมิรัฐศาสตร์และวิทยาศาสตร์ โดยข้อจำกัดการส่งออกของสหรัฐฯ ได้ทำให้ Anthropic ต้องพิจารณาประเทศเจ้าภาพใหม่สำหรับโมเดลของตนเองแล้ว
ผู้วิจารณ์ประเมินว่าแต่ละปัญหาของ GeneBench-Pro จะใช้เวลาผู้เชี่ยวชาญมนุษย์ราว 20 ถึง 40 ชั่วโมง และมีค่าจ้างหลายพัน USD แต่ OpenAI กล่าวว่าโมเดลของตนสามารถวิเคราะห์เสร็จได้ในราคาเพียงไม่กี่ USD
Aubrey de Grey ผู้เชี่ยวชาญชีวเวชศาสตร์มุมมองเรื่องอายุยืน เห็นว่า AI จะช่วยขจัดอุปสรรคสำคัญในงานวิจัย แม้ว่าในภาพกว้างความก้าวหน้าอาจจะยังต้องใช้เวลาอีกสักพัก
สิ่งที่เราจะได้เห็นในเวลาอันใกล้นี้ก็คือ AI จะทำให้บางขั้นตอนของกระบวนการ โดยเฉพาะการพัฒนายากลายเป็นคอขวดที่ไม่จำเป็นอีกต่อไป Aubrey de Grey ประธานและประธานเจ้าหน้าที่วิทยาศาสตร์ของมูลนิธิ Longevity Escape Velocity กล่าวในพอดแคสต์ของ BeInCrypto
De Grey ได้เตือนว่าการเปลี่ยนงานวิจัยที่เร็วขึ้นให้กลายเป็นการรักษาที่ได้รับการอนุมัติ ยังต้องขึ้นอยู่กับกฎระเบียบและความยอมรับความเสี่ยงของสังคมด้วย
นักวิจัยคาดว่าจะมีการนำไปใช้เร็วขึ้น
ผู้เชี่ยวชาญบางคนให้ความเห็นว่าการเปลี่ยนแปลงนี้ได้เริ่มต้นขึ้นแล้ว ดร. Derya Unutmaz ศาสตราจารย์ด้านภูมิคุ้มกันวิทยา ได้กล่าวในพาเนลเดียวกันของ BeInCrypto ว่า ตอนนี้ AI ทำงานได้ดีกว่าการตัดสินใจของตนเองเสียอีก
ดิฉันเชื่อใจ AI มากกว่าความคิดของตนเองในสายงานที่ทำมา 35 ปีนี้
เขาคาดว่าการพึ่งพา AI แบบนี้จะขยายไปสู่งานทางคลินิกอย่างรวดเร็วด้วย
มันผิดจริยธรรม และดิฉันเชื่อว่าอีกไม่นานการไม่ใช้ AI ในทางการแพทย์จะถูกมองว่าเป็นการละเลยหน้าที่
กระแสความเชื่อนั้นยังเร็วกว่าเกณฑ์ชี้วัดอยู่มาก เราต้องติดตามกันต่อในอีกไม่กี่เดือนข้างหน้า ว่านักวิทยาศาสตร์จะนำเครื่องมือเหล่านี้ไปใช้จริงหรือไม่ รวมถึงคะแนนของ GeneBench-Pro จะเริ่มสูงขึ้นหรือเปล่า









