ไทย

Anthropic และ OpenAI ขยายศึก AI สู่การวิจัยวิทยาศาสตร์

  • Anthropic เปิดตัว Claude Science เครื่องมือ AI เชื่อมต่อฐานข้อมูลวิทยาศาสตร์กว่า 60 แห่ง
  • OpenAI เปิดตัว GeneBench-Pro เกณฑ์วัด AI ด้านชีวสารสนเทศ
  • โมเดลที่ดีที่สุดของ OpenAI ผ่านโจทย์ชีววิทยา GeneBench-Pro แค่ 28.7%
Promo

Anthropic และ OpenAI ได้เปิดศึกด่านใหม่ในการแข่งขันกันเมื่อวันอังคาร โดยทั้งสองบริษัทต่างมุ่งเป้าไปที่งานวิจัยทางวิทยาศาสตร์ Anthropic เปิดตัว Claude Science ซึ่งเป็นแพลตฟอร์ม AI สำหรับนักวิจัย ขณะที่ OpenAI เปิดตัว GeneBench-Pro ซึ่งเป็นตัวชี้วัดสำหรับชีววิทยาคอมพิวเตอร์

การเปิดตัวในวันเดียวกันนี้ได้ขยายการแข่งขัน AI ออกจากเวที chatbot และระบบเขียนโค้ด มาสู่การทำงานในห้องปฏิบัติการ โดยบริษัทหนึ่งได้เปิดตัวเครื่องมือสำหรับนักวิทยาศาสตร์ในวันนี้ ส่วนอีกบริษัทหนึ่งได้สร้างมาตรวัดเพื่อบอกว่ายังเหลือระยะทางอีกมากเพียงใดสำหรับเทคโนโลยีนี้

ผู้สนับสนุน
ผู้สนับสนุน

Claude Science ของ Anthropic ทำอะไรได้บ้าง

Claude Science ได้รวบรวมฐานข้อมูล โค้ด และพลังการประมวลผลที่นักวิทยาศาสตร์ใช้งานไว้ในแอปเดียว โดยสามารถเชื่อมต่อกับฐานข้อมูลทางวิทยาศาสตร์มากกว่า 60 ฐานข้อมูลครอบคลุมทั้งจีโนมิกส์ โปรตีโอมิกส์ และเคมีสารสนเทศ

Claude Science เป็นแอปพลิเคชัน ไม่ใช่โมเดลใหม่ โดยเปิดตัวในขณะที่โมเดลที่ทรงพลังที่สุดของ Anthropic อย่าง Fable 5 และ Mythos 5 ยังคงถูกจำกัด ตามกฎของการส่งออกของสหรัฐอเมริกา ทุกผลลัพธ์สามารถตรวจสอบย้อนกลับได้จนถึงโค้ดที่สร้างผลลัพธ์นั้น

แพลตฟอร์มนี้สานต่อทิศทางงานวิทยาศาสตร์ชีวภาพที่ Anthropic เริ่มมาตั้งแต่เดือนตุลาคม 2025 ในช่วงเบต้า Jérôme Lecoq แห่งสถาบัน Allen Institute ได้นำไปใช้ย่อบทวิจารณ์ที่แต่ก่อนอาจใช้เวลานานถึงสองปี

Anthropic ยังจะมอบทุนสนับสนุนให้กับโครงการวิจัยมากถึง 50 โครงการ โดยแต่ละโครงการจะได้รับเครดิตสูงสุดมูลค่า USD 30,000

GeneBench-Pro ของ OpenAI ยกระดับมาตรฐาน

หลังจาก Anthropic เปิดตัว Claude Science ไม่นาน OpenAI ก็ได้ปล่อย GeneBench-Pro ออกมา เพื่อทดสอบว่า agent AI จะสามารถตัดสินใจในแบบที่งานวิจัยชีววิทยาที่แท้จริงต้องการได้หรือไม่

ผู้สนับสนุน
ผู้สนับสนุน

ตัวชี้วัดนี้รวม 129 ปัญหา ครอบคลุมทั้งสาขาจีโนมิกส์ ชีววิทยาเชิงปริมาณ และเวชศาสตร์แปลผล

โมเดลที่แข็งแกร่งที่สุดของ OpenAI GPT-5.6 Sol สามารถแก้ปัญหาบนระดับการให้เหตุผลสูงสุดได้สำเร็จ 28.7% และเพิ่มขึ้นเป็น 31.5% ในโหมด Pro ส่วน การเปิดตัว GPT-5.6 แบบเว้นช่วงก่อนหน้านี้ เกิดขึ้นตามคำขอของกรุงวอชิงตัน

GPT-5 เคยได้คะแนนต่ำกว่า 5% ใน GeneBench ดั้งเดิม ส่วน Anthropic Opus 4.8 ทำได้ถึง 16% ในแบบทดสอบที่ยากกว่า

ติดตามเราได้ทาง X เพื่อรับข่าวสารล่าสุดแบบเรียลไทม์

สองกลยุทธ์ กับเป้าหมายเดียว

ความแตกต่างนี้เผยให้เห็นสองแนวทางสู่เป้าหมายเดียวกัน โดย Anthropic ส่งมอบผลิตภัณฑ์จริงให้ใช้ในห้องแล็บทุกวัน ขณะที่ OpenAI วัดความน่าเชื่อถือในการให้เหตุผลผ่านข้อมูลที่ซับซ้อนของโมเดล

การเปิดตัวทั้งสองนี้ก็เกิดขึ้นในช่วงที่โมเดลจากจีนกำลังได้รับความนิยมเพิ่มขึ้นในงานวิจัย AI เช่นกัน นอกจากนั้น ตัวเลขของ OpenAI เองก็ช่วยลดกระแสความตื่นเต้น เพราะโมเดลที่ดีที่สุดของบริษัทก็ยังสอบตกเกือบทุกข้อใน GeneBench-Pro อยู่ดี

แรงกดดันในประเด็นนี้จึงเป็นทั้งด้านภูมิรัฐศาสตร์และวิทยาศาสตร์ โดยข้อจำกัดการส่งออกของสหรัฐฯ ได้ทำให้ Anthropic ต้องพิจารณาประเทศเจ้าภาพใหม่สำหรับโมเดลของตนเองแล้ว

ผู้วิจารณ์ประเมินว่าแต่ละปัญหาของ GeneBench-Pro จะใช้เวลาผู้เชี่ยวชาญมนุษย์ราว 20 ถึง 40 ชั่วโมง และมีค่าจ้างหลายพัน USD แต่ OpenAI กล่าวว่าโมเดลของตนสามารถวิเคราะห์เสร็จได้ในราคาเพียงไม่กี่ USD

Aubrey de Grey ผู้เชี่ยวชาญชีวเวชศาสตร์มุมมองเรื่องอายุยืน เห็นว่า AI จะช่วยขจัดอุปสรรคสำคัญในงานวิจัย แม้ว่าในภาพกว้างความก้าวหน้าอาจจะยังต้องใช้เวลาอีกสักพัก

สิ่งที่เราจะได้เห็นในเวลาอันใกล้นี้ก็คือ AI จะทำให้บางขั้นตอนของกระบวนการ โดยเฉพาะการพัฒนายากลายเป็นคอขวดที่ไม่จำเป็นอีกต่อไป Aubrey de Grey ประธานและประธานเจ้าหน้าที่วิทยาศาสตร์ของมูลนิธิ Longevity Escape Velocity กล่าวในพอดแคสต์ของ BeInCrypto

De Grey ได้เตือนว่าการเปลี่ยนงานวิจัยที่เร็วขึ้นให้กลายเป็นการรักษาที่ได้รับการอนุมัติ ยังต้องขึ้นอยู่กับกฎระเบียบและความยอมรับความเสี่ยงของสังคมด้วย

นักวิจัยคาดว่าจะมีการนำไปใช้เร็วขึ้น

ผู้เชี่ยวชาญบางคนให้ความเห็นว่าการเปลี่ยนแปลงนี้ได้เริ่มต้นขึ้นแล้ว ดร. Derya Unutmaz ศาสตราจารย์ด้านภูมิคุ้มกันวิทยา ได้กล่าวในพาเนลเดียวกันของ BeInCrypto ว่า ตอนนี้ AI ทำงานได้ดีกว่าการตัดสินใจของตนเองเสียอีก

ดิฉันเชื่อใจ AI มากกว่าความคิดของตนเองในสายงานที่ทำมา 35 ปีนี้

เขาคาดว่าการพึ่งพา AI แบบนี้จะขยายไปสู่งานทางคลินิกอย่างรวดเร็วด้วย

มันผิดจริยธรรม และดิฉันเชื่อว่าอีกไม่นานการไม่ใช้ AI ในทางการแพทย์จะถูกมองว่าเป็นการละเลยหน้าที่

กระแสความเชื่อนั้นยังเร็วกว่าเกณฑ์ชี้วัดอยู่มาก เราต้องติดตามกันต่อในอีกไม่กี่เดือนข้างหน้า ว่านักวิทยาศาสตร์จะนำเครื่องมือเหล่านี้ไปใช้จริงหรือไม่ รวมถึงคะแนนของ GeneBench-Pro จะเริ่มสูงขึ้นหรือเปล่า


อ่านบทวิเคราะห์ตลาดคริปโตล่าสุดจาก BeInCrypto ได้ที่ คลิกที่นี่.

ข้อจำกัดความรับผิดชอบ

หมายเหตุบรรณาธิการ: เนื้อหาต่อไปนี้ไม่ได้สะท้อนถึงมุมมองหรือความคิดเห็นของ BeInCrypto มันจัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลเท่านั้นและไม่ควรถูกตีความว่าเป็นคำแนะนำทางการเงิน กรุณาทำการวิจัยของคุณเองก่อนที่จะทำการตัดสินใจลงทุนใดๆ และโปรดอ่าน ข้อกำหนดและเงื่อนไข, นโยบายความเป็นส่วนตัว และ ข้อจำกัดความรับผิดชอบ ของเรา

ผู้สนับสนุน
ผู้สนับสนุน