# 🧠 Depth Ceiling — งานวิจัยเผย LLM คิด plan ข้ามได้แค่ 5-7 steps
# 🧠 Depth Ceiling — งานวิจัยเผย LLM คิด plan ข้ามได้แค่ 5-7 steps
**Source:** arXiv CS.AI — https://arxiv.org/abs/2604.06427
**Score:** 40/50
---
🧠 งานวิจัยใหม่เผย ขอบเขตที่แท้จริงของ LLM planning
ทีมวิจัยพิสูจน์ด้วย graph path-finding task ว่า LLM มี ceiling ในการ plan ล่วงหน้าภายใน single forward pass
📊 ตัวเลขจริง:
— Tiny transformer: 3 steps
— GPT-4o: 5 steps
— GPT-5.4: 7 steps
— ยกเครื่องใหญ่ขึ้นไม่ช่วยทะลุ ceiling
🎯 สิ่งที่น่าสนใจที่สุด:
— มี dissociation ระหว่าง discover strategies ตอน train (5 step max) กับ execute ที่ test-time (8 step max)
— หมายความว่า LLM discover กลยุทธ์ไม่ได้ลึกเท่าที่ execute ได้
🛠 ทำอะไรได้ต่อ:
— ถ้าคุณสร้าง agent ที่ต้อง plan ลึก — อย่าพึ่ง single LLM pass
— ใช้ explicit multi-step chain of thought
— หรือ external planner + LLM as executor
— พิจารณา search-based planning (MCTS, A*) คู่กับ LLM evaluation
🧠 เรียนรู้อะไร:
Scale ไม่ใช่ทางออกทุกอย่าง — บางความสามารถ emerge ไม่ได้แม้จะใหญ่ขึ้น ต้องการ architectural change หรือ external tools
📄 arxiv.org/abs/2604.06427
#LLM #Agent #Planning #Research #PowerBoltAI
**Source:** arXiv CS.AI — https://arxiv.org/abs/2604.06427
**Score:** 40/50
---
🧠 งานวิจัยใหม่เผย ขอบเขตที่แท้จริงของ LLM planning
ทีมวิจัยพิสูจน์ด้วย graph path-finding task ว่า LLM มี ceiling ในการ plan ล่วงหน้าภายใน single forward pass
📊 ตัวเลขจริง:
— Tiny transformer: 3 steps
— GPT-4o: 5 steps
— GPT-5.4: 7 steps
— ยกเครื่องใหญ่ขึ้นไม่ช่วยทะลุ ceiling
🎯 สิ่งที่น่าสนใจที่สุด:
— มี dissociation ระหว่าง discover strategies ตอน train (5 step max) กับ execute ที่ test-time (8 step max)
— หมายความว่า LLM discover กลยุทธ์ไม่ได้ลึกเท่าที่ execute ได้
🛠 ทำอะไรได้ต่อ:
— ถ้าคุณสร้าง agent ที่ต้อง plan ลึก — อย่าพึ่ง single LLM pass
— ใช้ explicit multi-step chain of thought
— หรือ external planner + LLM as executor
— พิจารณา search-based planning (MCTS, A*) คู่กับ LLM evaluation
🧠 เรียนรู้อะไร:
Scale ไม่ใช่ทางออกทุกอย่าง — บางความสามารถ emerge ไม่ได้แม้จะใหญ่ขึ้น ต้องการ architectural change หรือ external tools
📄 arxiv.org/abs/2604.06427
#LLM #Agent #Planning #Research #PowerBoltAI