LLM的范式转移:RL带来新的 Scaling Law 从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其 产品经理 2024年09月09日