一线｜月之暗面发布推理模型，即将上线数学模型K0-math

在意大利足球顶级联赛第5轮的比赛中，维罗纳主场迎战都灵。上半场，萨纳夫里亚得球单刀推射得手，拉佐维奇角球传中助攻卡斯坦诺斯远射变线入网，达维多维奇肘击获红点套餐，萨纳夫里亚主罚中柱后补射打进被判无效，拉扎罗助攻萨帕塔甩头攻门得手；下半场，吉内蒂斯远射偏出，切-亚当斯单枪匹马贴地斩破门，马西纳后场失误被断后莫斯克拉接球推射破门。

腾讯新闻《一线》刘雨点

11月16日，大模型公司月之暗面（Moonshot AI）发布新产品，一款以深度推理为核心功能的数学模型K0-m h。该产品将于近日上线。

月之暗面创始人兼CEO杨植麟在现场介绍称，大模型发生了范式变化，过去是通过next token prediction，但预测下一个词有局限性，是一个静态的数据集，没办法探索更难的任务。接下来大模型的目标是通过reinforcement learning（强化学习）让AI具备思考的能力。“接下来还能持续scale，只是过程不一样。”他称。

杨植麟谈到，什么样的场景最适合让AI锻炼思考能力？他认为是数学场景，这也是前两个月OpenAI发布o1核心想要表达的要点。这样，模型可以自己成为一个体系，不需要和外界交互。同时，强化学习训练出来的模型对于每一步思考更细致，出现跳步比较少，可确保泛化能力。