预计2025
首页 > 财经

3月31日,华兴资本(1911.HK)公布截至2024年12月31日止全年业绩:2024年实现总收入和净投资收益8.4亿元,同比增长5.2%;归母净亏损1.8亿元,同比去年亏损收窄62.1%;2024年第四季度以来,该公司收入和经营利润较前三季度有较大幅度提升,第四季度总收入占全年收入的46%。 

同时,该公司表示已完成所有外部债务清偿,现金储备充裕,为未来业务的多元化发展战略提供了充足的资金保障。 

华兴资本的业务主要包括投资银行、投资管理和华兴证券三部分。投资银行业务方面,2024年全年收入与净投资收益2.2亿元,同比增长16.8%,其中私募融资顾问服务费的增长与股票承销业务的突破成为核心驱动力。华兴资本2024年内完成智谱AI、星动纪元、生数科技、傅利叶、星海图等项目的投资。二级市场股票销售交易业务相对较为稳定,对投行业务形成了一定支撑,贡献了投行收入的35%。 

2024年,该公司投资管理业务经营贡献了集团总收入的38%。华兴资本全面推进项目退出与投后管理,实现基金项目退出金额总计32亿元。随着项目的持续退出,基金投资回报比(DPI)进一步提升,截至目前,10支主基金中已经有5支基金,以及若干支项目基金的DPI超过100%。2023年和2024年,粉笔、慧智微、速腾聚创和汽车街等基金投资项目相继成功上市。 

此外,华兴证券2024全年总收入和净投资收益2.5亿元,占该公司总收入和净投资收益30%。2024年,华兴证券完成万辰生物定增、金凤凰新三板挂牌、加特兰和昆仑芯私募股权融资等项目。 

华兴资本董事长许彦清表示,2024年是华兴资本深度战略调整的首年,通过聚焦科技赋能、重组业务矩阵、重塑组织效能三大战略支点,在财务健康度、客户质量及创新储备等维度构建了可持续发展基础。当前,投资银行业务在创新经济赛道的领先优势、投资管理业务的盈利模式突破,以及华兴证券多元化业务矩阵的协同效应,已形成差异化竞争力。

 

2小时前

近期,金沙江创投管理合伙人朱啸虎在接受媒体采访时表示“正批量退出人形机器人公司”,让他再次走到风口浪尖。

3月31日下午,中关村论坛最后一天,朱啸虎在AI未来论坛上发表演讲,主持人向他抛出话题回应人形机器人泡沫的争议,但在该论坛上他一句也没提到人形机器人。

不到20分钟的发言时间,朱啸虎维持了他语速飞快的特色,密集输出内容。他用了较长时间介绍AI应用,强调这是目前让他兴奋的领域,也是他正在忙碌关注的赛道。

“过去6个月,在中美都能看到,有非常多做AI应用的创业公司收入正爆发增长。”朱啸虎说。具体表现是这些公司周收入环比增长10%以上,月收入环比增长20%以上。这些公司团队一般只有十几个人,能在6至12个月内做到千万美元的收入。朱啸虎认为,这种增长速度,非常类似当年“百团大战”的增长速度。

朱啸虎将这定义为AI应用到达了iPhone3时刻。

这些公司大多在做某个细分领域的AI应用,比如客服、销售、会议纪要、营销文案、语言教学等场景。

一些投资人认为,上述细分领域的AI应用没有壁垒,因此不愿意投资,朱啸虎觉得,这与移动互联网初期一些人不敢投资APP公司的状况很相似,“当年大家看不起滴滴,看不起饿了么,看不起小红书,在A轮的时候我们分给别人,都没人要”。

他不赞同AI应用公司要具备技术壁垒,认为技术壁垒都是骗人的,真正AI应用公司的壁垒在技术之外,能够做苦活累活,做大厂不愿意做的事。

朱啸虎举了几个他认为很不错的例子。一家文生图公司,AI技术主要来自开源模型,他们的核心能力是图片编辑能力,主要用户是专业设计师,月活达到500多万,而国内设计师规模约2000万。这家公司在收费很克制的前提下,其月收入增长非常快。

另一个例子是一位中国年轻人在美国创业的AI硬件公司,他们的产品非常简单,大小仅有电子名片一样,贴在手机后面,可以将电话会议转成会议纪要。去年,这家公司收入7000多万美元,现在月收入超过1000万美元,增长显著。目前这家公司准备在美国IPO。

朱啸虎认为,AI应用将诞生巨大的机会,创业者要在技术之外,要更懂商业,同时要全力出海。他给中国AI创业者的建议是,在国内打磨产品、打磨团队,然后马上出海。他发现,中国AI应用团队在日本、东南亚、中东等地是没有竞争对手的。目前全世界只有中国和美国的团队有AI落地能力,不少美国AI团队中中国人甚至占到一半。

3小时前

3月5日,安德鲁·巴托(Andrew Barto)和理查德·萨顿(Richard Sutton)因 在 强 化 学 习(Reinforcement Learning)领域的开创性贡献而获得了今年的图灵奖。在历经多年争议之后,强化学习终于重新获得了主流学界的认可。借此机会,就让我们花点时间来聊聊这个支撑GPT、DeepSeek等大模型成功的重要理论,回顾一下它的发展历程。

早年岁月

在展开讨论之前,我们需要对强化学习的基本概念做一个简要介绍。简而言之,强化学习是机器学习的一个重要分支,其核心思想是让智能体通过不断与环境交互,并根据所获得的回报来调整策略,从而实现学习。从本质上看,它与我们熟悉的监督学习(Supervised Learning)有显著区别。如果说监督学习是给小朋友一堆贴好标签的水果图片,教他们识别水果;那么强化学习则是给小朋友一张水果图片,让他们猜名字,答对了就给糖吃,通过这种激励机制训练他们识别水果。

在计算机与人工智能的发展历史中,强化学习的思想至少可以追溯到图灵(Alan Turing)。早在1950年,他就提出过一种基于奖惩机制的机器学习方法。而若将视野拓宽至更广阔的认知和心理学领域,强化学习显然也深受斯金纳(B.F. Skinner)的操作性条件反射理论和赫布(Donald Hebb)的学习机制影响。

(1)明斯基的物理神经网络

1951年,人工智能奠基人马文·明斯基在普林斯顿大学攻读博士期间,受到赫布“用进废退”的神经连接理论启发,亲自搭建了一个模拟神经元学习的物理装置——SNARC(随机神经模拟强化计算器)。它由300多个真空管和数百个电子元件构成,具备40多个神经元,可接收输入、处理信号并输出结果,模拟生物神经元的行为。神经元之间的连接强度可根据外部“奖励”信号动态调整,正向反馈增强连接,负向反馈则减弱。

明斯基利用SNARC解决了“老鼠走迷宫”问题,让系统通过反复试错学会在迷宫中找到出口。这是强化学习机制在硬件层面的早期实现,也是历史上最早的神经网络实例之一。讽刺的是,明斯基此后转向符号主义,认为逻辑推理比神经网络更具潜力,并在之后几十年间排斥后者,致使神经网络研究长期停滞。究其原因,或许是他对当时神经网络在技术上的性能上限有更清晰的认知。

(2)电脑上的自组织模型

随着计算机的发展,研究者开始尝试在虚拟环境中模拟神经网络。1954年,法利和克拉克在IBM 701商用计算机上构建了一个由128个神经元组成的网络,利用强化学习式的反馈机制进行训练。成功的响应增强连接权重,错误则减弱,实现了神经元连接的自我调整。这一尝试验证了在计算机上实现强化学习的可行性,是该领域技术演化中的关键一步。

尽管模型本身较为初级,但它开启了强化学习从物理装置向程序模型过渡的可能性。遗憾的是,法利与克拉克很快将研究重心转向监督学习,未在强化学习领域持续深耕,后续影响相对有限。

(3)萨缪尔的跳棋程序

与明斯基和法利偏向隐式神经连接调整的方式不同,IBM研究员阿瑟·萨缪尔开创性地提出了更显式的强化学习模型。他选用跳棋作为实验平台,设计了一个可评估棋局优劣的函数,输入包括棋子数量差、王棋数、可移动性等特征,并通过线性加权生成得分。AI可依此评估当前局势,并利用极大极小法进行策略决策。

萨缪尔开发了两种学习方式:其一是近似监督学习,借助回放棋局结果进行参数调整;其二是强化学习方法,根据当前状态与下一状态之间的评分差异来动态修正预测。这一设计极大提升了程序的自我改进能力。

1956年,该程序在电视上挑战康涅狄格州跳棋冠军罗伯特·尼利虽败犹荣,1962年再战成功击败对手,标志着AI系统首次在复杂任务中击败人类专家,也成为强化学习的标志性成果。萨缪尔还将“机器学习”(machine learning)一词带入公众视野,在AI普及上功不可没。

师徒俩的贡献

20世纪50至70年代,强化学习的实践虽频繁,但多停留在神经机制的模拟层面,缺乏系统性的理论探索。直到20世纪80年代,强化学习才迎来真正的理论奠基者——安德鲁·巴托(Andrew Barto) 与理查德·萨顿(Richard Sutton)这对师徒。

巴托原本在密歇根大学主修造船工程,后受阿比卜、麦克库洛赫等人“用计算机模拟大脑”思想吸引,转攻数学与计算机科学,并师从遗传算法创始人霍兰德完成博士学位。1975年毕业后,他前往MIT从事博士后研究,并获得教职,主讲《人工智能》课程中关于神经网络的部分。尽管课程内容偏重脑科学,令许多学生困惑,却深深吸引了当时正在攻读博士的萨顿。

萨顿1961年生于美国伊利诺伊州,本科在斯坦福大学主修心理学。其间,他受到哈里·克洛普夫“奖赏驱动学习”理论的启发,认为机器智能应来源于试错与激励机制。毕业后进入MIT深造,遇见了理念相投的巴托,两人一拍即合,决定携手推进强化学习的理论化进程。

在随后的合作中,萨顿负责提出创新构想,巴托则以扎实的数理功底将其形式化为可操作的数学模型。他们共同发表了大量开创性论文,提出了时序差分学习、演员—评论家模型等核心理论,奠定了强化学习作为一门独立学科的理论基石。

(1)时序差分学习

巴托和萨顿合作的第一个重要成果是著名的“时序差分学习”(Temporal Difference Learning,简称TD)理论。尽管这个名字听上去颇为“高大上”,其核心思想其实并不复杂。简单来说,TD的基本机制是:通过当前状态的价值估计与下一状态的价值估计之间的“差分”,来逐步更新对策略或预测值的估计。

我们可以用“登山”来类比解释TD理论的思路:

假设我们面对一座高山,有多条路径通向山顶。任务是找出一条耗时最少的路线。但我们既未爬过此山,也没有地图,那么如何做出判断呢?一种最朴素的方法是,沿着每一条路径分别走一遍,记录登顶所用时间。每尝试一条新路线,就与已有最佳耗时对比,如果更快就替换原先的选择。最终,就能找到最优路径。

这种方法体现了最直观的强化学习机制:根据执行策略后得到的“价值”反馈,调整策略以优化结果。选择哪条路径就是策略,而登顶所用时间即该策略的价值。

不过,在现实中,人们往往不会采用这种“跑完全程再比较”的方式,而是会边走边观察。走了一段时间,若发现进展缓慢,便会考虑返回或换路。这种“即时评估”方式,就是根据每一步所获得的“奖励”进行反馈调整。此处,每一小段距离的前进效果就相当于一个即时奖励。

但这依然不够精细。现实中经常有“前期艰难、后劲十足”的路径。若仅看局部表现,可能会错判整体价值。因此,更合理的方式是:在评估当前表现的同时,也要对未来走势进行预估——这正是TD算法的本质:用当前状态与下一状态的价值函数的“差分”来优化策略。

细心读者会注意到,实际上萨缪尔的跳棋程序中已经隐含使用了TD思想:它通过比较当前棋局与下一步棋局的局势评分,来调整策略。不过,萨缪尔更多是依靠直觉经验,缺乏对该机制的理论总结。而巴托与萨顿则系统性地将这一思路与数学中的“动态规划”方法相结合,明确提出了TD的数学框架。他们还借用统计学中的“自举法”(Bootstrapping),来在缺乏最终结果时,估算各个状态的价值函数,从而使TD成为一个可精确描述、可通用解答的学习模型。

在TD算法中,一个关键问题是:如何权衡短期与长期回报。为此,巴托和萨顿引入了参数λ(Lambda)来控制这种权衡:当λ为0时,算法只关注即时奖励;当λ为1时,则等同于累积所有回报的“全轨迹”方法。在实际应用中,λ值可根据任务需求灵活设定,从而平衡学习速度与精度。

值得一提的是,正因两位作者都深受脑科学影响,他们特别强调TD学习与动物大脑中的“奖赏预测误差”(Reward Prediction Error)机制之间的相似性。这个观点后来启发了关于多巴胺神经元如何编码预测误差的理论,并最终在神经科学实验中获得验证。这一成果也被视为人工智能理论反哺神经科学研究的经典案例之一。

(2)演员—评论家模型

巴托和萨顿的第二个重要贡献是“演员—评论家”(Actor-Critic)结构。顾名思义,这种结构将学习过程中涉及的策略变量与价值函数分别交由两个模块进行建模和训练。其中,“演员”模型负责策略的选择,即决定在特定状态下采取何种动作;而“评论家”模型则负责评估不同状态的价值函数,并为“演员”提供反馈。通过这种任务分工,训练过程可以变得更加稳定,效率也显著提高。

我们依然可以用“登山”来打个比方。在之前的例子中,登山者需要边走边选路,同时还要评估路径的优劣,这显然是个负担极重的任务。为了减轻负担,可以安排两人结伴登山:一个人专注于选路(即“演员”),另一个人则一路观察、记录、评价所走路线的表现(即“评论家”)。两人配合,就可以高效地完成原本一人承担的任务,从而更快更稳地找到最佳路径。

由于“演员—评论家”模型思路清晰、实现相对简便,自巴托和萨顿在20世纪80年代初提出这一结构以来,它迅速成为强化学习中最常用的训练架构之一。随着研究的深入,后来的学者在此基础上发展出了许多变体,以适应更复杂的任务场景。例如,OpenAI在训练ChatGPT时所使用的“近端策略优化”(Proximal Policy Optimization,简称PPO)算法,本质上就是一种“演员—评论家”结构的改进版本。

需要特别指出的是,除了提出一系列重要算法之外,巴托和萨顿对强化学习的另一个重大贡献,是合著了该领域最具影响力的教科书之一——《强化学习:导论》。这本书于1998年首次出版,即使在今天仍被全球众多研究者视为必须研读的“圣经”,其地位至今无人撼动。

神奇的Q学习算法

在巴托和萨顿奠定了强化学习的理论基础之后,越来越多的研究者加入这一领域,并为其发展贡献了诸多新的算法。在这些贡献中,最重要的里程碑之一,可能就是沃特金斯(ChristopherJ.C.H.Watkins)于1989年提出的Q学习(Q-Learning)算法。

从理论渊源上看,Q学习算法的核心思想来自动态规划中的经典工具——贝尔曼方程(Bellman Equation)。这一方程的基本思路是:在处理规划问题时,可以将总价值函数拆分为当前回报和未来价值两部分的加和。

为了更好地理解这个思想,我们仍然借用“行路”的比喻。设想一个人要从甲地前往乙地,他面前有多条路线可供选择。每条路上都有许多路口,每个路口又分出不同的岔道,需要逐一抉择。在不知全貌的情况下,要准确选出一条最短路径几乎是不可能的。但他可以采用“分步”策略:先选一条路走到下一个路口,然后再从这个路口考虑如何走到终点。如此反复,每一个路口的最短路径都可以通过“当前这一步”加上“后续最短路径”来递推得到。最终,从终点反向推导,就可以构建出从任意位置到终点的最短路径图。

当然,上述分析隐含了一个前提:行路人手中有地图,可以掌握所有路口和路径的信息。而在强化学习的问题中,情况显然并非如此——智能体一开始并不知道环境的全貌,也没有“地图”可以查阅。那么在没有地图的前提下,怎么“推”出最短路径呢?这,正是Q学习要解决的核心问题。

Q学习沿用了贝尔曼方程的分解思想:它将某个状态下采取某个动作的“质量”(Quality,即Q学习中“Q”的来源)拆解为两个部分:该动作当前可获得的奖励,以及未来可能获得的总价值。虽然未来的价值无法提前知道,但可以根据经验不断进行估计并动态更新。随着学习的深入,估计值逐步趋近真实值。这样,智能体便可以在每一步根据当前状态下不同动作的Q值进行选择,从而最终找到最优策略。

换言之,Q学习就是在“没有地图”的条件下,通过试错经验,一点一点“画”出这张地图。

我们可以把这个过程想象成行路人探索路径的过程:虽然起初没有地图,但他可以从一个路口出发,走一段路,记录这段路的长度和路况,然后根据经验评估从下一个路口到终点的距离。每走过一段路,他的判断就更准确一些。当他积累了足够多的经验后,就能大致判断出哪条路径最短。

沃特金斯提出Q学习之后,巴托与萨顿对这一算法给予高度评价。他们在合著的经典教科书中不仅对Q学习进行了系统讲解,还提供了大量应用实例。借助这两位重量级人物的影响力与推广,Q学习很快成为强化学习领域最广为人知的算法之一。特别是在解决马尔可夫决策过程(Markov Decision Process,简称MDP)问题时,Q学习已成为标准的求解方法。

近年来,互联网上还盛传OpenAI正在进行一个代号为“Q-Star”的神秘项目,目标是打造超越人类的自主智能系统。尽管OpenAI高层如山姆·奥特曼(Sam Altman)始终对这一项目的细节守口如瓶,但据传其核心思想正是基于Q学习算法来强化AI的决策能力。虽然这一传言尚无确凿证据,但从技术角度来看,利用Q学习来训练AI在不确定环境中的决策能力,的确是一个合理且成熟的方向。

当深度学习遇上强化学习

在强化学习发展的早期,该领域的研究者在建模时主要采用表格方法(Tabular Methods)和线性函数逼近(Linear Function Approximation)。除了个别案例(如杰拉尔德·特索罗开发的西洋双跳棋程序)之外,多数研究者通常会选择线性模型,或仅使用单层神经网络来表示策略函数和价值函数,并以此进行学习。这种模型上的简化,在很大程度上限制了强化学习性能的提升。

需要指出的是,研究者之所以采用这样的简化策略,并非出于智识上的局限,而是当时技术条件的现实制约。在很早以前,人们其实就已经认识到:在相同参数规模下,多层神经网络往往比单层神经网络拥有更强的表达能力。巴托和萨顿也在其经典教科书中明确讨论过多层网络在建模上的优势。但在当时的算力条件下,要训练一个深层网络几乎是天方夜谭。正因为如此,研究者才不得不退而求其次,采用更为“轻量级”的建模手段。

进入21世纪以后,计算机软硬件技术突飞猛进,尤其是GPU的广泛应用,大幅降低了多层神经网络的训练成本。从2006年起,辛顿(Geoffrey Hinton)及其学生发表了一系列深度网络训练的关键论文。2012年,他们更是在“ImageNet大规模视觉识别竞赛”(ILSVRC)上以压倒性优势夺冠,首次向业界展示了“深度学习”的真正威力。从此,深度学习革命全面开启,多层神经网络也迅速成为机器学习的主流建模方法。

深度学习的浪潮很快也席卷到了强化学习领域。2013年,DeepMind的弗拉基米尔·姆尼赫(Volodymyr Mnih)等人首次将卷积神经网络(CNN)与Q学习相结合,用CNN来逼近Q函数,这一结合产出了著名的深度Q网络(DeepQ-Network,简称 DQN)。实验结果表明,CNN作为Q函数的逼近器,显著提高了模型在高维状态空间中的泛化与表达能力,大幅提升了强化学习的性能。

为了验证DQN的能力,研究者让它代替人类去玩雅达利(Atari)公司的经典游戏。他们一共选用了49款游戏作为测试场景,每个游戏中,AI都直接将像素图像作为输入,游戏得分作为反馈信号,通过DQN进行学习。结果显示,在多数游戏中,DQN的表现达到了甚至超越了人类水平。例如,在《打砖块》中,AI可以精准地掌控击球方向,而在《乒乓球》中,它会自学出极具策略性的回球方式。

DQN展现了深度学习与强化学习结合的强大力量,自此“深度强化学习”迅速成为AI领域的显学。大量研究者蜂拥而入,先后提出了DDPG、A3C、PPO等一系列重要的算法框架,理论成果如雨后春笋般涌现。

不过,真正让大众见识到深度强化学习“力量”的,是一场划时代的围棋大战。2016年,Google Deep Mind主办了一场特别的人机对弈赛——人类代表是以“神之一手”著称的世界冠军李世石,而AI代表则是他们开发的围棋程序AlphaGo。

在此之前,AI战胜人类顶尖棋手并非首例——跳棋冠军罗伯特·尼利、国际象棋冠军卡斯帕罗夫(GarryKas parov)都曾在AI面前败下阵来。但围棋的策略空间远远超过象棋与跳棋,其复杂度甚至超出了人类可计算的范畴。围棋中无法简单套用规则或博弈论模型来保底获胜,因此,AlphaGo若能胜出,将标志着AI在真正意义上掌握了高水平智能策略。

原本外界普遍预期这场比赛将十分胶着,但出乎所有人意料,AlphaGo以压倒性优势取得胜利。在五局比赛中,它赢下四局,李世石仅在第四局扳回一城。结果一出,震惊全球。

AlphaGo的成功秘诀何在?从模型结构来看,它采用了深度神经网络来逼近策略函数和价值函数。在训练流程上,它首先通过监督学习学习了大量人类棋谱,从中掌握了经典套路和落子思维;接着,它通过与自身对弈的方式(即“自我博弈”),进行大规模的强化学习训练。在这种“左右互搏”过程中,它不断修正策略,最终棋艺超越人类顶尖高手。

尽管AlphaGo战胜了李世石,但仍有不少人不以为然。一些评论认为它只是记住了更多的棋谱和战术,归根结底不过是“人类经验的堆叠”,并未体现AI的真正智能。

然而,这种观点很快就被现实“打脸”。不久之后,DeepMind发布了新一代的围棋AI程序——AlphaZero。与AlphaGo不同,AlphaZero完全没有接触过人类棋谱,它的全部训练过程仅基于围棋的基本规则,然后通过纯粹的自我对弈进行强化学习。最初,它的落子几乎是随机的,但随着学习的深入,其棋艺迅猛增长,并最终以压倒性优势击败了AlphaGo。

更令人惊叹的是,AlphaZero的强化学习思路极具通用性。与AlphaGo只能用于围棋不同,AlphaZero可以快速适应多种规则系统。很快,DeepMind就将这套思路迁移到了生命科学领域,开发出用于蛋白质结构预测AlphaFold,又打造出了专门玩《星际争霸》的AlphaStar。

尾声

需要指出的是,强化学习并没有因为AlphaZero的成功而一举登上巅峰。恰恰相反,不久之后,它的声誉反而迅速跌入了谷底。这一转变的原因,并不在于强化学习本身能力的不足,而在于随着算力和数据资源的持续丰富,监督学习的优势被进一步释放。尤其是大语言模型的崛起,以及所谓的“规模定律”(Scaling Law)的发现,让“不断放大模型规模”几乎成为了提升AI性能的公认捷径。

在这样的背景下,强化学习虽仍具有独特价值,却在“规模定律”的光芒下显得黯然失色。一时间,很多资深的人工智能学者都对它的前景表示不看好。例如,“深度学习之父”辛顿(Geoffrey Hinton)就曾半开玩笑地说:“我们应该把强化学习排除在机器学习之外。作为机器学习的第三种范式(前两种是监督学习和无监督学习),它似乎并不太有效。”

面对这些质疑,强化学习的奠基人之一萨顿并未退缩。他与AlphaGo系列的主要负责人大卫·希尔弗(David Silver)一起发表了一篇论文,题为《Reward is Enough》(“有奖励就足够了”)。显然,这个标题本身就已经传达了一种坚定的立场和信念。

事实证明,萨顿对强化学习的信心并非毫无依据。只不过,就连他自己大概也未曾预料到,拯救强化学习声誉的,竟然会是一股来自东方的力量。

2025年1月,DeepSeek发布了 R1版本。这款模型一经面世,便凭借与国际顶尖大模型比肩的能力赢得了全球用户的青睐。更令业界震惊的是,它的训练与运行成本远低于同类模型,性价比之高被许多观察者称为“不可思议”。

DeepSeek究竟是如何做到这一点的?一个重要原因就在于:它在训练过程中大量应用了强化学习。它不仅在长链思维任务中完全摒弃了传统的有监督微调方式,转而全面采用强化学习方法,还创新性地提出了“群体相对策略优化”(Group Relative Policy Optimization,简称 GRPO)算法,以取代主流的PPO(Proximal Policy Optimization)方法。这一系列策略上的突破,不仅让DeepSeek成为中国AI能力的集大成者,也向世界再一次展示了强化学习的强大生命力。

值得一提的是,DeepSeek成功之后,关于其训练过程也衍生出了不少传说。其中一个流行的说法是:之所以他们能放弃成熟的PPO而自创GRPO,是因为团队中一位关键成员此前并未系统学习过强化学习,而是在摸索中不断试错,最后“误打误撞”地发明了这一新算法。这个故事真假难辨,但若其属实,倒也颇具象征意义——一个没有参考经验、完全依赖探索与反馈进行学习和优化的过程,本身就是对强化学习精神的完美诠释。


3小时前

3月31日,在创新药企康方生物(09926.HK)的业绩交流会上,其创始人兼董事长夏瑜表示,2款双抗产品在2025年1月1日执行医保价格后,今年在销售上的放量是水到渠成的事情。目前,其商业化团队在核心医院已经完成80%的准入覆盖,希望到2025年底实现2000家以上医院的覆盖。

3月30日,康方生物发布了2024年全年业绩,在产品商业化方面,其药品销售收入超20亿元,同比增长约25%。

跟其他创新药企相比,康方生物的成色比较清晰:专注在双抗领域,且已经有2款自主研发的全球首创双抗获批上市——2022年6月,第一款双抗卡度尼利单抗获批上市;2024年5月,另一款双抗依沃西单抗获批上市。后者是在一项III期临床试验中打败了默沙东全球“药王”K药的明星产品。

根据2024年半年报,卡度尼利单抗上半年的销售为7.1亿元,同比增长16.5%;5月底获批上市的双抗依沃西单抗6月2日开出首张处方,接近1个月的时间卖了1.03亿元。

但在这次年报中,康方生物没有公布具体产品的收入情况。

经济观察报了解到,康方生物在2024年中主动下调了卡度尼利单抗的价格,下调幅度超过50%。而依沃西单抗进医保前的价格为年治疗费用50万元左右,对于自费市场来说,年费并不低。

夏瑜在业绩交流会上回应,卡度尼利单抗和依沃西单抗今年在除西藏外各省的挂网工作顺利完成,也进入了各省的双通道目录,目前已经开展了1000家医院的准入合作,“在刚纳入医保的第一个季度,做到这个程度,对接下来的放量打下了基础。我们也希望在2025年底,能实现2000家以上医院的覆盖”。

夏瑜还表示,这两款产品除了医保准入,还有一个重要的工作是临床循证证据的夯实,卡度尼利单抗2025年预计能获批一线宫颈癌适应证;依沃西单抗今年也有望获批一线非小细胞肺癌的适应证,一旦获批,这款产品在肺癌适应证上的放量是巨大的。

时间进行到2025年,衡量一家创新药企的价值大小最重要的有两个指标,一是出海能力,二是创新药的销售或者说商业化能力。

康方生物此前凭借依沃西单抗的临床数据和BD(商务拓展)合作已经证明了自己的出海能力,20亿元年销售额不算特别出彩,但放到行业内一众创新药企来看,并不拉垮。年报公布后,3月31日收盘,康方生物收涨2.14%,也侧面印证其业绩“不出意外”。

不过,作为明星创新药企,市场还期待康方生物有更多惊喜,特别是打败全球“药王”的依沃西单抗,期望其能在海外取得不错的销售表现。

高盛此前曾做出预测,随着适应证的不断扩大,依沃西单抗未来的全球销售峰值有望达到530亿美元。

夏瑜表示,将在2025年中发布治疗非小细胞肺癌的首个国际多中心III期临床的临床顶线数据,如果取得阳性结果,Summit将向美国食品药品监督管理局提交上市申请。

2月,有且仅有依沃西单抗一个产品的Summit与美国辉瑞公司达成临床试验合作,共同推进依沃西单抗与辉瑞多款抗体偶联药物(ADCs)在多种实体瘤中的联合治疗应用。该系列临床试验将由辉瑞将全面负责主导开展,双方共同监督临床研究的进行,各自保留其产品的相关权利。目前依沃西在单抗全球开展临床试验药物均由康方生物生产供应。

从Summit与辉瑞的合作来看,依沃西单抗在海外的治疗潜力在进一步放大。

夏瑜称,整体上2款产品正在针对多个适应证与国际标准疗法开展对比性III期临床试验,通过挑战全球最优标准治疗,推动肿瘤免疫疗法的迭代。

 

5小时前

 3月31日,毕马威中国在2025中关村论坛年会上发布《中关村国际前沿科技大赛前沿趋势报告》(以下简称“报告”)。报告分析了人工智能、具身智能、集成电路、生物医药、医疗器械、智能制造、新材料、新能源、商业航天和低空经济领域十大领域的发展现状及核心趋势。

报告指出,以上十大领域构成了科技力量矩阵,其中人工智能作为新质生产力“大脑”大模型能力边界有望持续扩展,但面临芯片协同不足挑战;中国具身智能专利数量全球领先,需要通过“生态协同+技术攻关+场景落地”模式助力产业跨越式发展;集成电路国产化率虽低,但车载芯片需求激增带来机遇;生物医药存在同质化竞争,License-out(授权出海)和Newco(联合出海)模式成突围关键;中国医疗器械市场规模稳居全球第二,产品形态不断丰富,但前沿企业在高端市场缺乏核心竞争力,亟待提升;智能制造智能装备市场规模年增11.5%,数智与场景创新双轮驱动,正赋能智造新生态;新材料产值突破7.9万亿元,呈现高能效迭代,低成本、智能化与多功能集成齐头并进趋势;新能源氢储能突破成本限制,技术创新使得能源生态重构;中国商业航天市场规模增速达33.25%,面临低成本与可靠性之间的平衡的挑战;低空经济规模突破5000亿元,“低空+物流”与反制技术成安全发展关键。

报告建议,增加科技经费的投入,建立未来产业的增长机制,深化企业主导的产学研合作,特别是在量子科技、具身智能和生物制造等前沿领域,攻克关键技术难题;此外,报告还建议通过政策引导,促进科技成果转化,加速前沿科技在工业制造、医疗和交通等领域的应用,以改善民生并推动产业升级。

报告认为,对于中国而言,加速布局十大领域是实现从“跟跑”到“并跑”甚至“领跑”的重要路径。毕马威中国通信、媒体及科技行业审计主管合伙人卢鹍鹏表示,发展战略性新兴产业和未来产业是各国实现经济转型升级、构建自主可控产业链的重要抓手。

卢鹍鹏进一步表示,针对技术瓶颈、应用场景碎片化及生态构建等挑战,中国要构建“政产学研金服用”七位一体的创新共同体,强化顶层设计,完善创新基础设施建设;科研机构需深化体制机制改革,释放原始创新活力;企业应勇担创新主体责任,加强关键核心技术攻关;金融机构需利用创新资本工具,为长周期研发带来“耐心资本”,共同助力中关村成为全球科技创新的“燎原之地”。

报告对50余家科技企业及20余位专家进行了调研,系统梳理技术突破与产业落地的核心逻辑,北京正以年均16%的研发投入增速领跑全国,人工智能核心产业规模突破3000亿元。

毕马威中国客户及业务发展主管合伙人江立勤表示,科技创新竞速正成为国际竞争格局重塑的关键力量,中国新兴产业和未来产业不断呈现新亮点,由此产生的技术变革与产业重构相互交织,形成了新的国际竞争格局,发展战略性新兴产业和未来产业已经成为各国实现经济转型升级、构建自主可控产业链的重要抓手。

6小时前
APP下载
7小时前

经济观察网讯 据商务部网站消息,2025年3月31日上午,瑙鲁驻华使馆在北京举行开馆仪式。外交部副部长马朝旭与专程来华的瑙鲁外长安格明共同出席并发表致辞。瑙鲁驻华大使杰里迈亚主持开馆仪式,太平洋岛国驻华使节、工商界人士、留学生等百余人出席。

马朝旭代表中方向瑙方表示热烈祝贺。马表示,去年1月,安格明外长来北京同王毅外长签署两国复交公报。3月,阿迪昂总统对中国进行了成功的国事访问,两国元首达成重要共识,为两国发展指明了方向。中瑙复交一年多来,双方各领域交流合作稳步推进,两国人民之间交流日益密切。实践证明,中国是瑙鲁人民信赖的伙伴和兄弟,同中国复交是瑙鲁作出的正确政治决定,一个中国原则是公认的国际关系准则,是国际大义、大势所趋、人心所向。瑙鲁驻华使馆正式开馆,建立起连接两国的又一座桥梁,打开了两国人民相互了解的新窗口,构建起两国互利共赢合作的新纽带。瑙鲁有一句谚语:每天积攒一滴水,经年累月汇聚成大海。中方愿同瑙方共同努力,以钉钉子的精神扎实推动两国合作,将合作成果汇聚成中瑙友谊的汪洋大海,造福两国人民。

安格明表示,瑙中关系复交一年来取得显著成效,衷心感谢中方为瑙鲁经济社会发展提供的宝贵帮助。瑙方高度重视发展对华关系,坚定奉行一个中国原则,期待同中方一道,在“一带一路”倡议框架下拓展务实合作,构建人类命运共同体。

7小时前
微信矩阵

一个活力的社会,一定是一个流动的社会。而流动社会的一个显著特征是生产要素能够通过市场在中国大地上自由运行,包括劳动力、土地、资本、技术、知识、管理、数据等生产要素。没有要素的有序流动,就没有活力中国,就不会有中国经济持续健康的发展。

由广东经济出版社2024年12月出版,中国宏观经济研究院教授常修泽主笔、清华大学教授蔡继明副主笔的54万字的《中国要素市场化配置大纲》,是一本全面研究要素市场化改革的原创专著。要素市场化改革的发展历程与中国改革开放历史进程高度契合,要素市场中诸要素能否有序流动,直接关乎中国现在和未来的发展景象。

本书以形象比喻提出市场体系大厦三要件:市场主体是“根基”,要素市场是“钢筋”,三大机制(供需机制、竞争机制、价格机制)是“水泥”。市场体系里固然有商品市场,但最硬核的是要素市场,这是中国市场体系的支撑。

一、总体评价

全书共三篇13章,系统探讨了要素市场化改革的理论基础、现实意义和总体方略。书中分别论述了劳动力、土地、资本、知识、技术、管理和数据七大要素市场化配置的源流、现状、改革成效和面临的挑战,分析未来趋势,并对要素市场化配置的具体路径和配套措施提出见解,力求讲清楚要素市场化改革是什么、为什么、怎么做。

此书是一座含金量丰富的金矿,全书关键词是“改革”,改革渗透在全书的各章内容中。此书内容几乎汇聚了中国40多年市场化改革的方方面面。既是对中国市场化改革攻坚克难历史过程的回顾,也是对当下中国经济体制改革难点集萃,包括当下中国市场经济发展亟需破解的一系列难题的总结,也对中国市场化发展未来面临的挑战作了细致分析。

其中包括:由于要素市场化改革长期滞后,土地、劳动力、知识、技术、资本、管理等要素市场发育缓慢,数据等新生产要素改革明显滞后。要素市场化“短板”,已经成为建设高标准市场体系必须突破的难点。

本书围绕要素市场化改革,呈现三个特征:一是理论创新性强,二是结构系统完整,三是丰富的实践案例与理论的完美结合。

二、对市场要素内涵的认识

此书内容丰富,有诸多原创性成果。给人印象深刻的是对市场要素内涵的认识:

1、要素的形成

本书分析了要素形成过程,实际是市场经济体制不断深化的过程。在马克思以前的很长时间里,人类对要素市场内涵的认识只有劳动和土地。威廉·配第的名言“劳动是财富之父,土地是财富之母。”这是那一时期对要素市场的认识。19世纪的马克思把资本作为第三个要素,他写的《资本论》实际是论“资本”。随着科技革命的发展,科技的重要性愈加显现。20世纪末期,即1997年党的十五大报告把技术作为生产要素的重要内容。此后,技术要素又被分解为知识和技术两个要素。21世纪初期,2002年党的十六大把“管理”作为新的生产要素。21世纪的第二个十年,即2017年12月中央政治局集中学习,第一次提出“数据是新的生产要素”。由此形成劳动、土地、资本、知识、技术、管理、数据“七个要素”。

随着对要素内涵认识的深化,对生产要素的理解也更加丰富。例如,对土地生产要素的理解,土地要素不只是地面或地表,还包括地下矿产资源,地上的森林、草原、江河湖泊以及海洋等自然资源。

2、要素中性和要素分类

七大生产要素姓什么,本书给出的答案是姓“中”。本书对“资本中性论”作了较为深入分析。资本跟商品经济一样,是一个“中性”的经济范畴。本书详尽分析了按生产要素贡献分配,包括劳动力、资本、管理等诸要素在生产过程中的作用。对资本运行规律的把握,重要的是提高对资本运行规律的认识,提高资本治理效能,规范和引导资本健康发展,正本清源、搞活资本。

按此书分类,七个生产要素中,土地、资本是“物本要素”,劳动、知识、技术、管理是“人本要素”,数据既有“物本”成分,也有“人本”成分。属于“物本与人本混合型要素”。

要促进人的发展,必须充分尊重劳动者权益;允许科技人员在科技成果转化收益分配上有更大自主权,建立职务科技成果资产单列管理制度,深化职务科技成果赋权改革;管理者是市场经济的重要力量,需要填补“管理市场”的空白,以实际行动“弘扬企业家精神”。

只有使要素市场化,人本要素才能够得到充分实现。

三、“要素三放论”与“产权市场”

从生产要素的产生、发展到消亡,产权制度都相伴相随。此书对改革开放的历程做了回顾,从最初的劳动力市场建设、资本市场建设以及资本市场的新形式——产权市场建设。每一步发展,都经历了改革攻坚克难的过程。

本书给出的原创性结论:产权是生产要素的生命,“命”在产权这里。具体说,劳权是劳动力要素的生命,地权是土地要素的生命,资权是资本要素的生命,知权、技权是知识技术要素的生命,管权是管理要素的生命,数权是数据要素的生命。

产权和要素的关系是相伴相随,形神兼备的。有产权的不都是要素,但凡是要素都有自己的产权。要素市场化配置实则是“产权配置”,要素价值实则是“产权价值”。

本书提出“要素三放论”:人本要素要“放手”,物本要素要“放活”,数据要素要“放量”。每一个要素之“放”,都是产权市场的发展机会。

改革开放以来,中国的产权市场从无到有,从小到大,从零散到全面,现在已经成为中国资本市场体系中的一个重要组成部分

本书分析的要素市场化过程,实际也是中国市场化改革攻坚克难的过程。

四、未来改革方向

中国要素市场化程度目前还比较低。现在经济发展中遇到了一些体制性、结构性的矛盾,相当一部分内容与要素市场化程度不高密切相关。本书提出创建六大要素市场,有很大的现实意义。

一是劳动力市场建设。在生产要素中,劳动力要素最具创造性和能动性,在各要素的优化配置中具有重要地位。建设的重点是推进户籍制度改革,试行以经常居住地登记的户口制度。此外,还包括推进农民的技能技术评价问题,探索建立新型的农民专业技术职称评定制度等。

二是土地市场。这包括农村集体建设用地,农地和宅基地。以农地为例,就是搞“三权分置,土地流转”,即土地所有权是集体的,承包权是农户的,承包权的经营权是可以流转的。“三块地”市场的“放活”和改革的推进,将获得新的增长点,并促进产权市场的发展。

三是知识技术市场的建设,重要的是个人的科研成果也可评估作价,甚至交易。

四是资本市场建设,包括股票、债券、基金、信托等。而产权市场是“资本市场的新形式”,需要加大产权市场建设。

五是数据要素市场。数据要素市场涉及国家安全和公民隐私。本书提出“双轨运作”:公共数据一条轨,商业数据一条轨。公共数据的主体部分对外免费开放,准确透明,以满足老百姓日益增长的“知情权”需要;不排除有部分公共数据作为生产要素进入市场;“海量”的商业数据,应在产权界定清晰的基础上,按市场经济规律“放量”运行。

六是管理要素市场或称“企业家市场”。例如,管理要素市场,企业可以到市场招聘总经理,职业经理人等。

中国要进一步深化经济改革,深化的趋势就是要走向要素市场化。

此书如果说还有不足,那就是由于作者多(14位作者),各章的风格不尽一致;一些章节内容还可以再精练一些,一些内容还可以再作更深入研讨。

(作者系北京改革和发展研究会创始会长,中国经济体制改革研究会特约研究员。)


8小时前

3月31日,智谱在中关村论坛上发布其最新智能体(Agent)产品AutoGLM沉思。这款产品结合了深度研究能力和操作能力,强调边想边干,即一边思考一边帮助用户完成复杂问题。

智谱CEO张鹏在发布会上表示,大模型的预训练和后训练存在Scaling Law(规模定律)。智谱发现,Agent也存在类似的Scaling Law。通过扩展训练时的inference compute(推理计算),智谱观察到Agent展现出了更强的性能。

Scaling Law是描述模型性能如何随着模型规模(如参数数量)、训练数据集大小以及用于训练的计算资源增加而提升的一组经验法则,被业界认为是大模型预训练第一性原理。

张鹏说,在Agent Scaling Law的基础上,智谱进一步发现了Agent也存在能力涌现。例如,尽管智谱在训练过程中从未教给AutoGLM沉思访问巨潮资讯网,但当发送指令“帮我收集昨天关于具身智能的相关研报”时,AutoGLM沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。

张鹏在现场还演示了AutoGLM沉思更多的能力,它可以像人类一样打开并浏览网页,完成数据检索、分析,并生成万字报告。此外,当用户要求AutoGLM沉思赚钱时,它可以自主选择通过写稿挣钱,并完成从上网搜索征稿启事、根据要求构思写稿、通过邮件向平台投稿获取稿费等一系列操作。

张鹏称,AutoGLM沉思的能力实现依赖于三个关键技术:一是深度思考,能够模拟人类在面对复杂问题时的推理与决策过程;二是感知世界,能够像人一样获取并理解环境信息;三是工具使用,能够像人一样调用和操作工具,完成复杂任务。

同时,与一般的推理模型不同,AutoGLM沉思的思维链更长,会一直不断地思考、反思、纠错,再加上调用工具,以至于完成一项任务的时长有时长达10分钟以上。

据张鹏介绍,AutoGLM沉思背后是智谱GLM全栈自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中前者不仅性能比肩DeepSeek-R1,在速度提升最高8倍的同时,价格还仅需DeepSeek-R1的1/30。智谱将于4月14日开源基座模型GLM-4-AIR、推理模型GLM-Z1-Air、沉思模型GLM-Z1-rumination。


8小时前

经济观察网讯 据市场监管总局网站3月31日消息,4月1日起,互联网平台及产品服务个人信息处理、智能门锁网络安全、能源互联网系统、电动汽车交流充电桩、人造板及其制品、文物出境审核规范等一批重要国家标准开始实施,将为规范新兴产业健康发展、引领传统产业优化升级、加强文化遗产保护和交流提供标准支撑。

互联网平台及产品服务个人信息处理规则国家标准

《数据安全技术 互联网平台及产品服务个人信息处理规则》(GB/T 44588—2024)推荐性国家标准,规定了互联网平台及产品服务个人信息处理规则的基本要求、编制程序、规则内容、发布形式以及争议纠纷的解决处理等要求。标准的实施将有助于保护互联网用户个人信息,规范涉及个人信息的技术产品、咨询服务业健康有序发展。

智能门锁网络安全技术规范国家标准

《网络安全技术 智能门锁网络安全技术规范》(GB/T 44602—2024)推荐性国家标准,规定了智能门锁网络安全技术要求、安全等级划分和测评方法。标准的实施将为智能门锁有效抵御远程网络攻击,保护用户个人信息,守护百姓家庭安全提供技术支撑。

能源互联网系统系列标准

《能源互联网系统 架构和要求》(GB/T 44636—2024)、《能源互联网系统 智能电网与热、气、水、交通系统的交互》(GB/T 44637—2024)、《能源互联网与电动汽车互动规范》(GB/T 44638—2024)3项推荐性国家标准,规定了能源互联网系统参考架构、能源转换和信息交互、多类能源协同互动等技术要求。标准的实施将推动能源互联网系统多领域技术协同,引领构建现代能源体系,支撑能源互联网产业健康发展。

电动汽车交流充电桩、非车载充电机电能计量国家标准

《电动汽车交流充电桩电能计量》(GB/T 28569—2024)、《电动汽车非车载充电机电能计量》(GB/T 29318—2024)推荐性国家标准,规定了电动汽车充电设备电能计量的技术要求、试验方法和检验规则。标准的实施有助于维护充电过程中电能计量的公正性,提升充电服务质量,助力电动汽车产业健康发展。

电动汽车用动力蓄电池电性能要求及试验方法

《电动汽车用动力蓄电池电性能要求及试验方法》(GB/T 31486—2024)推荐性国家标准,规定了电动汽车用动力蓄电池单体的电性能要求和对应的试验方法。标准的实施有助于提升动力电池产品性能水平,为电动汽车安全提供技术保障。

人造板及其制品气味、挥发性有机化合物国家标准

《人造板及其制品气味分级及评价方法》(GB/T 44689—2024)、《人造板及其制品挥发性有机化合物释放量分级》(GB/T 44690—2024)推荐性国家标准,规定了人造板及其制品气味分级评价方法以及挥发性有机化合物释放量分级要求、试验方法和判定规则。标准的实施有利于提升人造板及其制品质量和环保水平,对促进人造板产业高质量发展具有积极作用。

文物出境审核规范系列标准

《文物出境审核规范 第18部分:少数民族服饰》(GB/T 33290.18—2024)、《文物出境审核规范 第19部分:少数民族建筑物实物资料》(GB/T 33290.19—2024)、《文物出境审核规范 第20部分:少数民族宗教祭祀和礼仪活动用品》(GB/T 33290.20—2024)、《文物出境审核规范 第21部分:少数民族名人遗物》(GB/T 33290.21—2024)、《文物出境审核规范 第22部分:玉石器》(GB/T 33290.22—2024)、《文物出境审核规范 第23部分:玻璃器》(GB/T 33290.23—2024)、《文物出境审核规范 第24部分:珐琅器》(GB/T 33290.24—2024)、《文物出境审核规范 第25部分:中国画及书法》(GB/T 33290.25—2024)、《文物出境审核规范 第26部分:壁画》(GB/T 33290.26—2024)、《文物出境审核规范 第27部分:油画、水彩画、水粉画》(GB/T 33290.27—2024)、《文物出境审核规范 第28部分:佩饰》(GB/T 33290.28—2024)、《文物出境审核规范 第29部分:车具马具》(GB/T 33290.29—2024)、《文物出境审核规范 第30部分:车船舆轿》(GB/T 33290.30—2024)、《文物出境审核规范 第31部分:首饰》(GB/T 33290.31—2024)14项推荐性国家标准,分别对14类文物的出境审核程序、类别判定、年代判定、价值评定以及审核结论形成等提出了技术要求。标准的实施将规范全国各文物进出境审核机构审核工作,防止我国珍贵文物流失,有力支撑我国文化遗产保护和交流工作。

编辑:刘睿

9小时前

经济观察网讯 据市场监管总局网站3月31日消息,近日,市场监管总局第101号令发布《国家市场监督管理总局关于废止和修改部分部门规章的决定》(以下简称《决定》),废止规章1部,修改规章16部。《决定》自2025年5月1日起施行,修改内容强化了涉企检查有关要求,明确了相关许可审批权限,对部分罚款事项进行了调整。主要内容如下。

一是修订《企业公示信息抽查暂行办法》,明确“各级市场监督管理部门应当加强检查统筹,有效避免随意检查、多头检查、重复检查”。二是修订《中华人民共和国工业产品生产许可证管理条例实施办法》,明确省级市场监督管理部门负责的工业产品生产许可相关审批权限不得下放。省级市场监督管理部门可以根据工作需要,将工业产品生产许可委托下一级市场监督管理部门实施。三是修订《检验检测机构监督管理办法》,加大对不实、虚假检验检测报告处罚力度,对出具不实检验检测报告的检验检测机构由“处三万元罚款”修改为“处五万元以下罚款”,对出具虚假检验检测报告的检验检测机构由“处三万元罚款”修改为“处十万元以下罚款”。此外,《决定》还根据《中华人民共和国行政复议法》《法规规章备案审查条例》等新修改的法律法规、国务院关于罚款事项清理的部署要求对部分规章内容作出修改。

编辑:刘睿

9小时前

关于俄乌和平进程,笔者认为,现在主要有4条线在交互推进。

第一条线,由美国居间协调的俄乌谈判。

这是一条主线。

美国在与乌克兰、俄罗斯分别单独接触商谈之后,于3月23日、24日、25日连续三天,在沙特首都利雅得居间协调俄乌谈判。虽然这一次,俄、乌双方没有直接见面,谈判结束后既没有三方联合声明也没有双方联合声明,但从事后美、俄、乌各自发表的声明看,三方是有共识的。

现在的情况是,美国、俄罗斯、乌克兰手里都是既有筹码又有诉求:美国的筹码是其军事实力,诉求是觊觎乌克兰的矿产;俄罗斯的筹码是其战场优势,诉求是期望通过美国解除经济制裁;乌克兰的筹码是其矿产资源和欧盟的坚定支持,诉求是收复失土。

上述筹码和诉求互相交织,需要慢慢拆解,也需要其他方面的推进来协助化解。

第二条线,美乌矿产协议。

矿产协议,看似应该是第一个达成的协议。如果没有2月28日的白宫争吵,也许当天这个协议就签署成功了。

但现在看来,事情没有那么简单。

2月28日白宫争吵背后折射出的,是美国和乌克兰对当时那个版本的矿产协议,都不满意。乌克兰不满的,是协议的内容;美国不满的,是乌克兰的态度。

因为协议没有写上保障乌克兰安全的内容,所以在双方会谈时,乌克兰一方抱怨连连,态度是冲撞的。这种冲撞的态度,使得特朗普现场发飙,当着媒体记者的面斥责泽连斯基手里没有牌了。泽连斯基也不含糊,当场反击特朗普。这样一来,协议签署的氛围就荡然无存,协议自然就无法签署了。

特朗普是善变的,2月28日白宫争吵轰动全球,大概率也让他反思了一番。

于是,美国和乌克兰3月11日在沙特会谈并发布了联合声明,美方在声明中同意在矿产协议中加入保障乌克兰安全的内容。

但是,在3月23日、24日、25日美俄乌沙特谈判之后,3月28日乌克兰收到了美国方面修改过的矿产协议文本,这个版本的协议不但条件更加苛刻,而且依然没有保障乌克兰安全的内容。

与此同时,乌克兰总统泽连斯基宣称,此前美国对乌援助不能算是债务,但可为美国未来提供的援助做出补偿。

上述几个回合下来,矿产协议就成了乌克兰手里用来拿捏美国的筹码。

再这么发展下去,这个筹码有可能成为乌克兰手里的王牌。

第三条线,美俄关系正常化与美俄经济合作。

特朗普对矿产情有独钟。所以他早早就拿出了针对乌克兰的矿产协议,他看上格陵兰岛也是因为那里有丰富的矿产。

俄罗斯也有矿产。俄罗斯国土面积1700多万平方公里,这个国家的矿产资源对特朗普而言也具备强大的吸引力。

根据俄罗斯《消息报》3月31日援引俄直接投资基金总裁德米特里耶夫发布的信息,俄美已经启动有关俄罗斯稀土金属项目的讨论。德米特里耶夫表示,美国企业对潜在的合作协议已表现出兴趣,预计俄美代表将于4月中旬在沙特首都利雅得举行新一轮会谈。

如果美、俄之间达成矿产协议,那么,这个协议就是俄罗斯手里的筹码,用它来换取美国推动西方解除制裁,换取美俄关系正常化。

这个协议也是美国手里的筹码,用来敲打乌克兰,你不想给是吗,有想给的。

第四条线,如何在俄乌之间维和。

这个问题,法国和英国起到了带头作用。

俄乌如果达成停火协议、或者将来达成和平协议,如何保障俄乌之间不再爆发冲突,派遣一支部队挡在俄罗斯和乌克兰之间,是一个现实、有效的做法。

法国和英国的方案是组成一个“志愿联盟”,在俄乌停火之后向乌克兰派遣“保障部队”。3月27日,法国、英国召集部分国家在巴黎就这个问题展开讨论。美国没有派代表参加这个会议。

这个会议,在向乌克兰派遣“保障部队”问题上没有达成共识。

在美国不表态、俄罗斯强烈反对、联合国没有出面的情况下,法国和英国的做法只起到了带头作用,不能起到决定性作用。

只有相关各方都参与进来了,在经过多轮复杂的博弈之后,这个事情才有可能尘埃落定。

综上,俄乌谈判、美乌矿产协议、美俄关系、维和问题这4条线,目前都在推进之中,这4条线交互作用,通过一系列复杂的博弈,正推动俄乌和平进程艰难前行。


9小时前
+ 查看更多
指标 数据时间公布值同比增减
GDP2024年一至四季度1349083.55%
CPI2025年02月份99.3-0.7%
PPI2025年02月份97.8-2.2%
M22025年02月份3205173.247%
微信矩阵
名称最新价涨跌涨跌幅
美元瑞郎0.88470.00380.43%
美元加元1.43760.00600.42%
美元日元150.01080.17630.12%
欧元美元1.0814-0.0015-0.14%
英镑美元1.2914-0.0027-0.21%
名称最新价涨跌涨跌幅
燃油主连3279772.40%
NYMEX原油71.622.263.26%
NYMEX汽油2.29180.04832.15%
NYMEX燃油2.28130.05252.36%
原油主连552.815.42.87%
APP下载
下载证券之星
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-