在2025年10月,Binance Research发布了首届人工智能模型在加密货币交易中的官方竞赛结果。
实验在真实资金上进行,结果显示AI只有在风险管理上具备高度纪律性的情况下才能产生利润,而不仅仅依赖于其算法的预测能力。
Summary
关键要点
- 六个AI模型在真实的加密货币市场中自主操作,资金为10,000 $。
- 只有两个(DeepSeek Chat V3.1 和 Qwen3 Max)实现了盈利,分别为+94% 和 +60%。
- 表现最差的 (Gemini 2.5 Pro 和 GPT-5) 损失了 超过60%的资本。
- 决定性因素不是预测准确性,而是风险管理。
- 该实验代表了AI在去中心化交易中使用的首个公开基准。
区块链上的真实实验
该研究由Nof1.ai与Binance Research合作进行。
每个模型——包括DeepSeek Chat V3.1, Qwen3 Max, Claude Sonnet 4.5, Grok 4, GPT-5 和 Gemini 2.5 Pro——均获得10,000 USD 的真实资金,用于在永续期货市场上进行链上操作。
所有模型均在相同条件下运行:相同的数据集,无文本输入,24/7全天候操作,完全自主决策。
目标是评估行为和风险管理,而不仅仅是价格预测的纯粹能力。
结果:“AI交易员”叙事背后的现实
最终数据非常清晰:
| AI模型 | 收益率 (%) | 夏普比率 | 胜率 (%) | 总交易数 | 最大亏损 (USD) |
| DeepSeek Chat V3.1 | +94% | 0,45 | 32% | 22 | −1.072 |
| Qwen3 Max | +60% | 0,34 | 33% | 30 | −1.728 |
| Claude Sonnet 4.5 | −1% | 0,03 | 33% | 24 | −1.579 |
| Grok 4 | −7% | 0,04 | 19% | 21 | −657 |
| GPT-5 | −64% | −0,64 | 19% | 74 | −622 |
| Gemini 2.5 Pro | −67% | −0,70 | 26% | 191 | −750 |
只有两个模型以正面结果收尾。
其他所有模型都烧掉了大部分资本,这证明了决策速度并不等同于收益。
实际上,过度活跃——在短短几天内进行多达191次操作——由于过度使用杠杆而放大了损失。
风险管理:利润与失败的区别
最有趣的数据是,获胜的AI并不是最精确的,而是那些能够限制损失的。
DeepSeek Chat V3.1 (0.45) 和 Qwen3 Max (0.34) 的Sharpe Ratio显示出相对平衡的风险管理,而交易频率较高的模型则出现了负Sharpe。
根据Binance Research,亏损模型的主要错误是不当使用杠杆,通常超过10×,以及在每次回撤后倾向于过度交易。
这种行为被称为“AI revenge trading”,类似于人类的行为,但在算法规模上实现自动化。
教训:AI无法取代交易员的经验
实验证实,AI能够处理海量数据,但尚不能解读宏观经济背景或市场的行为动态。
在2025年10月10日发生的190亿美元清算中,这是加密交易历史上最严重的事件之一,几乎所有模型都反应迟缓,将一次正常的回撤转变为系统性损失。
相反,获胜的AI暂停了操作数小时,显示出更好的自我约束协议。
换句话说,关键不在于AI的“头脑”,而在于设计者插入的安全规则。
链上透明度和可审计性
实验的一个基本方面是所有操作都已在链上记录,使得公开审计成为可能。
这种透明度消除了回测的典型问题,并允许实时评估模型的实际表现。
Binance Research 强调,由于可追溯性,链上交易是测试可验证金融AI的理想环境,这一概念可能为由智能合约监督的自动化交易DAO铺平道路。
AI与DeFi:迈向自主金融的下一步
这个实验是在一个更广泛的AI与去中心化金融 (DeFi)整合的背景下进行的。
到2025年,AI x Crypto解决方案市场的市值已超过24亿美元,协议如Virtuals和x402允许自主代理执行交易和支付无需人工干预。
这个想法是,未来一个AI代理可以在区块链上全面分析数据、做出决策、执行订单和处理支付,从而完成自主金融的循环。
然而,十月的结果显示,这一愿景在技术上是可行的,但在财务上仍不成熟:
AI能够采取行动,但尚未能一致地预测。
对市场和投资者的影响
对于机构投资者来说,该测试提供了关键指引:
- AI可以成为一个有效的助手,但不能替代人类分析师;
- 风险管理必须保持人为参数,直到模型整合定性评估;
- 结合AI + 链上可审计性可能会创造出一个新的透明且自我验证的基金类别,从而降低操纵风险。
展望未来,Binance 预计到 2027 年,由 AI 算法管理的交易量可能会超过加密衍生品市场的 15%,而目前这一比例为3%。
这将意味着需要制定新的安全和治理标准,这些标准尚未确定。
结论
Nof1.ai的竞赛并未选出绝对的赢家,但却揭示了一个基本原则:
AI的强大无法弥补纪律的缺失。
在加密交易中,创新与风险之间的界限依然模糊。
人工智能或许能够提升表现,但只有在它能够理解不确定性,而不仅仅是计算不确定性时,才能实现。
在那之前,即使是最先进的模型也仍然需要一个不可或缺的人类元素:判断力。

