本站消息,专注于金融市场的人工智能研究实验室 nof1 于 18 日开始一项大模型交易测试 Alpha Arena。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。 截止发稿,DeepSeek 和 Grok 收益率均超 14%,排名前二,Gemini 2.5 Pro 则已亏损 42.57%。