o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能

2024-11-03

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第1张

最初发现此事的网友，测试确认泄露模型具有奥特曼所说的图像推理能力。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第2张

图源：X@legit_rumors

而日志也显示该模型就是o1本模。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第3张

于是，赶在OpenAI出手修复之前，网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的o1-preview、o1-mini最直观的不同是，泄露出来的o1支持上传附件。

这也就意味着，终于能测测o1的多模态能力了。

网友们也不说废话，直接上强度，普特南数学竞赛的证明题截图一贴，甩给满血o1。

对正整数n，有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n，使得|fn
^‘’
(0)|＞2023。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第4张

思考了18秒之后，o1给出答案：18。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第5张

答案正确：

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第6张

再来一道更复杂的，虽然在识图上遇到了一点小问题，但还是稳稳做对了。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第7张

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第8张

在如此惊艳表现之下，似乎正确识别人类史上首张黑洞照片也不算什么了（doge）。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第9张

不过嘛，也不是没有翻车案例。比如，让大模型数数图里有多少个三角形。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第10张

ID为anagh的??网友，给泄露模型和GPT-4o做了个同屏对比：

4o速度很快，给出了错误答案19。

而满血o1花了1分39秒，狂刷一堆token……给出了不同的错误答案：29。

正确答案是24。

这个bug现在已经修复了。不过，有意思的是，这次模型泄露，持续了整整3个小时。

不小心还是故意的？

有网友犀利地点出，这事儿看上去不是“不小心”，而是“精心策划”：

目的是让人们对即将发布的模型有一个预期。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第11张

不少网友赞同这样的观点：

奥特曼的目的是测试和炒作。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第12张

而由于一切看上去已经部署就绪，甚至有人猜测，o1完整版的正式上线时间就在未来一周之内。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第13张

值得注意的是，就在这次泄露事件之后，奥特曼马上在X上开始了自己的表演：

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第14张

好家伙，都已经吹上o2的风了（还假装上错号……）。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第15张

至于为什么是这个时间……

那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛（doge）。

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能 (https://www.qianyan.tech/) 头条第16张

参考链接：

[1]https://x.com/legit_rumors/status/1852625385801859321

[2]https://x.com/koltregaskes/status/1852657291469709626

[3]https://x.com/anaghnairr/status/1852668741751919016

大模型玩你画我猜：Claude6局3胜，GPT - AI 人工智能

其实这是最近爆火的一种新的测试基准（doge）。

2024-11-03

CISA与FBI新报告建议2026年前关键软件全面剔除非内存安全语言 - 安全

报告还要求企业在2026年1月1日前建立内存安全发展路线图，对于以非内存安全语言编写的现有产品，若到时仍缺少明确内存安全迁 ...

2024-11-03

NVIDIA、微软、谷歌等抢破头台积电考虑对CoWoS封装涨价20% - TSMC 台积电

英伟达、AMD等主流AI芯片厂商大多依赖其3nm制程和CoWoS工艺，随着AI爆炸性增长，台积电的生产线明年的部分产能已被预订，供 ...

2024-11-03

被拐34年外卖小哥认亲一年后因钱与家人决裂郁豹豹回应：我很好不用担心 - 人物

“我作为一个小网红，因为寻亲事件得到了大家的关注，也不想看到这种情况的发生，但它确确实实存在。”

2024-11-03

“就不该让电车上高速” - 科技与交通

从个人的实际经历来看，在购买电动汽车之前，我从未体会过节假日在高速充电排队时的痛苦，也完全想不到会这么煎熬。于是，我 ...

2024-11-03

o1满血版泄露！奥数题图片推理手拿把掐奥特曼上线剧透o2 - AI 人工智能