李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元

2025-02-07


李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元

李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。

一些国家禁止、限制使用DeepSeek,外交部回应

2月6日,外交部发言人郭嘉昆主持例行记者会。韩联社记者提问,据报道,韩国的一些政府部门已经屏蔽对DeepSeek的访问,之前意大利、澳大利亚、印度、美国、日本等国家也传出禁止或限制使用DeepSeek的消息,一些企业也出现屏蔽对DeepSeek访问的情况。请问中方如何看待这些动向?郭嘉昆表示,我注意到有关情况。我想强调的是,中国政府高度重视并依法保护数据隐私和安全,从来没有也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念、将经贸科技问题政治化的做法,同时中方也将坚定维护中国企业的合法权益。

OpenAI升级o3-mini模型思维链 提高AI推理透明度

OpenAI公司在X平台发布推文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。

谷歌发布新一代Gemini系列大模型

谷歌公司发布Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本,谷歌称Gemini 2.0 Pro目前具有该公司发布模型中最强的编码性能和处理复杂提示的能力,具有200万个tokens。谷歌还在其Gemini App中推出推理模型Gemini 2.0 Flash Thinking实验版本。

“反击”黄仁勋言论 谷歌计划5年内发布商业量子计算应用

谷歌量子部门负责人Hartmut Neven当地时间2月5日表示,谷歌计划在5年内发布商业量子计算应用。该公司于去年年底刚刚发布了量子芯片Willow。Neven在一份声明中称:“我们乐观地认为,5年内我们将看到只有在量子计算机上才能实现的现实世界应用。”谷歌所说的现实世界应用包括与能源、材料科学及新药研发有关的领域,例如发现可替代的新能源,为电动汽车制造更高级的电池,发现创新药物靶点等。英伟达创始人CEO黄仁勋在今年年初就曾预测,量子技术远非5年就能实现广泛的应用。他预计,量子计算机的实际应用大约还需要20年的时间。

特斯拉正式招聘工程师等岗位,为量产机器人做准备

特斯拉正式招聘工程师、流程主管、产品经理等多个岗位,为在加州弗里蒙特工厂量产的 Optimus(特斯拉机器人)做准备。

相关推荐