OpenAI向部分用户开放GPT 今秋将扩大至所有付费用户

2024-07-31

OpenAI向部分用户开放GPT-4o语音模式 今秋将扩大至所有付费用户

7月31日讯 当地时间周二(7月30日),美国AI研究公司OpenAI宣布,即日起开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。据OpenAI介绍,高级语音模式能提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪,实时响应和可打断对话是目前语音助手公认的技术难点。OpenAI在今年5月推出了新版本大模型GPT-4o,同时还展示出了语音模式,该公司原定于6月底开始逐步向用户开放语音模式,但最终决定推迟至7月发布。语音模式将于今年秋季向所有ChatGPT Plus用户开放。

“史上最大IT事故”一周多后 微软再次出现服务中断

7月31日讯 当地时间周二(7月30日),微软再次出现服务中断,该公司称其已经在解决相关问题。就在一周多前,微软在全球范围内出现了重大服务中断,超过800万台使用微软系统的计算机出现故障,影响了航空、医疗和金融等多个行业,被称为“史上最大规模IT故障”。据微软日本子公司称,此次故障与美国网络安全企业CrowdStrike旗下软件更新有关。根据追踪网站Downdetector汇编的用户报告,有关微软云服务Azure和Microsoft 365中断的报告在美东时间周二早上7点后不久开始激增,在事件高峰期包含数百起投诉。微软表示,该公司已开始尝试修复问题,并显示出改善迹象,正在监控情况以确保问题完全修复。

黄仁勋与扎克伯格首次公开对话:支持AI大模型开源策略

当地时间7月29日晚间,在美国丹佛举行的SIGGRAPH 2024计算机图形大会上,英伟达CEO黄仁勋(Jensen Huang)和 Meta 创始人 CEO 扎克伯格进行谈话,这也是两人首次公开对话。扎克伯格表示,“即使现在AI基础模型的进步停止了,我们仍然会有5年的产品创新,但我实际上认为基础模型和基础研究的进展正在加速。”黄仁勋也对Meta开发的开源大型模型给予了高度评价,并且他和扎克伯格都认为应该继续支持大型模型的开源策略。

Meta开源分割一切2.0模型,视频也能分割了

Meta 在 SIGGRAPH 上重磅宣布 Segment Anything Model 2 (SAM 2) 来了。在其前身的基础上,SAM 2 的诞生代表了领域内的一次重大进步 —— 为静态图像和动态视频内容提供实时、可提示的对象分割,将图像和视频分割功能统一到一个强大的系统中。SAM 2 可以分割任何视频或图像中的任何对象 —— 甚至是它以前没有见过的对象和视觉域,从而支持各种不同的用例,而无需自定义适配。在与黄仁勋的对话中,扎克伯格提到了 SAM 2:能够在视频中做到这一点,而且是在零样本的前提下,告诉它你想要什么,这非常酷。

英伟达加速人形机器人发展 黄仁勋:面向全球机器人公司开放访问

当地时间7月29日,英伟达在SiGGRAPH大会上宣布,为全球领先的机器人制造商、AI模型开发者和软件制造商提供一整套服务、模型及软件平台,以开发、训练并构建下一代人形机器人。整套产品包括用于机器人仿真和学习的NVIDIA NIM微服务和框架,用于运行多阶段机器人工作负载的NVIDIA OSMO编排服务,以及支持AI和仿真的远程操作工作流,允许开发者使用少量人类演示数据来训练机器人。英伟达创始人CEO黄仁勋表示:“AI下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。我们正在推进整个英伟达机器人堆栈的发展,面向全球机器人开发者和公司开放访问,让他们能够使用最符合其需求的平台、加速库和AI模型。”

深圳:推进深圳开放智算中心建设 2024年建成并投入运营算力规模达4000PFLOPS

中共深圳市委办公厅、深圳市人民政府办公厅印发《深圳市加快打造人工智能先锋城市行动方案》。其中提出,构建“一超多强总调度”智能算力体系。加快推进深圳先进算力基础设施建设,推动“鹏城云脑Ⅲ”连接全国资源打造核心节点。推进深圳开放智算中心建设,2024年建成并投入运营算力规模达4000PFLOPS(每秒浮点运算次数)。鼓励各区选取一批工业上楼项目配建智算中心。建设全光网络,持续扩大深圳市智慧城市算力统筹调度平台、粤港澳大湾区一体化算力服务平台的调度规模,加速推进粤港澳大湾区算力调度平台运营,2024年年底前调度规模达30000P FLOPS。支持面向企业、高校、科研机构等发放算力券,降低使用智能算力的成本。

又一国产版Sora全球上线!清华朱军创业团队,视频生成仅需30秒

早在三个月前,国内外视频生成领域还一片沉寂之时,生数科技突然曝出自家最新视频大模型 Vidu 的宣传视频,凭借其生动逼真、不输 Sora 的效果,惊艳了一众网友。7月31日,Vidu 正式上线。无需申请,只要有个邮箱,就能上手体验。此外,Vidu 的生成效率也贼拉猛,实现了业界最快的推理速度,仅需 30 秒就能生成一段 4 秒镜头。现阶段,Vidu 有两大核心功能:文生视频和图生视频。Vidu底层基于完全自研的 U-ViT 架构,该架构由团队在 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 和 Transformer 融合的架构。

工信部发布《工业机器人行业规范条件(2024版)》

据工信部网站,工业和信息化部对《工业机器人行业规范条件》和《工业机器人行业规范管理实施办法》进行了修订,形成了《工业机器人行业规范条件(2024版)》和《工业机器人行业规范条件管理实施办法(2024版)》,现予以公告。

深圳:建设国产人工智能生态源头创新中心

近日,中共深圳市委办公厅、深圳市人民政府办公厅印发《深圳市加快打造人工智能先锋城市行动方案》。方案提出,建设国产人工智能生态源头创新中心。配置国产算力及算法、算子库、数据库、工具链、模型库等工具,形成2个行业大模型,赋能50家企业打造典型应用场景。鼓励企业、高校、科研院所共建国产人工智能联合实验室,形成一批“人工智能+”行业解决方案。支持成立粤港澳大湾区人工智能产业联盟。

相关推荐