6月23日AI凌晨速递|GPT-5.6月底主打自主Agent长任务、阿里HappyHorse 1.1重塑AI视频、CuspAI融资4亿美元、Midjourney跨界做超声扫描舱

大家好,欢迎来到今天的uool工具AI导航凌晨速递。

现在时间是2026年6月23日凌晨。过去这一个晚上(22日18:00-24:00),AI圈继续炸场:GPT-5.6确认6月28日发布、阿里HappyHorse 1.1视频模型五大维度升级、百度开源Unlimited OCR拿下全球第一、豆包悄悄上线打车灰测、CuspAI完成4亿美元融资、Midjourney跨界做超声扫描舱、Grok Office插件上线、微软Copilot Cowork接入DeepSeek……下面用最通俗的话,一件件拆给你听。

一、GPT-5.6月底发布:3D视觉+浏览器自动操控,AI能”自己干活”了

OpenAI内部确认,GPT-5.6最快6月28日发布,主打”自主执行长任务Agent能力”。

  1. 上下文窗口扩容到150万tokens,比上代提升43%
  2. 支持原生3D视觉复刻,上传设计图就能生成浏览器里能转能点三维素材
  3. 内置Playwright自动化工具,AI自己点鼠标、填表格、抓数据,不用人盯着
  4. token单价仅为Claude Fable 5的三分之一,价格战继续

对普通人的影响:这意味着以后你跟AI说”帮我订明天去上海的机票、挑个靠窗的、3000块以内”,AI就能自己打开网页搜索、对比、登录账号、下单——你只需要最后确认一下付款。这是真正意义上的”AI私人助理”时代。

二、阿里HappyHorse 1.1:AI视频从”会动”进化到”像电影”

阿里巴巴22日晚间正式上线HappyHorse 1.1视频生成模型,从动作流畅度、主体稳定性、指令识别、画面质感、音画同步五大维度全面升级。

核心升级:

  • 支持一次上传9张参考图,多镜头成片中人物、商品外观全程统一
  • 舞蹈、打斗、流体布料等高难度动态画面连贯度大幅提升
  • 1080p价格下调25%
  • 已全量接入阿里官网、阿里云百炼、千问云

对普通人的影响:做短视频的电商老板、拍短剧的小团队再也用不着一帧一帧抠细节,AI直接帮你保证人物长得一模一样不”穿模”——以前要专业的后期才能做的事,现在一个Prompt搞定,制作成本直接腰斩。

三、CuspAI融资4亿美元:黄仁勋+贝佐斯押注,AI for Science造”材料界谷歌”

AI for Science企业CuspAI完成4亿美元新一轮融资,估值26亿美元成独角兽,投资方包括英伟达黄仁勋、亚马逊贝佐斯等大佬。CuspAI做的事情很简单:用AI帮人快速找到符合需求的新材料,研发效率比传统实验提升10倍

对普通人的影响:这意味着以后更高效的电池、更便宜的抗癌药、更轻更耐用的手机壳,会以比过去快10倍的速度从实验室走到货架上。AI+科学的范式正式成型,未来5-10年的硬科技突破,AI会成为第一发明人。

四、百度开源Unlimited OCR:3B参数拿全球第一,PDF/图片识别不再卡顿

百度22日晚开源Unlimited OCR模型,总参数3B,实际激活仅500M,在OmniDocBench v1.5/v1.6分别拿下93.23分和93.92分,刷新全球SOTA。最大亮点:能一次性解析40多页文档且速度不下降。

对普通人的影响:以前扫描版PDF想变成Word,要么花钱买付费OCR,要么一页一页手动敲——现在百度这个免费开源模型能直接批量转,学生写论文、律师审合同、财务对账都大幅提速,办公族必备。

五、豆包App灰测打车:聊天框里直接叫车,AI从对话跳到实体出行

字节豆包App悄悄上线打车灰测功能,底层运力由曹操出行提供。你在豆包对话框输入”帮我叫一辆去国贸的车”,它直接在App内完成叫车,不用跳转第三方

对普通人的影响:以后打车、点外卖、查路线、订餐厅全在豆包一个App里完成,再也不用切来切去了。AI Agent的”入口之争”进入下半场——谁先把日常服务整合进来,谁就是下一个超级App。

六、Midjourney跨界做超声扫描舱:50万颗微型传感器,60秒出全身3D影像

画图神器Midjourney宣布跨界健康监测,研发Midjourney Scanner全身超声扫描设备:50万枚沙粒大小的微型超声传感器环形阵列,60秒生成亚毫米级全身三维体内影像,效果对标核磁共振,全程无电离辐射。2027年底旧金山首家试点中心开业。

对普通人的影响:以后体检不用去医院排队、躺冷冰冰的机器了——站着泡个”温泉水”就完成全身扫描,便利店式检测走入日常生活。这也会让AI图像企业从”画图工具”变成”健康基础设施”,开辟全新增长赛道。

七、Grok Office插件上线:Word/Excel/PPT里内置AI办公助手

马斯克旗下xAI的Grok正式上线微软Office三件套专属扩展程序,上架Microsoft应用商店:

  • Word:自动梳理文稿、修正语法、实时调取X平台和全网资讯
  • Excel:自然语言筛选数据、一键生成图表
  • PPT:给个主题自动搭建框架+统一版式

目前面向SuperGrok及以上付费会员开放。

对普通人的影响:以后写周报不用加班凑字、做表格不用死记函数、PPT不用套模板——AI直接给你60分的初稿,你只负责加自己的洞察。打工人的”工具革命”正式进入嵌入式AI时代。

八、微软Copilot Cowork接入DeepSeek:海外大厂首次把国产模型写进核心B端产品

微软Copilot Cowork商用后被超半数财富500强部署,但算力成本压不住了——所以引入DeepSeek V4作为分层备选模型,日常简单任务自动调度DeepSeek,复杂任务再切高端闭源模型。

对普通人的影响:这是美国头部科技大厂首次在核心B端AI产品里纳入国产大模型,意味着国产AI的技术成熟度已经获得国际巨头认可。同时中小企业以后用微软AI办公成本会显著降低。

九、OpenAI Codex新增录制回放:演示一遍,AI自动生成可复用技能

macOS端Codex 26.616版本上线Record & Replay录制回放功能:你完整演示一遍操作流程,AI自动转化为可无限复用的自动化技能,支持本地与远程主机切换线程。

使用限制:仅适配Mac系统;欧盟、英国、瑞士因数据合规法规暂不开放。

对普通人的影响:文员、设计师、运营以后处理”每天重复500次”的批量任务(比如整理报表、抠图、发邮件),只要”做一遍给AI看”,以后就由AI自动完成。这是真正的”零代码”自动化。

十、清华一念UnisonMind:一个端侧多模态大脑同时驱动机器狗+人形机器人+电动轮椅

清华团队发布一念UnisonMind端侧统一多模态智能系统,将统一的实时多模态大脑部署在端侧,同时驱动两条机器狗、一个人形机器人、一台电动轮椅,无需遥控就能自主应对复杂现场场景。

对普通人的影响:这意味着未来家里1个”机器人大脑”就能指挥多个不同形态的机器人协同干活——机器狗看家、人形机器人做饭、电动轮椅陪老人散步,全部在本地运行不依赖云端。家庭机器人普及的关键一步。

今日速览

序号事件看点对普通人影响
1GPT-5.6确认6月28日发布150万token+3D视觉+浏览器自动操控AI能自己订机票订外卖了
2阿里HappyHorse 1.1视频模型五大维度升级,1080p降价25%短视频/电商短剧制作成本腰斩
3CuspAI 4亿美元融资黄仁勋+贝佐斯押注AI for Science新材料/电池/药物研发快10倍
4百度开源Unlimited OCR3B参数拿全球第一,40页PDF不卡扫描版PDF转Word免费高效
5豆包App灰测打车对话框直接叫车,曹操出行运力聊天框里搞定日常出行
6Midjourney Scanner50万传感器60秒出全身3D影像体检进入”温泉式”便利化时代
7Grok Office插件上线Word/Excel/PPT内置AI周报、表格、PPT效率翻倍
8微软Copilot接入DeepSeek海外大厂首次用国产模型企业用AI办公成本下降
9OpenAI Codex录制回放演示一遍AI自动生成可复用技能零代码实现重复工作自动化
10清华一念UnisonMind一个端侧大脑同时驱动多种机器人家庭机器人协同干活成可能
6月23日凌晨AI速览(22日18:00-24:00)

关注【uool工具AI导航】,每天看懂AI圈

© 版权声明

相关文章