6月19日AI午后速递|OpenAI让AI学会”看一眼就会”、Midjourney跨界医疗60秒全身扫描、人形机器人告别”走走停停”

今天下午的AI圈,用四个字形容就是——目不暇接。从OpenAI让AI学会”看一遍就会干”,到Midjourney跨界搞医疗,再到人形机器人终于不再”走走停停”了…每条消息都值得一说。话不多说,直接上菜。

🔥 一、OpenAI Codex大更新:AI学会”看一眼就会”

今天中午12:43,OpenAI给Codex推了一个让人直呼”离谱”的新功能——Record & Replay(录屏教学)

什么意思呢?简单说就是:你在电脑上演示一遍操作(比如把PDF转成Word、批量重命名文件、整理Excel表格),AI就在旁边”看”,看完之后它自己就能学会,下次你只要一句话,它就能把这活儿自动干了。

打个比方:以前你教实习生干活,得说半天还不一定教会;现在你做一遍,AI实习生就学会了,而且永远不会忘、不会累、不会出错。目前这个功能仅支持macOS,但Windows版应该也不远了。

对普通人有什么影响?每个人电脑里那些重复、繁琐的操作——整理文件、填报表、处理图片——未来都可以”教”给AI一次,之后它就能自动帮你干。这是真正意义上的个人AI助手,不是聊天机器人,而是能帮你”动手干活”的AI。

💸 二、Odyssey获3.1亿美元融资,黄仁勋亲自押注”世界模型”

今天上午11:37,美国世界模型创业公司Odyssey宣布完成3.1亿美元融资,投后估值14.5亿美元(约95亿人民币)。

投资方阵容相当豪华:亚马逊、英伟达、AMD风投…甚至还有美国中央情报局(CIA)旗下的投资机构In-Q-Tel。英伟达CEO黄仁勋也以个人身份参投。

什么是”世界模型”?如果你把ChatGPT理解成一个”文字大脑”,那世界模型就是一个”物理世界大脑“——它理解空间、重力、光影、碰撞这些真实世界的规律。Odyssey自研的PROWL算法,能让AI更准确地理解3D世界。

对普通人有什么影响?世界模型是自动驾驶、机器人、AR/VR的”地基”。地基越牢,未来无人车就更安全、家用机器人就更聪明、AR眼镜就能更自然地融入你的生活。

🏥 三、Midjourney跨界医疗:50万传感器60秒全身3D扫描

今天最让我”哇塞”的消息是这个——做AI绘图的Midjourney,居然进军医疗了!

10:45,Midjourney宣布成立Midjourney Medical,推出了一款叫Midjourney Scanner的超声波扫描仪。设备里塞进了50万个微型传感器,你躺进去60秒,就能生成一张精度达到亚毫米级别的全身3D”身体地图”——而且成本只要几美元

首家中式SPA体验店计划2027年底在旧金山开业,目标到2031年生产5万台设备。

对普通人有什么影响?做一次全身检查,未来可能像拍一张照片那么简单、便宜。对于疾病的早期筛查、健康管理来说,这是一个巨大的福音。AI不仅会画画,还能帮你看病——而且看得比人更细、更快、更便宜。

🤖 四、人形机器人告别”走走停停”:Curr-0全身灵巧操作模型发布

今天10:46,Current Robotics发布了Curr-0——一个能让70多个自由度的人形机器人实现全身灵巧操作的大模型。

看过人形机器人视频的都知道,以前的机器人走路像僵尸,干活像树懒——走两步停一下,手和脚的配合非常僵硬。Curr-0的核心突破在于:用一个统一的”大脑”同时控制机器人的移动和操作,不再需要分模块切换。

训练数据也很硬核——来自自研系统采集的21000小时真实人类行为数据。翻译一下:机器人研究了人类21000小时的”干活视频”,学会了怎么像人一样边走路边拿东西。

对普通人有什么影响?当机器人能流畅地走路+干活,它们就能进入工厂、仓库、甚至家庭。帮老人拿药、搬重物、打扫卫生……这些场景离我们越来越近了。

🎨 五、何恺明团队炸场:258M参数就能做文生图,全员本科生

今天10:44,AI界”大神”何恺明(ResNet发明者)带领团队发表了一篇让业界沉默的论文——MiniT2I

这个文生图模型只有2.58亿参数——对比一下,Stable Diffusion动辄几十亿参数。更夸张的是:训练成本相当于一次标准的ImageNet实验(学术界的基础实验,不贵),而且团队五名核心成员全是本科生

这说明什么?AI正在变得越来越”轻”。以前搞AI是”大力出奇迹”,堆算力、堆参数、堆钱;现在聪明人用精巧的算法设计,小模型也能干大事

对普通人有什么影响?AI模型变小、变便宜,意味着未来你的手机本地就能跑高质量的AI文生图,不需要联网、不需要付费、不需要等——打开手机就能用。

🎯 六、Claude Design大更新:设计师和程序员要变成同一种人了

今天10:43,Anthropic给Claude Design推了一波重磅更新。简单说就是三件事:

  • GitHub一键导入设计系统——你公司的设计规范,AI直接学会
  • 双向打通Claude Code——在设计里改的东西,代码自动跟着变
  • 支持9大平台一键导出——PDF、PPT、Figma、HTML……一键出活

这意味着:设计和开发的边界正在消失。以前一个产品要设计师画图→程序员写代码→反复对稿;现在一个人+Claude Design就能搞定,而且设计稿和代码是同步的。

对普通人有什么影响?如果你有产品想法但没有设计/开发团队,Claude Design就是你的一人团队。未来的”超级个体”可能一个人就是一个公司。

📚 七、Kimi Work推出目标模式:300个AI同时干活,24小时肝出650页漫画书

今天10:18,月之暗面的Kimi Work推出了”目标模式”(Goal Mode)。

功能不复杂:你设定一个目标,AI就会自动拆解成子任务,然后最多调动300个Agent并行协作,不断迭代直到完成任务。有人用这个功能24小时做了一本650页的漫画书,已经开源到GitHub。

想象一下:以前一个漫画工作室做一本650页的漫画,可能需要好几个人画好几个月。现在一个人+AI,一天就搞定了。

对普通人有什么影响?“单兵作战”的能力被AI无限放大。写书、做视频、开发游戏、设计产品——以前需要一个团队的事,现在你+AI就够了。门槛在降低,创造力在释放。

🚀 八、13位字节跳动AI大牛集体出走创业,累计融资数十亿

今天有媒体统计了一个有意思的数据:2025年至今,字节跳动已有13位AI领域的核心人才离职创业

他们覆盖了AI创作的五大热门赛道:AI创作、AI编程/Agent、具身智能(机器人)、AI硬件、AI4S(AI for Science)。而且几乎每家创业公司都拿到了融资,累计金额数十亿人民币

这不是”离职潮”,而是”创业潮“。大厂培养出来的AI人才正在像蒲公英种子一样散落各地,开出新的花。

对普通人有什么影响?大厂AI人才外溢到创业公司,意味着更多创新产品、更多选择、更多竞争。竞争对消费者永远是好事——你会看到更便宜、更好用、更有趣的AI产品不断冒出来。

📊 今日AI事件速览表

事件主角关键词对普通人的影响
Codex录屏教学OpenAIAI学会”看一眼就会”重复性电脑操作可教给AI自动执行
Odyssey融资3.1亿$Odyssey/黄仁勋世界模型/AI理解物理自动驾驶、机器人更安全可靠
Midjourney医疗扫描仪Midjourney60秒全身3D/几美元体检可能像拍照一样简单便宜
Curr-0灵巧操作模型Current Robotics70+自由度/统一大脑机器人更流畅,离家庭帮手更近
MiniT2I小模型文生图何恺明团队258M参数/全员本科生手机本地跑高质量AI,无需联网
Claude Design更新Anthropic设计代码双向打通一个人=一个产品团队
Kimi Work目标模式月之暗面300 Agent并行单人完成团队级工作量
字节13位AI大牛创业字节跳动系5大赛道/数十亿融资更多创新AI产品涌现

以上就是今天下午AI圈最值得关注的8件大事。从Codex学会”看一遍就会”,到Midjourney跨界医疗,再到人形机器人告别”走走停停”——AI不再只是”聊天”,它正在学会动手、学会看世界、学会帮助每一个人

你最期待哪一个?留言告诉我~

关注【uool工具AI导航】,每天看懂AI圈

© 版权声明

相关文章