6月21日AI深夜速递｜Signal总裁警告AI不是朋友、美团LongCat音色克隆突破、OpenMontage 500+AI技能开源、90%企业AI转型血亏

夜深了，AI圈却一点没消停。今天晚间到深夜，从Signal总裁对AI聊天机器人的严厉警告，到美团LongCat团队连放两记技术大招；从《大西洋月刊》曝光AI音乐训练数据底牌，到90%企业AI转型血亏的残酷真相——每一条都值得你花两分钟了解。老规矩，用大白话给你说清楚。

一、Signal总裁拍桌子：AI聊天机器人不是你的朋友

加密通讯软件Signal的总裁Meredith Whittaker近日接受TechCrunch采访时，对AI聊天机器人的拟人化趋势发出严厉警告。她直言不讳地说：

“这些不是你的朋友。它们不是有意识的，不是有感知的，也不是能真正’对话’的存在。”

通俗解释：现在很多AI产品故意把界面设计得像在跟真人聊天，有些还加了”正在思考……””我很理解你的感受”之类的话术。Whittaker认为这会让人产生情感依赖，尤其是孤独的人容易把AI当成真正的朋友。更危险的是，AI背后的公司可以随时查看你的对话内容，而你跟”朋友”说的心里话可能变成精准广告的素材。她还特别点名微软Copilot，认为它可能成为企业数据的”后门”。

对你什么影响：下次跟AI聊天时，别太走心。它可以是个好用的工具，但它不是你的知心好友。把敏感信息往里倒之前，想想这些话会不会被拿去做别的用途。

二、美团LongCat-AudioDiT：零样本音色克隆大突破

美团LongCat技术团队发布了LongCat-AudioDiT语音模型，在零样本TTS（文字转语音）音色克隆领域取得重大突破。简单说就是——给AI听几秒钟某人的声音，它就能用那个人的声音说任何话。

技术亮点：传统语音合成需要先把声音转成”梅尔谱”（一种声音的简化表示），再从梅尔谱生成波形，两步走容易丢信息。LongCat-AudioDiT直接跳过中间步骤，在”波形潜空间”里用扩散模型一步到位生成语音，从根源上提升了声音的真实度和自然度。

通俗比喻：以前给AI配音像让厨师照着菜谱做菜——菜谱简化了，味道总差点意思。现在直接让AI”尝”一口原声，自己琢磨怎么还原，味道自然更接近。

对你什么影响：以后有声书、导航语音、客服机器人都可以用你喜欢的声音了。但也要警惕——技术越逼真，声音诈骗的风险越高。接到”家人”电话要钱时，多留个心眼。

三、美团开源LongCat-Next：让AI像用母语一样理解视觉和声音

美团同日还正式开源了LongCat-Next原生多模态模型及核心离散分词器。这个模型的目标是让AI像人类一样，同时用眼睛看、用耳朵听、用语言理解世界，而不是把视觉和听觉当成”翻译”过来的二手信息。

通俗解释：目前大多数多模态AI的做法是”翻译模式”——先把图片转成文字描述，再让语言模型理解。这就像一个不懂外语的人靠翻译软件跟外国人聊天，意思传到了但总隔一层。LongCat-Next直接在”原生层面”处理视觉和语音信息，相当于让AI”学会”了视觉和听觉这两门”母语”。

对你什么影响：这是通往”物理世界AI”的关键一步。未来AI助手不仅看得懂你发的照片，还能理解视频里的动作和环境声音。比如你拍一段厨房视频问”这道菜哪里做错了”，AI能直接看出来而不需要先转成文字描述。

四、《大西洋月刊》曝光AI音乐训练数据：1200万条音轨可查

《大西洋月刊》记者Alex Reisner近日披露了四个用于训练AI模型的音乐数据集，并将其转化为可公开查询的搜索库。其中两个库规模惊人：一个拥有1200万条音轨，另一个拥有900万条音轨。

通俗解释：AI生成音乐的能力从哪来？靠”听”了海量的歌曲。但问题在于，很多AI公司并没有获得这些歌曲的使用授权。The Atlantic做了一件大事——把训练数据做成了搜索工具，让音乐人可以查查自己的歌有没有被AI”偷听”过。

对你什么影响：如果你是音乐创作者，可以去查查自己的作品是否被未经授权使用了。即使你不是音乐人，这件事也说明AI行业正在被要求”透明化”——不能光用别人的东西赚钱，还得说清楚用了什么。版权问题将影响未来所有AI生成内容的定价和合法性。

五、OpenMontage：全球首个开源智能体视频制作系统

GitHub上出现了一个爆火项目——OpenMontage，号称全球首个开源智能体视频制作系统。它集成了12条流水线、52个工具以及超过500项智能体技能，目标是将AI编程助手变成一个全功能视频制作工作室。

通俗解释：以前做视频需要一个人分饰多角——写脚本、配音、剪辑、加特效。OpenMontage相当于给你配了一个500人的虚拟团队，你说”帮我做个1分钟的AI科普视频”，它自己分工：AI写文案、AI配音、AI剪辑、AI加字幕，一条龙搞定。

对你什么影响：内容创作者的门槛将大幅降低。小团队甚至个人就能做出过去需要专业工作室才能完成的视频。但另一方面，视频内容供给爆炸也会加剧竞争——人人都能做视频的时代，拼的就不再是”能不能做”，而是”做得有没有创意”。

六、Google Research开源TimesFM：AI预测时间序列的新武器

Google Research正式推出TimesFM（时间序列基础模型），这是一款专为时间序列预测任务设计的预训练基础模型，已在GitHub上开源。

通俗解释：“时间序列预测”听起来很学术，其实就是根据过去的数据预测未来趋势。比如看过去3年的销售额预测下季度业绩、看历史气温预测明年冬天有多冷、看股价走势预测涨跌（虽然这个不推荐……）。以前每种预测都需要专门训练模型，现在TimesFM像GPT理解语言一样，用预训练的方式”理解”了时间序列的通用规律。

对你什么影响：对于做数据分析、金融、供应链管理的人来说，这是个免费的好工具。对于普通人来说，这意味着天气预报会更准、电商的补货更智能、甚至外卖的预计送达时间也会更精确。AI正在从”能聊天”变成”能算账”。

七、残酷真相：90%企业AI转型没赚到钱

最新报告显示，近90%采用AI的企业未能获得显著回报。这跟之前报道的”Uber四个月烧光全年AI预算””企业人均月花7500美元”形成了完整闭环。

问题出在哪？报告指出，大多数企业犯的错误是把AI当成“工具叠加”——买了个AI工具就以为万事大吉，但组织和业务流程根本没变。就像给一辆牛车装了个航空发动机，不换底盘不改轮子，发动机再强也跑不快。

通俗比喻：想象你给一家餐厅买了台全自动炒菜机器人，但后厨的工作流程还是按人工炒菜设计的——食材备料、出菜顺序、清洗流程都没调过。结果机器人反而成了累赘，厨师还得围着他转。

对你什么影响：如果你在公司推AI项目，别只想着买工具。真正的AI转型需要重新设计工作流程、调整团队结构、建立数据基础设施。这也解释了为什么下一类”数字员工”比单点工具更受欢迎。

八、”数字员工”月入一两千：律师、电商、投资人已用起来

36氪报道了一组真实案例：AI”数字员工”正在以每月一两千元的”工资”，进入律师、跨境电商、投资经理的日常工作。

律师：写下了45个Skills教AI Agent办案，从合同审查到法律检索全自动
跨境电商老板：裁掉了3名员工，靠4个数字员工一人身兼4职——选品、投放、客服、数据分析
投资经理：睡觉时让Agent筛选商业计划书（BP），醒来直接看推荐结果

通俗解释：这些”数字员工”不是ChatGPT那种你问一句答一句的聊天机器人，而是能自主完成多步骤任务的AI Agent。它们不用发工资、不用交社保、24小时在线，月薪才一两千。对比之下，一个人类员工的社保+工资+办公成本，月均至少一两万。

对你什么影响：不管你是打工人还是老板，这都是一个信号：未来不是”AI替代你”，而是”会用AI的人替代不会用AI的人“。与其担心被AI抢饭碗，不如先学会怎么”雇佣”和”管理”几个数字员工。同时，硅谷最新最抢手的岗位已变成了FDE（前线部署工程师）——专门帮企业把AI模型接入生产线的”实施专家”，说明行业焦点已从”造模型”转向”用起来”。

今晚AI速览表

事件	关键词	对普通人的影响
Signal总裁警告AI不是朋友	AI拟人化/情感依赖	别对AI走心，警惕隐私泄露
美团LongCat-AudioDiT	零样本音色克隆	配音更自然，但声音诈骗风险升级
美团开源LongCat-Next	原生多模态模型	AI能同时”看、听、说”，视频理解升级
《大西洋月刊》AI音乐数据搜索库	1200万+音轨可查	音乐人可查版权，AI透明化加速
OpenMontage开源	500+AI技能视频制作	人人可做专业视频，竞争加剧
Google TimesFM开源	时间序列预测模型	天气预报/销量预测/外卖时效更准
90%企业AI转型血亏	工具叠加≠真转型	推AI项目别只买工具，要改流程
数字员工月薪一两千	律师/电商/投资人已用	学会管理AI员工比担心被替代更重要