6月21日AI深夜速递|Signal总裁警告AI不是朋友、美团LongCat音色克隆突破、OpenMontage 500+AI技能开源、90%企业AI转型血亏
夜深了,AI圈却一点没消停。今天晚间到深夜,从Signal总裁对AI聊天机器人的严厉警告,到美团LongCat团队连放两记技术大招;从《大西洋月刊》曝光AI音乐训练数据底牌,到90%企业AI转型血亏的残酷真相——每一条都值得你花两分钟了解。老规矩,用大白话给你说清楚。
一、Signal总裁拍桌子:AI聊天机器人不是你的朋友
加密通讯软件Signal的总裁Meredith Whittaker近日接受TechCrunch采访时,对AI聊天机器人的拟人化趋势发出严厉警告。她直言不讳地说:
“这些不是你的朋友。它们不是有意识的,不是有感知的,也不是能真正’对话’的存在。”
通俗解释:现在很多AI产品故意把界面设计得像在跟真人聊天,有些还加了”正在思考……””我很理解你的感受”之类的话术。Whittaker认为这会让人产生情感依赖,尤其是孤独的人容易把AI当成真正的朋友。更危险的是,AI背后的公司可以随时查看你的对话内容,而你跟”朋友”说的心里话可能变成精准广告的素材。她还特别点名微软Copilot,认为它可能成为企业数据的”后门”。
对你什么影响:下次跟AI聊天时,别太走心。它可以是个好用的工具,但它不是你的知心好友。把敏感信息往里倒之前,想想这些话会不会被拿去做别的用途。
二、美团LongCat-AudioDiT:零样本音色克隆大突破
美团LongCat技术团队发布了LongCat-AudioDiT语音模型,在零样本TTS(文字转语音)音色克隆领域取得重大突破。简单说就是——给AI听几秒钟某人的声音,它就能用那个人的声音说任何话。
技术亮点:传统语音合成需要先把声音转成”梅尔谱”(一种声音的简化表示),再从梅尔谱生成波形,两步走容易丢信息。LongCat-AudioDiT直接跳过中间步骤,在”波形潜空间”里用扩散模型一步到位生成语音,从根源上提升了声音的真实度和自然度。
通俗比喻:以前给AI配音像让厨师照着菜谱做菜——菜谱简化了,味道总差点意思。现在直接让AI”尝”一口原声,自己琢磨怎么还原,味道自然更接近。
对你什么影响:以后有声书、导航语音、客服机器人都可以用你喜欢的声音了。但也要警惕——技术越逼真,声音诈骗的风险越高。接到”家人”电话要钱时,多留个心眼。
三、美团开源LongCat-Next:让AI像用母语一样理解视觉和声音
美团同日还正式开源了LongCat-Next原生多模态模型及核心离散分词器。这个模型的目标是让AI像人类一样,同时用眼睛看、用耳朵听、用语言理解世界,而不是把视觉和听觉当成”翻译”过来的二手信息。
通俗解释:目前大多数多模态AI的做法是”翻译模式”——先把图片转成文字描述,再让语言模型理解。这就像一个不懂外语的人靠翻译软件跟外国人聊天,意思传到了但总隔一层。LongCat-Next直接在”原生层面”处理视觉和语音信息,相当于让AI”学会”了视觉和听觉这两门”母语”。
对你什么影响:这是通往”物理世界AI”的关键一步。未来AI助手不仅看得懂你发的照片,还能理解视频里的动作和环境声音。比如你拍一段厨房视频问”这道菜哪里做错了”,AI能直接看出来而不需要先转成文字描述。
四、《大西洋月刊》曝光AI音乐训练数据:1200万条音轨可查
《大西洋月刊》记者Alex Reisner近日披露了四个用于训练AI模型的音乐数据集,并将其转化为可公开查询的搜索库。其中两个库规模惊人:一个拥有1200万条音轨,另一个拥有900万条音轨。
通俗解释:AI生成音乐的能力从哪来?靠”听”了海量的歌曲。但问题在于,很多AI公司并没有获得这些歌曲的使用授权。The Atlantic做了一件大事——把训练数据做成了搜索工具,让音乐人可以查查自己的歌有没有被AI”偷听”过。
对你什么影响:如果你是音乐创作者,可以去查查自己的作品是否被未经授权使用了。即使你不是音乐人,这件事也说明AI行业正在被要求”透明化”——不能光用别人的东西赚钱,还得说清楚用了什么。版权问题将影响未来所有AI生成内容的定价和合法性。
五、OpenMontage:全球首个开源智能体视频制作系统
GitHub上出现了一个爆火项目——OpenMontage,号称全球首个开源智能体视频制作系统。它集成了12条流水线、52个工具以及超过500项智能体技能,目标是将AI编程助手变成一个全功能视频制作工作室。
通俗解释:以前做视频需要一个人分饰多角——写脚本、配音、剪辑、加特效。OpenMontage相当于给你配了一个500人的虚拟团队,你说”帮我做个1分钟的AI科普视频”,它自己分工:AI写文案、AI配音、AI剪辑、AI加字幕,一条龙搞定。
对你什么影响:内容创作者的门槛将大幅降低。小团队甚至个人就能做出过去需要专业工作室才能完成的视频。但另一方面,视频内容供给爆炸也会加剧竞争——人人都能做视频的时代,拼的就不再是”能不能做”,而是”做得有没有创意”。
六、Google Research开源TimesFM:AI预测时间序列的新武器
Google Research正式推出TimesFM(时间序列基础模型),这是一款专为时间序列预测任务设计的预训练基础模型,已在GitHub上开源。
通俗解释:“时间序列预测”听起来很学术,其实就是根据过去的数据预测未来趋势。比如看过去3年的销售额预测下季度业绩、看历史气温预测明年冬天有多冷、看股价走势预测涨跌(虽然这个不推荐……)。以前每种预测都需要专门训练模型,现在TimesFM像GPT理解语言一样,用预训练的方式”理解”了时间序列的通用规律。
对你什么影响:对于做数据分析、金融、供应链管理的人来说,这是个免费的好工具。对于普通人来说,这意味着天气预报会更准、电商的补货更智能、甚至外卖的预计送达时间也会更精确。AI正在从”能聊天”变成”能算账”。
七、残酷真相:90%企业AI转型没赚到钱
最新报告显示,近90%采用AI的企业未能获得显著回报。这跟之前报道的”Uber四个月烧光全年AI预算””企业人均月花7500美元”形成了完整闭环。
问题出在哪?报告指出,大多数企业犯的错误是把AI当成“工具叠加”——买了个AI工具就以为万事大吉,但组织和业务流程根本没变。就像给一辆牛车装了个航空发动机,不换底盘不改轮子,发动机再强也跑不快。
通俗比喻:想象你给一家餐厅买了台全自动炒菜机器人,但后厨的工作流程还是按人工炒菜设计的——食材备料、出菜顺序、清洗流程都没调过。结果机器人反而成了累赘,厨师还得围着他转。
对你什么影响:如果你在公司推AI项目,别只想着买工具。真正的AI转型需要重新设计工作流程、调整团队结构、建立数据基础设施。这也解释了为什么下一类”数字员工”比单点工具更受欢迎。
八、”数字员工”月入一两千:律师、电商、投资人已用起来
36氪报道了一组真实案例:AI”数字员工”正在以每月一两千元的”工资”,进入律师、跨境电商、投资经理的日常工作。
- 律师:写下了45个Skills教AI Agent办案,从合同审查到法律检索全自动
- 跨境电商老板:裁掉了3名员工,靠4个数字员工一人身兼4职——选品、投放、客服、数据分析
- 投资经理:睡觉时让Agent筛选商业计划书(BP),醒来直接看推荐结果
通俗解释:这些”数字员工”不是ChatGPT那种你问一句答一句的聊天机器人,而是能自主完成多步骤任务的AI Agent。它们不用发工资、不用交社保、24小时在线,月薪才一两千。对比之下,一个人类员工的社保+工资+办公成本,月均至少一两万。
对你什么影响:不管你是打工人还是老板,这都是一个信号:未来不是”AI替代你”,而是”会用AI的人替代不会用AI的人“。与其担心被AI抢饭碗,不如先学会怎么”雇佣”和”管理”几个数字员工。同时,硅谷最新最抢手的岗位已变成了FDE(前线部署工程师)——专门帮企业把AI模型接入生产线的”实施专家”,说明行业焦点已从”造模型”转向”用起来”。
今晚AI速览表
| 事件 | 关键词 | 对普通人的影响 |
|---|---|---|
| Signal总裁警告AI不是朋友 | AI拟人化/情感依赖 | 别对AI走心,警惕隐私泄露 |
| 美团LongCat-AudioDiT | 零样本音色克隆 | 配音更自然,但声音诈骗风险升级 |
| 美团开源LongCat-Next | 原生多模态模型 | AI能同时”看、听、说”,视频理解升级 |
| 《大西洋月刊》AI音乐数据搜索库 | 1200万+音轨可查 | 音乐人可查版权,AI透明化加速 |
| OpenMontage开源 | 500+AI技能视频制作 | 人人可做专业视频,竞争加剧 |
| Google TimesFM开源 | 时间序列预测模型 | 天气预报/销量预测/外卖时效更准 |
| 90%企业AI转型血亏 | 工具叠加≠真转型 | 推AI项目别只买工具,要改流程 |
| 数字员工月薪一两千 | 律师/电商/投资人已用 | 学会管理AI员工比担心被替代更重要 |
关注【uool工具AI导航】,每天看懂AI圈。