6月21日AI深夜速递|Signal总裁警告AI不是朋友、美团LongCat音色克隆突破、OpenMontage 500+AI技能开源、90%企业AI转型血亏

夜深了,AI圈却一点没消停。今天晚间到深夜,从Signal总裁对AI聊天机器人的严厉警告,到美团LongCat团队连放两记技术大招;从《大西洋月刊》曝光AI音乐训练数据底牌,到90%企业AI转型血亏的残酷真相——每一条都值得你花两分钟了解。老规矩,用大白话给你说清楚。

一、Signal总裁拍桌子:AI聊天机器人不是你的朋友

加密通讯软件Signal的总裁Meredith Whittaker近日接受TechCrunch采访时,对AI聊天机器人的拟人化趋势发出严厉警告。她直言不讳地说:

“这些不是你的朋友。它们不是有意识的,不是有感知的,也不是能真正’对话’的存在。”

通俗解释:现在很多AI产品故意把界面设计得像在跟真人聊天,有些还加了”正在思考……””我很理解你的感受”之类的话术。Whittaker认为这会让人产生情感依赖,尤其是孤独的人容易把AI当成真正的朋友。更危险的是,AI背后的公司可以随时查看你的对话内容,而你跟”朋友”说的心里话可能变成精准广告的素材。她还特别点名微软Copilot,认为它可能成为企业数据的”后门”。

对你什么影响:下次跟AI聊天时,别太走心。它可以是个好用的工具,但它不是你的知心好友。把敏感信息往里倒之前,想想这些话会不会被拿去做别的用途。

二、美团LongCat-AudioDiT:零样本音色克隆大突破

美团LongCat技术团队发布了LongCat-AudioDiT语音模型,在零样本TTS(文字转语音)音色克隆领域取得重大突破。简单说就是——给AI听几秒钟某人的声音,它就能用那个人的声音说任何话。

技术亮点:传统语音合成需要先把声音转成”梅尔谱”(一种声音的简化表示),再从梅尔谱生成波形,两步走容易丢信息。LongCat-AudioDiT直接跳过中间步骤,在”波形潜空间”里用扩散模型一步到位生成语音,从根源上提升了声音的真实度和自然度。

通俗比喻:以前给AI配音像让厨师照着菜谱做菜——菜谱简化了,味道总差点意思。现在直接让AI”尝”一口原声,自己琢磨怎么还原,味道自然更接近。

对你什么影响:以后有声书、导航语音、客服机器人都可以用你喜欢的声音了。但也要警惕——技术越逼真,声音诈骗的风险越高。接到”家人”电话要钱时,多留个心眼。

三、美团开源LongCat-Next:让AI像用母语一样理解视觉和声音

美团同日还正式开源了LongCat-Next原生多模态模型及核心离散分词器。这个模型的目标是让AI像人类一样,同时用眼睛看、用耳朵听、用语言理解世界,而不是把视觉和听觉当成”翻译”过来的二手信息。

通俗解释:目前大多数多模态AI的做法是”翻译模式”——先把图片转成文字描述,再让语言模型理解。这就像一个不懂外语的人靠翻译软件跟外国人聊天,意思传到了但总隔一层。LongCat-Next直接在”原生层面”处理视觉和语音信息,相当于让AI”学会”了视觉和听觉这两门”母语”。

对你什么影响:这是通往”物理世界AI”的关键一步。未来AI助手不仅看得懂你发的照片,还能理解视频里的动作和环境声音。比如你拍一段厨房视频问”这道菜哪里做错了”,AI能直接看出来而不需要先转成文字描述。

四、《大西洋月刊》曝光AI音乐训练数据:1200万条音轨可查

《大西洋月刊》记者Alex Reisner近日披露了四个用于训练AI模型的音乐数据集,并将其转化为可公开查询的搜索库。其中两个库规模惊人:一个拥有1200万条音轨,另一个拥有900万条音轨

通俗解释:AI生成音乐的能力从哪来?靠”听”了海量的歌曲。但问题在于,很多AI公司并没有获得这些歌曲的使用授权。The Atlantic做了一件大事——把训练数据做成了搜索工具,让音乐人可以查查自己的歌有没有被AI”偷听”过。

对你什么影响:如果你是音乐创作者,可以去查查自己的作品是否被未经授权使用了。即使你不是音乐人,这件事也说明AI行业正在被要求”透明化”——不能光用别人的东西赚钱,还得说清楚用了什么。版权问题将影响未来所有AI生成内容的定价和合法性。

五、OpenMontage:全球首个开源智能体视频制作系统

GitHub上出现了一个爆火项目——OpenMontage,号称全球首个开源智能体视频制作系统。它集成了12条流水线、52个工具以及超过500项智能体技能,目标是将AI编程助手变成一个全功能视频制作工作室。

通俗解释:以前做视频需要一个人分饰多角——写脚本、配音、剪辑、加特效。OpenMontage相当于给你配了一个500人的虚拟团队,你说”帮我做个1分钟的AI科普视频”,它自己分工:AI写文案、AI配音、AI剪辑、AI加字幕,一条龙搞定。

对你什么影响:内容创作者的门槛将大幅降低。小团队甚至个人就能做出过去需要专业工作室才能完成的视频。但另一方面,视频内容供给爆炸也会加剧竞争——人人都能做视频的时代,拼的就不再是”能不能做”,而是”做得有没有创意”。

六、Google Research开源TimesFM:AI预测时间序列的新武器

Google Research正式推出TimesFM(时间序列基础模型),这是一款专为时间序列预测任务设计的预训练基础模型,已在GitHub上开源。

通俗解释:“时间序列预测”听起来很学术,其实就是根据过去的数据预测未来趋势。比如看过去3年的销售额预测下季度业绩、看历史气温预测明年冬天有多冷、看股价走势预测涨跌(虽然这个不推荐……)。以前每种预测都需要专门训练模型,现在TimesFM像GPT理解语言一样,用预训练的方式”理解”了时间序列的通用规律。

对你什么影响:对于做数据分析、金融、供应链管理的人来说,这是个免费的好工具。对于普通人来说,这意味着天气预报会更准、电商的补货更智能、甚至外卖的预计送达时间也会更精确。AI正在从”能聊天”变成”能算账”。

七、残酷真相:90%企业AI转型没赚到钱

最新报告显示,近90%采用AI的企业未能获得显著回报。这跟之前报道的”Uber四个月烧光全年AI预算””企业人均月花7500美元”形成了完整闭环。

问题出在哪?报告指出,大多数企业犯的错误是把AI当成“工具叠加”——买了个AI工具就以为万事大吉,但组织和业务流程根本没变。就像给一辆牛车装了个航空发动机,不换底盘不改轮子,发动机再强也跑不快。

通俗比喻:想象你给一家餐厅买了台全自动炒菜机器人,但后厨的工作流程还是按人工炒菜设计的——食材备料、出菜顺序、清洗流程都没调过。结果机器人反而成了累赘,厨师还得围着他转。

对你什么影响:如果你在公司推AI项目,别只想着买工具。真正的AI转型需要重新设计工作流程、调整团队结构、建立数据基础设施。这也解释了为什么下一类”数字员工”比单点工具更受欢迎。

八、”数字员工”月入一两千:律师、电商、投资人已用起来

36氪报道了一组真实案例:AI”数字员工”正在以每月一两千元的”工资”,进入律师、跨境电商、投资经理的日常工作。

  • 律师:写下了45个Skills教AI Agent办案,从合同审查到法律检索全自动
  • 跨境电商老板:裁掉了3名员工,靠4个数字员工一人身兼4职——选品、投放、客服、数据分析
  • 投资经理:睡觉时让Agent筛选商业计划书(BP),醒来直接看推荐结果

通俗解释:这些”数字员工”不是ChatGPT那种你问一句答一句的聊天机器人,而是能自主完成多步骤任务的AI Agent。它们不用发工资、不用交社保、24小时在线,月薪才一两千。对比之下,一个人类员工的社保+工资+办公成本,月均至少一两万。

对你什么影响:不管你是打工人还是老板,这都是一个信号:未来不是”AI替代你”,而是”会用AI的人替代不会用AI的人“。与其担心被AI抢饭碗,不如先学会怎么”雇佣”和”管理”几个数字员工。同时,硅谷最新最抢手的岗位已变成了FDE(前线部署工程师)——专门帮企业把AI模型接入生产线的”实施专家”,说明行业焦点已从”造模型”转向”用起来”。

今晚AI速览表

事件关键词对普通人的影响
Signal总裁警告AI不是朋友AI拟人化/情感依赖别对AI走心,警惕隐私泄露
美团LongCat-AudioDiT零样本音色克隆配音更自然,但声音诈骗风险升级
美团开源LongCat-Next原生多模态模型AI能同时”看、听、说”,视频理解升级
《大西洋月刊》AI音乐数据搜索库1200万+音轨可查音乐人可查版权,AI透明化加速
OpenMontage开源500+AI技能视频制作人人可做专业视频,竞争加剧
Google TimesFM开源时间序列预测模型天气预报/销量预测/外卖时效更准
90%企业AI转型血亏工具叠加≠真转型推AI项目别只买工具,要改流程
数字员工月薪一两千律师/电商/投资人已用学会管理AI员工比担心被替代更重要


关注【uool工具AI导航】,每天看懂AI圈。

© 版权声明

相关文章