01-30-日报-AI资讯日报

AI资讯日报 2026/1/30

AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙

今日摘要

阿里开源Qwen3-ASR支持52语言识别含方言噪音
MiniMax发布Music2.5支持14种结构标签控制歌曲
Chrome集成Gemini可自动浏览比价订票购物结账
课程学习按难度排序可减少45%预训练步数
亚马逊裁员16000人涉及AWS零售多个部门

产品与功能更新

  1. Qwen3-ASR语音模型开源。 阿里通义开源🎉 Qwen3-ASR语音识别模型(AI资讯) ,支持52种语言和方言。可处理噪音环境,唱歌也能识别(✧∀✧)。单次最长支持20分钟音频,还有强制对齐工具。
    AI资讯:Qwen3-ASR语音识别模型技术框架展示

  2. MiniMax Music2.5发布。 MiniMax推出🎵 Music2.5音乐生成(AI资讯) ,支持14种结构标签控制。副歌桥段都能精准指定,华语咬字专门优化💪。人声颤音转音细腻真实,百种乐器随意选。

  3. Chrome浏览器上线AI自动浏览。 谷歌为Chrome加入🤖 Gemini自动浏览功能(AI资讯) ,能自主执行复杂任务。帮你查机票订酒店不在话下,购物还能自动比价。发现折扣码直接结账,侧边栏操作很顺手(´▽`)。
    AI资讯:Chrome浏览器Gemini自动浏览功能界面

前沿研究

  1. 课程学习加速预训练。 研究发现按🔬难度排序训练数据,能让LLM预训练更高效。最高可减少45%训练步数(✧∀✧)。压缩率和词汇多样性是最有效指标, 论文详情(AI资讯) 已公开。

  2. LLM输出漂移被量化。 新研究对gpt-4o-mini和llama3.1进行💡 重复实验(AI资讯) 发现问题。即使温度设为0,输出也会有变化。非确定性在不同模型和提示下表现各异,这给评估带来挑战。

  3. GenCode代码增强框架。 GenCode(AI资讯) 提出代码理解训练🚀增强方案。先生成候选代码再筛选有用的,比SOTA方法准确率提升2.92%。对抗鲁棒性也明显改善,在Qwen2.5-Coder上验证有效。

行业展望与社会影响

  1. Flapping Airplanes融资1.8亿。 一家没产品的AI公司🔥拿到 1.8亿美元(AI资讯) 融资。他们要解决数据效率问题,AI要用人类10万倍数据才能学会。Karpathy公开力挺(✧∀✧),认为10倍提升突破概率很高。

  2. 亚马逊再裁16000人。 亚马逊宣布裁员💔 16000名员工(AI资讯) ,波及AWS和零售等部门。有员工用AI分析Slack记录,竟预测出裁员名单(°Д°)。CEO曾说AI会让公司人更少,这次算是应验了。

  3. 奥尔特曼用iPhone Air。 OpenAI老板公开展示主力机💎 iPhone Air(AI资讯) 。机身仅5.6毫米厚,重量才165克。他还投资脑机接口公司,OpenAI明年也要出自研硬件了。

  4. ICE启用AI筛选举报信息。 美国移民执法局用🔍Palantir的 AI系统(AI资讯) 处理公众举报。系统能自动分类总结线索,但引发隐私担忧。官方强调AI只是辅助,最终还是人来决策。

  5. 蚂蚁入股西湖心辰。 蚂蚁集团投资🐜杭州AI公司 西湖心辰(AI资讯) 。这家公司专注大模型研发,双方将在技术市场深度合作。蚂蚁AI布局又进一步(๑•̀ㅂ•́)و。

  6. 阿里AI芯片正式亮相。 平头哥官网上线⚡ 真武810E芯片(AI资讯) ,采用自研架构。配备96G HBM内存,性能超A800。已部署多个万卡集群,服务400多家客户。

  7. Claude对话安全性报告。 Anthropic分析150万次🔒 Claude对话(AI资讯) 发现。严重风险出现概率在千分之一左右,用户脆弱性是最大影响因素。
    AI资讯:Claude对话安全性数据统计图

开源TOP项目

  1. LingBot-World世界模型开源。 蚂蚁灵波开源🌍 LingBot-World(AI资讯) 世界模型(⭐新发布)。能生成10分钟连续交互视频,支持键鼠实时控制。还能用自然语言改变场景💫,一致性和记忆力超强。

  2. 系统提示词泄露合集。 GitHub热门项目🔥 system_prompts_leaks(AI资讯) ⭐27.2k,收集了ChatGPT、Claude等聊天机器人的系统提示词。研究学习必备资料(✧∀✧)。

  3. MCP Apps协议规范发布。 ext-apps(AI资讯) ⭐768是MCP官方规范仓库🛠️。定义了嵌入式AI聊天机器人UI标准,由MCP服务器提供服务。

  4. Ingress NGINX控制器更新。 Kubernetes的📦 ingress-nginx(AI资讯) ⭐19.4k持续维护中。这是K8s最常用的入口控制器,云原生必备组件。

  5. 拓竹3D打印软件开源。 BambuStudio(AI资讯) ⭐3.9k是拓竹打印机🖨️的PC软件。也支持其他品牌3D打印机使用。

社媒分享

  1. 文档AI课程推荐。 DeeplearningAI推出📚 Document AI课程(AI资讯) ,教你处理复杂文档。传统OCR会丢失表格布局,新技术能识别图表关联(✧∀✧)。3小时6个实践,还教AWS部署。
    AI资讯:Document AI课程内容介绍

  2. Amp Code超预期好用。 用户反馈💪 Amp Code(AI资讯) 体验极佳,不用操心模型选择。直接用最好的就行,比Cursor按次计费省心多了。

  3. PaddleOCR-VL开源发布。 百度开源🚀 PaddleOCR-VL-1.5(AI资讯) 文档解析模型。仅0.9B参数量,OCR能力却超强(°∀°)。

  4. Variant生成前端设计。 Variant(AI资讯) 能一句话🎨生成多种设计风格。可导出html或React文件,类似谷歌Stitch但更方便。
    AI资讯:Variant AI设计生成工具界面

  5. Chrome开启Gemini教程。 博主分享💡 开启方法(AI资讯) ,关键是改系统语言为英文。把谷歌账号和浏览器地区都设成美国,macOS用户必须改系统语言。

  6. Moltbot接入钉钉教程。 钉钉开源了🤖 Moltbot接入方式(AI资讯) 。配置机器人后发命令,云端自动执行任务。人人都能有专属AI助手(´▽`)。

  7. OpenAI挖走Cline团队。 OpenAI从编程工具Cline👀 挖走7人(AI资讯) 。学谷歌只买人不买公司(笑),用来加速Codex产品开发。
    AI资讯:Cline团队被OpenAI挖角新闻

  8. AI写代码像独狼开发者。 有用户观察到💭 AI行为特点(AI资讯) ,更像单打独斗。调用其他Agent也不像人类那样深入讨论,缺少团队协作经验。

  9. Moltbot做AI资讯站。 博主躺床上💪对话飞书 做了AI资讯站(AI资讯) 。聚合40多个海外newsletter,用收集整理的skill完成。
    AI资讯:用Moltbot制作的AI资讯网站

  10. LAD-A2A发现协议发布。 开发者造了🔗 LAD-A2A协议(AI资讯) 解决Agent发现问题。用mDNS自动发现局域网Agent,类似AirDrop原理。


AI资讯日报语音版

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
Last updated on