2025-05-15

2025-05-15T00:00:00Z | 7 minute read | Updated at 2025-05-15T00:00:00Z

小狐狸

1. 阿里通义万相Wan2.1-VACE开源号称首个开源的视频编辑统一模型

阿里通义万相Wan2.1-VACE开源号称首个开源的视频编辑统一模型通义万相宣布VACE开源，支持多种分辨率和任务，提供一站式视频创作体验，通过多模态输入机制实现高效灵活的视频编辑。 ✨ 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务，提高创作效率。

【总结】✨ 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务，提高创作效率。🌟 强大的可控重绘能力，基于人体姿态、运动光流等控制生成，支持主体和背景参考。🔧 提出视频条件单元VCU，统一多模态输入，实现多任务自由组合与灵活编辑。详情链接:https://github.com/Wan-Video/Wan2.1

2. OpenAI 升级 ChatGPT:正式引入GPT-4.1代码能力超强

OpenAI 升级 ChatGPT:正式引入GPT-4.1代码能力超强 OpenAI发布了GPT-4.1及其轻量级版本GPT-4.1mini，显著增强了编码能力和指令执行体验，同时优化了用户体验和多模态支持，巩固了其在AI领域的领先地位。 🚀 GPT-4.1具备强大的编码能力，处理复杂编程需求更高效，运行速度更快，是开发者和指令处理场景的理想选择。

【总结】🚀 GPT-4.1具备强大的编码能力，处理复杂编程需求更高效，运行速度更快，是开发者和指令处理场景的理想选择。🌐 GPT-4.1mini轻量级且高效，在资源受限设备上仍能流畅运行，为免费和付费用户提供广泛访问渠道。🌟 ChatGPT新增多项功能如长按复制、表格复制和流式传输，界面优化显著提升用户体验。

3. Stability AI开源341M超轻量文字转语音模型，手机本地可跑，音频生成仅需8秒

Stability AI开源341M超轻量文字转语音模型，手机本地可跑，音频生成仅需8秒! Stability AI发布了一款名为‘Adversarial Post-Training加速的快速文字转音频生成’的超轻量文字转语音模型，参数仅为341M，却能在H100GPU上75毫秒生成12秒音频，在手机CPU上7秒完成同样任务，性能炸裂且多样性强。 ⚡️ARC后训练方法不基于蒸馏，提升模型生成速度与…

【总结】⚡️ARC后训练方法不基于蒸馏，提升模型生成速度与质量。📱模型轻量化设计，支持手机本地运行，大幅提升移动端创意应用体验。💫音频转音频功能实现风格迁移，激发更多创作灵感。详情链接:https://arxiv.org/pdf/2505.08175

4. Poe 报告:可灵大模型视频生成量约占30%份额领先Runway

Poe 报告:可灵大模型视频生成量约占30%份额领先Runway 近日发布的2025年春季AI模型使用趋势报告显示，中国快手的可灵多款视频生成模型在文生视频领域表现突出，市场份额达30%，其中可灵2.0模型仅三周就占21%使用比例。自去年6月发布以来，全球用户突破2200万，月活跃用户增长25倍，生成视频和图片数量显著。 🌟 可灵大模型在文生视频领域市场份额达30%，领先Runway等竞争者。

【总结】🌟 可灵大模型在文生视频领域市场份额达30%，领先Runway等竞争者。📈 可灵2.0模型自4月发布后三周内即占据21%视频生成市场。👥 可灵AI全球用户超2200万，月活跃用户增长25倍，生成视频与图片数量显著增加。

5. 微软 WizardLM 团队“集体跳槽”腾讯，或已并入混元大模型研发体系

微软 WizardLM 团队“集体跳槽”腾讯，或已并入混元大模型研发体系微软的人工智能研究团队 WizardLM 整体加入腾讯 AI 实验室的“混元”团队，标志着腾讯在大模型领域进一步发力。该团队不仅带来了多项技术突破，还通过开源模型展示了其研发实力。 ✨ 曾隶属于微软的 WizardLM 团队整体加入腾讯混元团队，强化了腾讯在大模型领域的竞争力。

【总结】✨ 曾隶属于微软的 WizardLM 团队整体加入腾讯混元团队，强化了腾讯在大模型领域的竞争力。🚀 Hunyuan-TurboS0416模型首次使用“混元”命名，象征着团队与腾讯的深度融合。💼 腾讯计划大幅增加 AI 投资，目标是在全球 AI 竞争中占据更为主导的地位。

6. 腾讯宣布混元图像2.0将于5月16日全新发布

腾讯宣布混元图像2.0将于5月16日全新发布腾讯混元大模型团队宣布，混元图像2.0将在5月16日发布，这是腾讯在AI视觉领域的重要突破，以‘更智能、更开放、更中国’为核心理念。 🌟 混元图像2.0将于5月16日发布，标志着腾讯在AI视觉领域的又一重要进展。

【总结】🌟 混元图像2.0将于5月16日发布，标志着腾讯在AI视觉领域的又一重要进展。🌐 新工具强调‘更智能、更开放、更中国’，助力创作者和企业迈向AI驱动的视觉生产新时代。🚀 继去年混元大模型升级后，腾讯再次展示其在人工智能领域的持续创新力。

7. 上海启动人工智能标识生态联盟，小红书和 MiniMax 等首批入盟

上海启动人工智能标识生态联盟，小红书和 MiniMax 等首批入盟本文介绍了上海市成立的人工智能标识生态联盟，该联盟旨在推动人工智能领域的标识技术发展，提高生成内容的透明度和安全性，并通过政策解读和企业合作，为构建可信的人工智能环境奠定基础。 🌟 联盟由上海市委网信办指导，汇聚多家知名企业，目标是提升AI生成内容的透明度和安全性。

【总结】🌟 联盟由上海市委网信办指导，汇聚多家知名企业，目标是提升AI生成内容的透明度和安全性。🔍 国家互联网应急中心和中国电子技术标准化研究院解读相关政策，强调国际规则与中国特色的结合。🤝 小红书、MiniMax等企业参与标识工作实践，探索多种内容的标识方案并积累治理经验。

8. Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频，速度与质量双飞跃

Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频，速度与质量双飞跃! 以色列科技公司Lightricks发布的开源AI视频生成模型LTX-Video-13B精炼模型，以130亿参数为基础，结合多尺度渲染技术和高效量化优化，将视频生成速度提升至10秒以内，同时保持高质量输出。 🚀 采用多尺度渲染技术，10秒内生成高清视频，速度提升5倍以上。

【总结】🚀 采用多尺度渲染技术，10秒内生成高清视频，速度提升5倍以上。🌍 开源模型，支持低显存设备运行，降低AI视频制作成本。🌟 生成速度提升30倍，媲美专业影视作品，重塑内容创作生态。详情链接:https://github.com/Lightricks/LTX-Video

9. 谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题，优化芯片与数据中心，训练速度飙升32.5%

谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题，优化芯片与数据中心，训练速度飙升32.5% 谷歌DeepMind发布的AlphaEvolve是一款结合Gemini大语言模型与进化算法的AI编码代理，它在多个领域展现了强大的自优化能力，包括数据中心调度、芯片设计、AI训练以及数学研究。 🌟 Gemini与进化算法结合，解决复杂问题如芯片优化和数学难题。

【总结】🌟 Gemini与进化算法结合，解决复杂问题如芯片优化和数学难题。🚀 AlphaEvolve优化数据中心调度，回收0.7%全球算力，节省运营成本。🔍 提升AI训练效率，Gemini模型训练速度提升32.5%，展现强大自我优化能力。

10. 腾讯元宝浏览器插件尝鲜版上线Chrome

腾讯元宝浏览器插件尝鲜版上线Chrome 腾讯元宝浏览器插件尝鲜版上线Chrome平台，提供悬浮球、常驻侧边栏和划词工具栏等功能，提升网页浏览与信息处理效率。 ✨悬浮球功能支持一键翻译和总结网页内容，轻松跨越语言障碍并节省阅读时间。

【总结】✨悬浮球功能支持一键翻译和总结网页内容，轻松跨越语言障碍并节省阅读时间。💬常驻侧边栏可高效答疑，支持截图提问，大幅提升信息获取效率。🔍划词工具栏实现选中文本后的即时搜索或翻译，让信息处理更流畅。详情链接:https://yuanbao.tencent.com/download

Previous page 2025-05-16

Next page 2025-05-13

1. 阿里通义万相Wan2.1-VACE开源 号称首个开源的视频编辑统一模型