2025-06-09

2025-06-09T00:00:00Z | 7 minute read | Updated at 2025-06-09T00:00:00Z

小狐狸

1. 通义千问3大模型全球爆火:下载量超1250万,衍生模型13万+

通义千问3大模型全球爆火:下载量超1250万,衍生模型13万+ 通义千问3大模型开源后一个月内全球下载量突破1250万次,在多个主流AI开源平台上表现出色,尤其在Hugging Face平台上衍生模型数量超过13万个,跃居全球第一。 🚀开源仅一个月,全球累计下载量突破1250万次,展现强劲吸引力。

【总结】🚀开源仅一个月,全球累计下载量突破1250万次,展现强劲吸引力。🌐支持多版本选择,各版本下载量均破百万,覆盖广泛需求。🌟衍生模型数量超13万,跃居Hugging Face全球第一,体现高度创新活力。

2. 即梦图片3.0智能参考全量上线!一键生成影视级海报,AI设计进入“零门槛”时代

即梦图片3.0智能参考全量上线!一键生成影视级海报,AI设计进入“零门槛”时代! 字节跳动旗下AI创作平台即梦AI更新,其智能参考功能上线,大幅降低设计门槛,使普通用户也能轻松创作专业级海报。 ✨ 强大的中文理解能力,影视级生成效果,颠覆传统设计流程。

image.png

【总结】✨ 强大的中文理解能力,影视级生成效果,颠覆传统设计流程。🌟 支持一键生成符合特定风格的设计作品,涵盖多种场景应用。💯 细节保留精准,成本低,效率高,适合各层次用户快速实现创意。

3. 智谱AI全新企业级超级助手Agent CoCo正式上线

智谱AI全新企业级超级助手Agent CoCo正式上线 今日,智谱AI发布企业级超级助手Agent CoCo,以‘懂你懂企业,能干能交付’为核心理念,提升企业工作效率。 🌟 CoCo以交付为导向,全流程辅助工作,确保任务成果最大化。

image.png

【总结】🌟 CoCo以交付为导向,全流程辅助工作,确保任务成果最大化。💼 引入独特记忆机制,提供个性化服务,主动跟踪行业动态。🔗 可无缝嵌入企业系统,融合已有资源,打造专属智能助手。详情链接:https://aiworker.aminer.cn/ai_worker/verification?utm_source=zhipuai_social&utm_medium=wechat&utm_campaign=p250609

4. 百度推出金融行业大模型,智能体成为AI竞争新焦点

百度推出金融行业大模型,智能体成为AI竞争新焦点 在2025智能经济论坛上,百度智能云发布了千帆慧金大模型,专为金融行业设计,旨在提供更精准高效的AI解决方案。沈抖强调了行业大模型建设的重要性,并展示了百度在智能体方面的创新成果。 📊 百度智能云推出千帆慧金大模型,专注金融领域,满足行业对准确性与实时性的高要求。

image.png

【总结】📊 百度智能云推出千帆慧金大模型,专注金融领域,满足行业对准确性与实时性的高要求。💼 百度已与65%的央企合作,证明智能云技术受到市场的广泛认可。🤖 智能体成为AI竞争新焦点,百度通过轻量化定制助力企业数字化转型。

5. 小红书发布首个开源大模型dots.llm1:11.2万亿非合成数据助力中文性能提升

小红书发布首个开源大模型dots.llm1:11.2万亿非合成数据助力中文性能提升 小红书开源首个大规模模型dots.llm1,具有1420亿参数的专家混合模型,使用11.2万亿非合成高质量数据,在中文测试中表现优异。 🌟 dots.llm1采用1420亿参数的专家混合结构,大幅降低训练和推理成本。

【总结】🌟 dots.llm1采用1420亿参数的专家混合结构,大幅降低训练和推理成本。📊 使用11.2万亿非合成数据,中文测试平均得分91.3,超越多款竞品。🔍 引入严格的数据处理流水线,确保高质量训练数据的有效性与可靠性。详情链接:https://huggingface.co/rednote-hilab/dots.llm1.base/tree/main

6. 机械臂也能“接大模型”!Hugging Face LeRobot重磅开源,AI机器人研发门槛大降

机械臂也能“接大模型”!Hugging Face LeRobot重磅开源,AI机器人研发门槛大降! Hugging Face推出的LeRobot项目通过整合先进算法和开发工具链,提供了一个高效、易用的机器人AI开发平台,显著降低了硬件适配成本和技术门槛。 统一接口适配多款硬件,降低开发者硬件适配成本。

image.png

【总结】统一接口适配多款硬件,降低开发者硬件适配成本。内置海量预训练模型,支持快速加载SOTA机器人控制模型。智能评估与高效训练功能,加速开发进程并提升模型复用效率。详情链接:https://github.com/huggingface/lerobot

7. ChatGPT 语音功能升级,实时翻译对话更自然流畅

ChatGPT 语音功能升级,实时翻译对话更自然流畅 OpenAI对ChatGPT的语音功能进行了全面升级,包括自然流畅的语音表达和新增的实时翻译功能,但仍有音频质量和“幻觉”现象的问题。 🌟语音更自然流畅,情感表达更丰富。

【总结】🌟语音更自然流畅,情感表达更丰富。🌍新增实时翻译功能,支持多语言对话。⚠️存在音频质量波动和无故生成奇怪声音的问题。

8. 谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足

谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足 自2025年4月底以来,谷歌的 Gemini 应用在全球 Android 下载量上超过了 ChatGPT,每周安装量达到600万以上,但用户活跃度仅为4.9%,远低于 ChatGPT 的42.52%。尽管下载量增长显著,Gemini 面临着提升用户日常使用率的挑战。 🌟 Gemini 应用下载量已达每周600万,超越 Cha…

【总结】🌟 Gemini 应用下载量已达每周600万,超越 ChatGPT。📉 ChatGPT 的下载量降至每周300万,但用户活跃度仍高达42.52%。🔄 Gemini 需提升用户日常活跃度,以确保在市场中的长期竞争力。

9. 文档解析LLM MonkeyOCR震撼登场:3B小模型完胜Gemini

文档解析LLM MonkeyOCR震撼登场:3B小模型完胜Gemini 作为一款轻量级文档解析模型,MonkeyOCR以3B参数量在英文文档解析任务中表现出色,尤其在公式和表格解析上有显著提升。它不仅速度快,还采用了创新的‘结构-识别-关系’三元组范式,为行业带来新的技术方向。 猴子 🐒 MonkeyOCR以3B参数量在多种文档解析任务中超越Gemini2.5Pro和Qwen2.5-VL-72B,…

image.png

【总结】猴子 🐒 MonkeyOCR以3B参数量在多种文档解析任务中超越Gemini2.5Pro和Qwen2.5-VL-72B,尤其在公式解析上提升15.0%。闪电 ⚡ MonkeyOCR解析速度达0.84页/秒,远超MinerU和Qwen2.5-VL-7B,适合企业级快速响应需求。齿轮 🔧 其‘结构-识别-关系’三元组范式提升了解析准确率,同时降低资源需求,为企业提供灵活的AI解析方案。详情链接:https://arxiv.org/abs/2506.05218

10. Google Veo3FAST/TURBO模式上线!五倍性价比,AI视频生成进入“超速”时代

Google Veo3FAST/TURBO模式上线!五倍性价比,AI视频生成进入“超速”时代! Google推出了Veo3的全新FAST/TURBO模式,大幅降低视频生成成本并提高效率,同时支持带声音的视频输出,为内容创作者提供更多可能性。 FAST/TURBO模式以五倍性价比优势,大幅降低生成成本,适合高频次视频制作需求。

image.png

【总结】FAST/TURBO模式以五倍性价比优势,大幅降低生成成本,适合高频次视频制作需求。支持原生音频生成,实现音画同步,大幅提升沉浸式体验。兼具快速生成与高质量细节表现,满足从社交媒体到专业领域的多样化需求。

11. Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”

Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流” Google 将调整其 AI 模型使用政策,停止向免费用户提供 Gemini2.5Pro 系列模型的调用权限,转向基于 API 密钥的使用系统。尽管如此,免费用户仍可使用 Gemini2.0系列模型,但能力有限。 💎 Google 官方宣布停止免费调用 Gemini2.5Pro 系列模型,转向 API 密…

【总结】💎 Google 官方宣布停止免费调用 Gemini2.5Pro 系列模型,转向 API 密钥认证。🚀 当前免费用户仍能使用 Gemini2.0系列模型,但性能不及 Gemini2.5Pro。🌟 开发者需权衡性能与成本,未来高性能模型或将全面商业化。

comments powered by Disqus

© 2019 - 2025 PhantomDream | AIGC Labs

AIGC小狐狸 | AIGC Research & Innovation | Contact: vortex750@hotmail.com

About Me

💼 With 9 years of hands-on algorithm engineering experience, I’ve also led teams for 5 years, guiding the development of cutting - edge solutions in various domains.

🖥️My expertise spans Computer Vision, Computer Graphics, and Combinatorial Optimization. These fields allow me to approach problems from multiple angles and create comprehensive solutions.

🔍My research interests include Diffusion, NerF, and AIGC(AI - Generated Content). These areas push the boundaries of what ’s possible in technology, enabling new forms of creativity and interaction.

Sponsor Me

如果你喜欢我的作品或者发现它们对你有所帮助,可以考虑给我买一杯咖啡 ☕️。这将激励我在未来创作和维护更多的项目。🦾

👉 请我喝一杯咖啡

If you like my works or find them helpful, please consider buying me a cup of coffee ☕️. It inspires me to create and maintain more projects in the future. 🦾

👉 Buy me a coffee