2025-06-13

2025-06-13T00:00:00Z | 7 minute read | Updated at 2025-06-13T00:00:00Z

小狐狸

1. 阿里开源在手机上运行的3D数字人应用:MNN TaoAvatar,可做虚拟客服、虚拟主播

阿里开源在手机上运行的3D数字人应用:MNN TaoAvatar,可做虚拟客服、虚拟主播 阿里巴巴集团通过开源MNN TaoAvatar,将高保真的3D虚拟形象生成与实时交互能力引入移动设备,为直播、虚拟社交和AR应用带来全新可能性。 ✨ MNN TaoAvatar支持真3D虚拟角色实时生成与驱动,能在手机上以90FPS流畅运行。

【总结】✨ MNN TaoAvatar支持真3D虚拟角色实时生成与驱动,能在手机上以90FPS流畅运行。🌟 结合3D高斯溅射技术,实现毫米级精细控制,确保虚拟角色动作自然同步。🌐 开源生态提供丰富API和工具,支持多模态输入,降低开发门槛,加速技术普及。详情链接:https://github.com/alibaba/MNN

2. MiniMax Agent上线!图像生成+多语言支持 长任务处理更智能

MiniMax Agent上线!图像生成+多语言支持 长任务处理更智能 MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能,全面提升用户体验。 🌟新增智能图像搜索与生成功能,支持复杂场景和创意表达,适用于设计、营销和内容创作。

image.png

【总结】🌟新增智能图像搜索与生成功能,支持复杂场景和创意表达,适用于设计、营销和内容创作。📚引入反思模式,增强长任务处理能力,特别适合需要深度推理的场景,如学术研究或代码调试。🌍新增中文、日文、韩文支持,优化Python绘图功能,填补亚洲语言支持空白,提升本地化体验。详情链接:https://agent.minimax.io

3. 罗永浩数字人直播即将首秀百度电商,再探“AI+IP”带货新模式

罗永浩数字人直播即将首秀百度电商,再探“AI+IP”带货新模式 知名电商主播罗永浩宣布其数字人形象将在百度电商平台开启直播带货,这是他首次尝试数字人直播,背后依托百度的技术支持,展现了‘AI+头部IP’模式的巨大潜力。 罗永浩数字人直播将于6月15日在百度电商开启,标志着头部主播与数字人技术的首次结合。

QQ20250613-102955.png

【总结】罗永浩数字人直播将于6月15日在百度电商开启,标志着头部主播与数字人技术的首次结合。百度电商平台已有超10万数字人主播,数字人直播可使商家运营成本下降超80%,GMV平均提升62%。此次尝试可能推动直播电商行业向智能化、高效率、低成本方向发展。

4. OpenAI员工套现潮达30亿美元,软银成最大‘接盘侠’

OpenAI员工套现潮达30亿美元,软银成最大‘接盘侠’ 本文探讨了OpenAI员工通过多次股权出售累计套现近30亿美元的现象,分析了背后的原因及影响,并揭示了软银作为最大买家的角色。 自2021年以来,OpenAI员工通过多次股权出售累计套现近30亿美元,软银成为最大买家。

【总结】自2021年以来,OpenAI员工通过多次股权出售累计套现近30亿美元,软银成为最大买家。员工股权变现频率高,参与热情不减,但可能加速离职。激烈的AI人才竞争中,OpenAI面临巨大压力,如何留住核心团队是关键挑战。

5. OpenAI重磅升级ChatGPT Projects:深度研究+语音模式

OpenAI重磅升级ChatGPT Projects:深度研究+语音模式 这次ChatGPT Projects的功能更新让人感到非常兴奋。深度研究和语音模式的加入让AI助手变得更加智能和易用,特别是在跨平台协作和移动办公方面有了显著提升。它让用户在处理复杂任务时更加得心应手。 深度研究支持:结合内外部数据,提供精准信息检索,适合复杂场景。

image.png

【总结】深度研究支持:结合内外部数据,提供精准信息检索,适合复杂场景。语音模式集成:通过语音交互提升移动办公便捷性,满足实时协作需求。移动端增强:支持多模态交互,包括文件上传和实时共享,扩展使用场景。详情链接:https://help.openai.com/en/articles/10169521-using-projects-in-chatgpt

6. Meta 新型模型助力机器人在未知环境中实现物体操控

Meta 新型模型助力机器人在未知环境中实现物体操控 Meta 推出的 V-JEPA2模型通过视频和物理交互构建世界模型,使机器人能在动态环境中进行预测和规划,尤其适用于物流和制造业。 🔍 V-JEPA2模型通过观察视频和物理交互构建世界模型,提升机器人在动态环境中的操作能力。

image.png

【总结】🔍 V-JEPA2模型通过观察视频和物理交互构建世界模型,提升机器人在动态环境中的操作能力。🤖 支持零-shot 机器人规划,机器人可操控陌生物体,无需额外训练。📈 广泛应用于物流和制造业,提高机器人适应性并减少重编程需求。详情链接:https://ai.meta.com/vjepa/

7. AMD 与 OpenAI 联合发布强大 AI 芯片:推理性能提升35倍

AMD 与 OpenAI 联合发布强大 AI 芯片:推理性能提升35倍 AMD 与 OpenAI 推出了最新的 Instinct MI400和 MI350系列 AI 芯片,MI350系列显著提升了 AI 计算性能,MI400系列则面向下一代旗舰 AI 计算需求。此外,ROCm7平台进一步推动了 AI 开发者的效率。 🚀 MI350系列 GPU 提供卓越的 AI 计算性能,内存带宽高达8TB/s,推…

image.png

【总结】🚀 MI350系列 GPU 提供卓越的 AI 计算性能,内存带宽高达8TB/s,推理性能提升35倍。🌟 MI400系列专为低精度计算优化,FP4性能可达40petaflops,UALink 技术实现 GPU 无缝互联。🌐 ROCm7平台整合多个顶级 AI 平台,提供超过3.5倍推理性能提升,助力开发者高效工作。

8. Imagen4登陆Gemini!聊天秒变画廊,AI图像生成进入新纪元

Imagen4登陆Gemini!聊天秒变画廊,AI图像生成进入新纪元 Google旗下的Gemini平台通过集成最新一代的Imagen4图像生成模型,实现了从复杂细节到文本渲染的全面升级,同时支持聊天中直接生成和调整图像,为创意设计、营销及教育等领域提供强大支持。 ✨ 细节呈现卓越:复杂织物、动物毛发等细节清晰逼真,媲美专业摄影。

QQ20250613-103026.jpg

【总结】✨ 细节呈现卓越:复杂织物、动物毛发等细节清晰逼真,媲美专业摄影。💬 交互体验升级:聊天生成图像,支持实时调整,创作效率大幅提升。🌟 应用场景广泛:适用于设计、营销、教育等,支持2K分辨率,满足多领域需求。

9. 谷歌 AI 助力气候预测:打破传统模型的局限,精确到10公里

谷歌 AI 助力气候预测:打破传统模型的局限,精确到10公里! 本文介绍了谷歌研究人员结合物理建模与生成AI的新方法,通过动态生成下采样法和R2D2模型,将全球气候预测提升至约10公里的分辨率,大幅降低计算成本并提高预测准确性。 🌍 利用AI技术将全球气候预测转化为10公里分辨率的地方预测,缩小模型与实际需求间的差距。

image.png

【总结】🌍 利用AI技术将全球气候预测转化为10公里分辨率的地方预测,缩小模型与实际需求间的差距。⚡️ R2D2模型结合物理与AI优势,提升预测准确性且能高效推广至未见过的情景。💰 新方法显著降低计算成本,仅为传统高分辨率模拟所需的一小部分,适用于更多领域。详情链接:https://research.google/blog/zooming-in-efficient-regional-environmental-risk-assessment-with-generative-ai/

10. 加速发展:Gartner 预测生成 AI 应用将实现50% 的交付时间缩减

加速发展:Gartner 预测生成 AI 应用将实现50% 的交付时间缩减 Gartner 预测到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,这将使交付时间缩短50%。RAG 技术的应用能够显著提升生成 AI 模型的准确性和可靠性,同时简化数据治理过程。 🌟预计到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,交付时间缩短50%。

【总结】🌟预计到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,交付时间缩短50%。🚀检索增强生成(RAG)将成为开发生成 AI 应用的重要基础,提供灵活性和可解释性。🔍Gartner 建议企业评估现有平台的转型潜力,整合 RAG 技术并利用元数据保护安全。

comments powered by Disqus

© 2019 - 2025 PhantomDream | AIGC Labs

AIGC小狐狸 | AIGC Research & Innovation | Contact: vortex750@hotmail.com

About Me

💼 With 9 years of hands-on algorithm engineering experience, I’ve also led teams for 5 years, guiding the development of cutting - edge solutions in various domains.

🖥️My expertise spans Computer Vision, Computer Graphics, and Combinatorial Optimization. These fields allow me to approach problems from multiple angles and create comprehensive solutions.

🔍My research interests include Diffusion, NerF, and AIGC(AI - Generated Content). These areas push the boundaries of what ’s possible in technology, enabling new forms of creativity and interaction.

Sponsor Me

如果你喜欢我的作品或者发现它们对你有所帮助,可以考虑给我买一杯咖啡 ☕️。这将激励我在未来创作和维护更多的项目。🦾

👉 请我喝一杯咖啡

If you like my works or find them helpful, please consider buying me a cup of coffee ☕️. It inspires me to create and maintain more projects in the future. 🦾

👉 Buy me a coffee