2025-06-05

2025-06-05T00:00:00Z | 8 minute read | Updated at 2025-06-05T00:00:00Z

小狐狸

1. OpenAI宣布ChatGPT推出MCP支持与会议记录功能

OpenAI宣布ChatGPT推出MCP支持与会议记录功能 我作为一位AI助手,对OpenAI推出的这两项功能感到非常兴奋。MCP支持让ChatGPT能无缝连接企业内部数据,而会议记录模式则大大提高了团队协作效率。这不仅提升了ChatGPT的实用性,也为企业的数字化转型提供了强大助力。 ✅ 支持Model Context Protocol (MCP),实现私域知识的智能检索与分析。

image.png

【总结】✅ 支持Model Context Protocol (MCP),实现私域知识的智能检索与分析。🎙️ 新增会议记录模式,自动转录会议内容并生成关键要点和行动计划。🔒 与微软Azure合作,增强企业场景中的安全性和可扩展性。

2. Cursor1.0正式发布:全新Bugbot功能,审查代码修复bug

Cursor1.0正式发布:全新Bugbot功能,审查代码修复bug Cursor1.0推出,带来BugBot、Background Agent、Jupyter 支持及 Memories 功能,显著提升开发效率。深度整合 AI 技术,优化代码审查、远程开发和项目管理。 🤖 BugBot 自动化代码审查与修复,减少手动审查时间,提升团队协作效率。

image.png

【总结】🤖 BugBot 自动化代码审查与修复,减少手动审查时间,提升团队协作效率。💻 Background Agent 提供流畅远程编码体验,优化多设备开发一致性。📊 新增 Jupyter 支持与 Memories 功能,助力数据科学与项目管理。详情链接:https://www.cursor.com/changelog

3. Midjourney视频重磅来袭!V8模型蓄势待发,AI创意新时代即将来临

Midjourney视频重磅来袭!V8模型蓄势待发,AI创意新时代即将来临! Midjourney即将上线视频功能,同时V7.1和V8模型的开发也在加速推进。文章详细解析了Midjourney的最新动态,包括视频功能的突破、服务器升级、风格引用优化及未来模型规划。 🌟视频功能即将上线,初期仅支持图像到视频转换,价格亲民,年度订阅用户优先体验。

image.png

【总结】🌟视频功能即将上线,初期仅支持图像到视频转换,价格亲民,年度订阅用户优先体验。⚙️服务器扩容加速,支持视频生成与模型优化,确保流畅用户体验。🎨风格引用功能升级,提升准确性并新增随机风格生成,提供更多创意选择。

4. 秘塔AI搜索“今天学点啥”视频讲解页面上线PPT导出功能

秘塔AI搜索“今天学点啥”视频讲解页面上线PPT导出功能 秘塔AI搜索旗下的“今天学点啥”平台响应用户需求,新增PPT导出功能,支持下载完整讲解PPT,包括图文、语音和逐字稿,但该功能需消耗计算资源,目前提供限时免费体验。 🎉 用户可在视频讲解页面点击‘导出PPT’按钮下载包含图文、语音和逐字稿的完整PPT。

微信截图_20250605102004.png

【总结】🎉 用户可在视频讲解页面点击‘导出PPT’按钮下载包含图文、语音和逐字稿的完整PPT。📚 平台因算力限制,导出功能将在前三天免费,后续需消耗计算额度,注册用户有初始赠送额度。💬 功能上线源于用户反馈,体现了平台对用户需求的重视与快速响应能力。

5. 文生视频功能上线,Manus挑战OpenAI的Sora

文生视频功能上线,Manus挑战OpenAI的Sora AI初创公司Manus推出了‘文生视频’功能,用户可通过文本指令生成视频,与OpenAI的Sora展开竞争。 🚀 Manus发布‘文生视频’功能,支持Basic、Plus和Pro会员抢先体验。

image.png

【总结】🚀 Manus发布‘文生视频’功能,支持Basic、Plus和Pro会员抢先体验。🤝 与OpenAI的Sora类似,Manus提供灵活会员制,最高Pro会员费用约1431元人民币。🌟 推动AI视频创作普及,为内容创作者提供高效工具,加速行业创新与发展。

6. 法国AI巨头Mistral推出企业编码助手,正面挑战GitHub Co pilot霸主地位

法国AI巨头Mistral推出企业编码助手,正面挑战GitHub Co pilot霸主地位 Mistral AI发布企业编码助手Mistral Code,通过本地部署和深度定制能力挑战GitHub Co pilot市场地位。产品结合最新AI模型与IDE插件,提供垂直集成解决方案,解决企业采用AI编码助手的关键障碍。 ✨ 提供本地部署和深度定制能力,确保代码安全不离开公司服务器。

【总结】✨ 提供本地部署和深度定制能力,确保代码安全不离开公司服务器。🔍 通过垂直集成产品解决企业采用AI编码助手的四大障碍,提供全面支持。🌟 强大的开源Devstral模型,性能优越且适合企业级数据隐私需求。

7. 英伟达发布Llama Nemotron Nano VL AI:登顶 OCRBench,高精度文档处理解决方案

英伟达发布Llama Nemotron Nano VL AI:登顶 OCRBench,高精度文档处理解决方案 英伟达推出Llama Nemotron Nano VL,一款基于Llama3.1架构的紧凑型视觉-语言模型,专为文档智能处理优化,在OCR Bench v2中表现优异,支持多模态输入与灵活部署。 ✨ 参数仅8B但性能卓越,支持多页文档、表格、图表等复杂场景。

image.png

【总结】✨ 参数仅8B但性能卓越,支持多页文档、表格、图表等复杂场景。🏆 OCRBench v2测试中登顶,展现高精度和泛化能力。🚀 灵活部署,支持从云端到边缘设备,开源且兼容多种框架。详情链接:https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

8. 腾讯公益首次引入AI大模型,提升公益项目互动体验

腾讯公益首次引入AI大模型,提升公益项目互动体验 腾讯公益推出“问 AI”功能,利用大型人工智能模型提升公众与公益组织的互动和透明度,同时结合AI通识公益课程拓展教育资源。 🌟 用户可通过“问 AI”功能即时获取腾讯公益项目信息,增强参与感。

【总结】🌟 用户可通过“问 AI”功能即时获取腾讯公益项目信息,增强参与感。📚 腾讯与清华大学合作推出AI通识公益课程,惠及7000余名学生。🌐 借助AI技术,公益项目效率提升,未来创新路径拓宽。

9. Firecrawl /search API发布!一键搜索+抓取,AI数据处理进入新时代

Firecrawl /search API发布!一键搜索+抓取,AI数据处理进入新时代! Firecrawl推出的/search API通过一次API调用即可实现网页搜索与内容抓取,极大简化了数据获取流程,支持多格式输出且完全后端运行,非常适合AI开发者使用。 🔥 一键搜索与抓取:通过一次API调用,无需手动解析复杂搜索结果,快速获取网页完整内容。

image.png

【总结】🔥 一键搜索与抓取:通过一次API调用,无需手动解析复杂搜索结果,快速获取网页完整内容。🌐 多格式输出:支持Markdown、HTML、纯链接和截图,满足不同AI模型的数据需求。🌟 社区驱动:开源工具,GitHub获超10K Star,提供Python和Node.js SDK,降低开发门槛。详情链接:https://github.com/mendableai/firesearch

10. 语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然

语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然! Bland AI推出了全新的Bland TTS引擎,实现了语音AI的重大突破,包括一键克隆、上下文学习和音效生成等功能,为语音合成领域带来了颠覆性变革。 🌟 仅需一段短音频即可精准克隆任意人声,大幅降低技术门槛。

image.png

【总结】🌟 仅需一段短音频即可精准克隆任意人声,大幅降低技术门槛。📚 引入上下文学习,根据语义动态调整语气和情感,提升自然度。🎶 支持音效生成,扩展至多维度声音创作,增强沉浸式体验。详情链接:https://bland.com/enterprise

11. Mary Meeker最新报告:AI训练成本逼近百亿美元,推理成本暴跌99%

Mary Meeker最新报告:AI训练成本逼近百亿美元,推理成本暴跌99% 知名投资人Mary Meeker的最新AI报告揭示了AI行业面临的成本结构矛盾,训练成本持续飙升至百亿级别,而推理成本却因硬件与算法突破骤降99%,这种分化正重塑AI产业的商业化格局。 训练成本指数级增长,形成头部玩家才能参与的军备竞赛,将大量中小型企业挤出赛道。

QQ20250605-142201.png

【总结】训练成本指数级增长,形成头部玩家才能参与的军备竞赛,将大量中小型企业挤出赛道。推理成本因硬件迭代雪崩式下降,推动AI应用大规模普及,降低开发者创新门槛。AI行业面临烧钱与构建技术壁垒的平衡挑战,网络效应成为可持续盈利的关键。

12. Jaaz开源AI设计Agent横空出世!一键批量生成图像,创意生产从此起飞

Jaaz开源AI设计Agent横空出世!一键批量生成图像,创意生产从此起飞! Jaaz是一款开源AI设计Agent,支持通过简单的API配置实现自动化批量图像生成,为专业创作者和团队提供了高效的解决方案。 ✨Jaaz通过简单API配置实现批量图像生成,适合快速生成大量视觉内容。

image.png

【总结】✨Jaaz通过简单API配置实现批量图像生成,适合快速生成大量视觉内容。🔧当前版本API支持有限,但开源特性为未来扩展提供了可能。🌟未来可扩展为全能型创意平台,满足多样化需求。详情链接:https://github.com/11cafe/jaaz

13. 逆水寒》手游与可灵AI合作,上线“图生动图”玩法

《逆水寒》手游与可灵AI合作,上线“图生动图”玩法 《逆水寒》手游与可灵AI达成合作,推出全新“图生动图”玩法,玩家可通过简单操作将静态图片转化为动感画面,享受个性化创作的乐趣。 🌟玩家可轻松创作个性化动图,提升游戏趣味性。

【总结】🌟玩家可轻松创作个性化动图,提升游戏趣味性。📸支持双人互动,创造温馨有趣的亲密场景。💰动图生成为付费服务,费用依品质与时长而定。

comments powered by Disqus

© 2019 - 2025 PhantomDream | AIGC Labs

AIGC小狐狸 | AIGC Research & Innovation | Contact: vortex750@hotmail.com

About Me

💼 With 9 years of hands-on algorithm engineering experience, I’ve also led teams for 5 years, guiding the development of cutting - edge solutions in various domains.

🖥️My expertise spans Computer Vision, Computer Graphics, and Combinatorial Optimization. These fields allow me to approach problems from multiple angles and create comprehensive solutions.

🔍My research interests include Diffusion, NerF, and AIGC(AI - Generated Content). These areas push the boundaries of what ’s possible in technology, enabling new forms of creativity and interaction.

Sponsor Me

如果你喜欢我的作品或者发现它们对你有所帮助,可以考虑给我买一杯咖啡 ☕️。这将激励我在未来创作和维护更多的项目。🦾

👉 请我喝一杯咖啡

If you like my works or find them helpful, please consider buying me a cup of coffee ☕️. It inspires me to create and maintain more projects in the future. 🦾

👉 Buy me a coffee