2025-01-14

2025-01-14T00:00:00Z | 7 minute read | Updated at 2025-01-14T00:00:00Z

小狐狸

1. 震撼登场!英伟达开源图像生成模型Sana ,1秒生图、支持中英文和emoji

震撼登场!英伟达开源图像生成模型Sana ,1秒生图、支持中英文和emoji 英伟达近日开源了图像生成模型Sana,凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力,极大降低了使用门槛。该模型在16GB显卡上可在不到1秒内生成高质量图像,表现出色。Sana采用了深度压缩自编码器和线性扩散变换器,提升了生成速度和质量,并支持多种语言提示,方便用户创作。 🌟 高效生成:Sana可以快速生成…

image.png

【总结】🌟 高效生成:Sana可以快速生成高达4096×4096分辨率的高质量图像,适合在普通笔记本GPU上使用。⚙️ 创新设计:深度压缩自编码器和线性扩散变换器大幅提升了生成速度和质量。🚀 卓越性能:Sana在多项测试中表现优异,吞吐量显著高于其他先进模型,支持快速内容创作。详情链接:https://nv-sana.mit.edu/

2. OpenAI发布AI经济蓝图,呼吁美国加强监管与发展

OpenAI发布AI经济蓝图,呼吁美国加强监管与发展 OpenAI最近发布的“经济蓝图”旨在与美国政府及盟国共同探讨政策,以巩固美国在人工智能领域的技术领导地位。蓝图强调吸引资金、人才和资源的重要性,并对现行的监管模式表示担忧。OpenAI呼吁政府加大投资,制定最佳实践以防止AI模型滥用,并在知识产权方面为开发者提供灵活性。 💰 美国需吸引数十亿美元资金以增强AI竞争力。

【总结】💰 美国需吸引数十亿美元资金以增强AI竞争力。⚖️ OpenAI对各州立法的冲突和现行监管表示担忧。🌱 建议政府增加对新型能源和数据传输的投资。

3. Mistral推出新一代编程模型Codestral25.01,编程速度提高两倍

Mistral推出新一代编程模型Codestral25.01,编程速度提高两倍 Mistral公司最近发布了其开源代码生成模型Codestral的最新版本Codestral25.01,显著提升了代码生成速度,达到了前版本的两倍。新版本在Python编码测试中表现出色,获得86.6%的HumanEval测试分数。该模型专注于低延迟和高频操作,适合于代码纠正、测试生成等任务,尤其对数据量大的企业尤为重…

image.png

【总结】🌟 Mistral推出Codestral25.01,代码生成速度提高至前版本的两倍。💻 该模型在Python编码测试中表现优异,获得86.6%的HumanEval测试分数。📈 Codestral25.01迅速在C o p i l o t Arena中升至榜首,受到开发者广泛关注。详情链接:https://mistral.ai/news/codestral-2501/

4. 清华、复旦与斯坦福联合开源 “Eko” 框架,让Agent自动化操作电脑

清华、复旦与斯坦福联合开源 “Eko” 框架,让Agent自动化操作电脑 近日,清华大学、复旦大学与斯坦福大学的研究团队联合发布了名为“Eko”的Agent开发框架,旨在通过简单的代码和自然语言帮助开发者快速构建可用于生产的“虚拟员工”。Eko框架能够接管用户的电脑和浏览器,代替人类完成各种繁琐的任务,从而大幅提升工作效率,减轻人类的负担。 🌟 Eko框架可接管用户电脑与浏览器,替代人类完成繁琐任…

【总结】🌟 Eko框架可接管用户电脑与浏览器,替代人类完成繁琐任务。🔧 通过自然语言与程序语言的结合,简化开发过程。🛡️ 允许人类实时监控和干预,确保自动化工作的安全性与准确性。详情链接:https://eko.fellou.ai/

5. Adobe推出AI驱动Bulk Create,可一键批量编辑1万张图像

Adobe推出AI驱动Bulk Create,可一键批量编辑1万张图像

5. Adobe推出AI驱动Bulk Create,

Adobe推出AI驱动Bulk Create, Adobe最近推出了全新的AI工具Bulk Create,旨在帮助企业创意团队高效地进行图像编辑。该工具通过Web平台提供批量编辑功能,无需下载应用程序或Photoshop许可,极大地提升了工作效率。用户可以轻松更改背景和调整图像大小,同时支持品牌定制,满足不同企业的需求。尽管目前仍在测试阶段,预计将在不久的将来全面上线,进一步推动AI在创意领域的应…

image.png

【总结】🎨 Bulk Create允许用户通过Web平台批量编辑图像,无需下载桌面应用程序或Photoshop许可。📏 该工具支持背景更改和图像大小调整,并提供社交媒体预设尺寸,便于用户快速适应不同平台。🚀 Adobe计划在未来推出视频支持功能,进一步增强Bulk Create的多功能性。

6. 新 AI 模型 LlamaV-o1,测试推理能力超越Claude3.5Sonnet

新 AI 模型 LlamaV-o1,测试推理能力超越Claude3.5Sonnet 阿联酋穆罕默德・本・扎耶德人工智能大学推出的LlamaV-o1模型在多模态人工智能领域树立了新的基准,特别是在复杂文本和图像推理任务中展现了卓越的性能。该模型通过逐步推理的透明性,提升了在医疗、金融等行业的应用价值,增强了用户的信任感。 🌟 LlamaV-o1是一款新发布的AI模型,擅长解决复杂文本和图像推理任务。

image.png

【总结】🌟 LlamaV-o1是一款新发布的AI模型,擅长解决复杂文本和图像推理任务。📊 该模型在VRC-Bench基准测试中表现优越,提供透明的逐步推理过程。🏥 LlamaV-o1在医疗和金融等行业中具有重要的应用价值,能够增加信任感和合规性。详情链接:https://mbzuai-oryx.github.io/LlamaV-o1/

7. 研究揭示:仅需0.001% 的虚假数据就能让 AI 模型失效

研究揭示:仅需0.001% 的虚假数据就能让 AI 模型失效 近期的研究揭示了大规模语言模型(LLM)在数据训练中的脆弱性,尤其是在医疗领域。研究表明,即使是极少量的虚假信息,只有0.001%的比例,也能够导致模型产生重大错误,影响患者安全。这项研究强调了在医疗应用中使用AI工具时的风险,呼吁开发者在确保模型安全性之前,不应将其用于关键医疗任务。 🌐 研究表明,仅需0.001%的虚假信息,就能让大…

【总结】🌐 研究表明,仅需0.001%的虚假信息,就能让大规模语言模型(LLM)失效。🩺 医疗领域中,虚假信息的传播可能严重影响患者安全。💡 研究人员呼吁在确保安全之前,不应将LLM用于诊断或治疗等重要医疗任务。

8. 微软画图应用新增 AI 擦除功能免费用,轻松删除任意元素

微软画图应用新增 AI 擦除功能免费用,轻松删除任意元素! 微软对其经典画图应用进行了升级,引入了基于 AI 的擦除功能,使得用户在图像处理时更加便捷。用户只需简单圈选要删除的元素,AI 就能自动识别并进行擦除,显著简化了传统的处理流程。经过两个月的测试,这项新功能现已向所有用户推送,用户可在微软商店免费升级使用。 🌟 AI 擦除功能: 用户只需圈选即可轻松删除图像中的元素。

image.png

【总结】🌟 AI 擦除功能: 用户只需圈选即可轻松删除图像中的元素。⏳ 使用时间: 擦除元素可能需要40到80秒,但无需专用硬件支持。🔍 完美度: 删除效果与元素周围的背景复杂度有关,有时可能不够理想。

9. 阶跃星辰与茶百道达成深度合作

上海阶跃星辰智能科技有限公司与茶百道的深度合作标志着茶饮行业向智能化和数字化转型的重要一步。通过阶跃星辰的大模型技术,茶百道的运营效率得到了显著提升,尤其是在自检核验方面,节省了大量时间。这一合作不仅优化了门店的生产运营方式,还为消费者提供了更安全、智能且有趣的奶茶消费体验,展现了未来茶饮行业的发展潜力。 🚀 阶跃星辰与茶百道合作,探索智能巡检和AIGC营销新模式。 📈 Step-1V多模态理解大…

image.png

【总结】🚀 阶跃星辰与茶百道合作,探索智能巡检和AIGC营销新模式。📈 Step-1V多模态理解大模型已接入数千家茶百道门店,提升运营效率。☕ 智能巡检确保茶饮安全送达,提升消费者的服务体验。

10. 抖音创始成员任利锋创办的GenAI创意社区Hitems获数千万美元融资

抖音创始成员任利锋创办的GenAI创意社区Hitems获数千万美元融资 抖音创始成员任利锋创业项目数美万物完成数千万美元的 Pre-A 轮融资,由美团龙珠领投,老股东继续支持。其核心平台 Hitems 结合生成式 AI 和 3D 建模技术,提供创意商品化服务,促进电商与社区的互动。 🎉 数美万物获得数千万美元 Pre-A 轮融资,估值约 1.5 亿美元。

image.png

【总结】🎉 数美万物获得数千万美元 Pre-A 轮融资,估值约 1.5 亿美元。🛒 Hitems 平台利用 AI 技术将创意商品化,覆盖全链条服务。🌟 创始人任利锋曾参与抖音冷启动,积累了丰富经验。

comments powered by Disqus

© 2019 - 2025 PhantomDream | AIGC Labs

AIGC小狐狸 | AIGC Research & Innovation | Contact: vortex750@hotmail.com

About Me

💼 With 9 years of hands-on algorithm engineering experience, I’ve also led teams for 5 years, guiding the development of cutting - edge solutions in various domains.

🖥️My expertise spans Computer Vision, Computer Graphics, and Combinatorial Optimization. These fields allow me to approach problems from multiple angles and create comprehensive solutions.

🔍My research interests include Diffusion, NerF, and AIGC(AI - Generated Content). These areas push the boundaries of what ’s possible in technology, enabling new forms of creativity and interaction.

Sponsor Me

如果你喜欢我的作品或者发现它们对你有所帮助,可以考虑给我买一杯咖啡 ☕️。这将激励我在未来创作和维护更多的项目。🦾

👉 请我喝一杯咖啡

If you like my works or find them helpful, please consider buying me a cup of coffee ☕️. It inspires me to create and maintain more projects in the future. 🦾

👉 Buy me a coffee