微软在Ignite 2024发布Copilot+新功能

在这里插入图片描述

🦉 AI新闻

🚀 微软在Ignite 2024发布Copilot+新功能

摘要：微软在Ignite 2024大会上宣布，Microsoft 365 Copilot将利用Copilot+ PC中的NPU本地运行AI模型，减少网络依赖。此功能将提升用户在Outlook和Word中的AI写作辅助体验。同时，Windows Recall功能因安全问题推迟，微软承诺改进其安全性。新发布的Windows Copilot Runtime为开发者提供了图像处理API，计划在2025年推出，预计将吸引更多应用程序使用这一技术。

🚀 首个自发性视觉语言模型LLaVA-o1发布

摘要：由北京大学、清华大学等机构联合研发的LLaVA-o1是一款首个具备自发性和系统性推理能力的视觉语言模型，拥有110亿个参数，基于Llama-3.2-Vision-Instruct模型。该模型设计有总结、描述、推理和结论四个推理阶段，能通过阶段级束搜索技术生成多个候选答案。LLaVA-o1在复杂视觉问答任务中表现优异，提升了多模态推理基准测试的性能，填补了文本与视觉问答模型间的空白。

🚀 Mistral AI发布多模态AI模型Pixtral Large

摘要：Mistral AI于11月18日推出全新多模态AI模型Pixtral Large，该模型具有1240亿参数，能够处理文本和图像。该模型在MathVista等多个基准测试中表现优异，尤其在MathVista中识别准确率达到69.4%，超越了竞争对手。Pixtral Large配备123B的多模态解码器和1B的视觉编码器，支持128K上下文窗口，能处理至少30张高分辨率图像，展现出强大的视觉数据处理及推理能力。

🚀 阿里推出Qwen2.5-Turbo AI模型

摘要：阿里通义千问近日发布了Qwen2.5-Turbo开源AI模型，显著提升了上下文长度到100万tokens，标志着在处理长文本时的重大进步。该模型在多项基准测试中超越了GPT-4，并通过稀疏注意力机制将处理时间缩短至68秒。同时，Qwen2.5-Turbo的处理成本也保持在每百万个tokens仅为0.3元，显示出更强的经济性。尽管表现优异，团队仍承诺将持续优化模型以应对实际应用中的挑战。

🚀 腾讯混元大模型负责人刘威离职

摘要：腾讯杰出科学家刘威已从公司离职，曾担任混元大模型技术负责人，长期从事计算机视觉和机器学习研究。他在多个国际会议中发表重要演讲，并获得诸多荣誉，包括2023 IEEE Fellow。刘威于2017年加盟腾讯AI Lab，推动了混元大模型的发展，最新发布的腾讯混元 Turbo在效率和成本上有显著提升。

更多AI工具 Github-AiBard123