米乐m6官网Stability、Mistral、Databri

来源：米乐m6官方网址作者：米乐app官网登录正版下载发布时间：2024-04-09 00:49:07

　　大模型的快节奏发展，让了解最新技术动态、积极主动学习成为每一位从业者的必修课。 InfoQ研究中心期望通过每周更新大模型行业最新动态，为广大读者提供全面的行业回顾和要点分析。现在，让我们回顾过去一周的大模型重大事件吧。

　　距离 Grok-1 的发布仅过去一周，3 月 29 日，马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力，并优化了数学和代码相关任务中的性能。

　　华中科技大学和金山的研究人员在最新的研究《TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document》中提出了一个专注于文本相关任务（包括文档问答和场景文本问答）的多模态大模型 TextMonkey。在多个场景文本和文档的测试中，TextMonkey 处于国际领先地位，在办公自动化、智慧教育、智慧金融等行业有着强大的应用潜力。

　　Suno 团队近日推出的 V3 模型首次实现了生成广播质量的音乐。它可以根据简单的提示创建从歌词到人声和配器的所有内容，甚至可以引导它准确选择想要的流派，从三角洲蓝调（Delta Blues）到电子寒潮，还可以变换方言。

　　来自理海大学、微软研究院的研究者在最新的研究《Mora: Enabling Generalist Video Generation via A Multi-Agent Framework》提出了一种多智能体框架 Mora，该框架整合了几种先进的视觉 AI 智能体，以复制 Sora 所展示的通用视频生成能力。广泛的实验结果表明，Mora 在各种任务中达到了接近 Sora 的性能。然而，当从整体上评估时，Mora 与 Sora 之间存在明显的性能差距。

　　3 月 27 日，创新奇智在北京举办的发布会上发布了更为强大的奇智孔明工业大模型 2.0 版本（ AInno-75B ）。这款大型模型拥有处理多种信息形态的能力，涵盖了文本、图像和视频等。它甚至能够整合工业场景中特有的数据类型，例如计算机辅助设计（CAD）图纸和脑电图（EEG）信号。其输出同样具有多样性，可以生成包括文本、图像、视频、计算机辅助设计图以及具体操作行为等多种形式的信息。

　　3 月 25 日，Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。这是一个基于 Stable Code 3B 的指令调整编码语言模型。给出自然语言 prompt，该模型可以处理各种任务，例如代码生成、数学和其他软件工程相关的任务。这款模型不仅增强了代码补全能力，还支持自然语言交互，旨在提高编程和软件开发相关任务的效率和直观性。

　　跨维智能、香港中文大学（深圳）及华南理工大学的研究人员在《SAM-6D: Segment Anything Model Meets Zero-Shot 6D Object Pose Estimation》中创新性地提出了 SAM-6D 框架，该框架在零样本条件下实现 6D 物体姿态估计。它利用零样本分割技术生成候选对象，并借助独特的物体匹配分数来识别目标物体。此外，SAM-6D 将姿态估计转化为局部到局部的点集匹配问题，通过引入 Background Token 设计和两阶段点集匹配模型，为任意物体的姿态估计提供了有效的解决方案。

　　阿里通义千问重磅升级，向所有人免费开放 1000 万字的长文档处理功能，成为全球文档处理容量第一的 AI 应用。所有金融、法律、科研、医疗、教育等领域的专业人士，都可通过通义千问网站和 APP 快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

　　淘宝天猫集团自研大模型“淘宝星辰”官网已经上线，预计布局之后向公众开放。淘宝星辰的训练数据库中有大量电商消费数据，据推测将会为用户提供面向电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。

　　百度智能云最近一口气升级了 7 个大模型企业级应用，并且全部推出 SaaS 版本，企业在网页端即可使用，无需进行复杂的部署和配置，真正实现了开箱即用。这一举措将大大降低企业使用大模型的门槛，推动大模型技术在企业中的普及和应用。这 7 个应用分别是百度智能云曦灵数字人平台、百度智能云客悦智能客服平台、内容创作平台“一念”、知识管理平台“甄知”、超级办公入口“超级助理”、生成式 BI 产品“百度 GBI”、代码助手“Baidu Comate”。

　　吉林大学、上海交通大学和伦敦大学学院合作提出了 DS-Agent，这一智能体的角色定位是一名数据科学家，其目标是在自动化数据科学中处理复杂的机器学习建模任务。技术层面上，团队采用基于案例的推理策略，赋予了智能体 “参考” 他山之石的能力，使其能够利用以往解决类似问题的经验来解决新问题。相关成果发表在《DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning》中。

　　立志成为 Cognition AI 的 Devin 的竞争性开源替代方案 Devika 已发布。Devika 拥有高级 AI 规划和推理能力，可以进行针对性的上下文关键词提取、多种编程语言的代码编写和状态跟踪和可视化，同时也可以无缝进行网络浏览和信息收集。当然，deviika 也可以通过聊天界面进行自然语言交互，并支持 Claude 3、GPT-4、GPT-3.5 和通过 Ollama 支持的本地语言模型。

　　3 月 26 日，2024 全新英特尔商用客户端AI PC产品发布会在北京举办，基于 ChatGLM 端侧模型打造的「智谱 AI PC 智能助手」也正式发布。该款智能助手是针对英特尔全新的酷睿 Ultra 处理器，在 ChatGLM 端侧模型的基础上训练、适配并部署的最新端侧 AI 模型，拥有高性能、低延迟的特点。在远程管理、安全防护、跨设备 IT 管理和运维等方面可为 PC 用户提供更加轻松、高效的 AI 体验。

　　3 月 28 日，阿里云与知名半导体公司 MediaTek 联发科联合宣布，通义千问 18 亿、40 亿参数大模型已成功部署进天玑 9300 移动平台，可离线流畅运行即时且精准的多轮 AI 对话应用，连续推理功耗增量不到 3W，实现了手机 AI 体验的大幅提升。

　　3 月 28 日，云天励飞举办 AI 大模型产品发布会，正式发布“深目” AI 模盒，实现了算法在线学习、自我迭代。据介绍，该产品能够做到“3 个 90%”——覆盖场景超过 90%、算法精度超过 90%，使用成本降低 90 %。可以说真正地解决大模型在场景落地最后一公里的问题，帮助更多中小企业客户轻松使用大模型。

　　Sora 来袭，国内如何迅速跟上？开源在大模型市场进程中的价值正在被重新定义吗？人型机器人重回视野，其能力是否有所提升和刷新？Devin 和智能编码助手是同一条赛道上的不同节点？多家企业宣布 All in AI，对市场意味着什么？InfoQ 研究中心即将发布的《2024 年第 1 季度大模型监测报告》，即将给出答案。

　　大模型应用挑战赛已拉开帷幕。现阶段，多数语言模型已完成 3 轮更新，大模型赛道入场券所剩无几。同时，2023 年超 200 款大模型产品问世，典型场景又有哪些产品动向？对于现阶段的文生图产品而言，四大维度能力究竟如何？以上问题的回答尽在《2023 年第 4 季度中国大模型季度监测报告》，欢迎大家扫码关注「 AI 前线」公众号，回复「季度报告」领取。

　　AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展将于 5 月 17 日正式开幕，本次大会主题为「智能未来，探索 AI 无限可能」。如您感兴趣，可点击「阅读原文」查看更多详情。

上一篇：助力低碳智慧校园！天正亮相CCLE教育后勤展下一篇：大华股份：大华“数智”孪生-鲁班系列产品运用三维仿

导航

米乐m6官网Stability、Mistral、Databri