人工智能，开源，开源代码，开源项目-第3页

更新

浏览

开源五连招，其中三个是MoE

大模型的快节奏发展，让了解最新技术动态、积极主动学习成为每一位从业者的必修课。 InfoQ研究中心期望通过每周更新大模型行业最新动态，为广大读者提供全面的行业回顾和要点分析。现在，让我...

micro1年前

2116

UC伯克利等开源全新SOTA推理模型

近日，斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B，性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。32B推理模型，仅用1/8数据，与同尺寸...

micro2个月前

16211

百舸争流的AI市场，训练数据才是关键变数？

智源大模型技术版图再填一员——BAAI General Embedding，中英文测评全面超过OpenAI、Meta等。语义向量模型（Embedding Model）已经被广泛应用于搜索、推荐、数据挖掘等重要领域。在大模型时代...

innov2年前

10811

快手Agents系统、模型、数据全部开源！

7B 大小的模型也能玩转 AI Agents 了？近期，快手开源了「KwaiAgents」，问它周末滑雪问题，它不但帮你找到场地，连当天的天气都帮你考虑周到了。打开网易新闻查看更多图片大家都知道大语...

micro2年前

17811

苹果一次性开源了8个大模型！

不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架，涵盖训练日志、多个保存点和预训练设置。同时升级计算机视觉工具包 CVNets 为 CoreNet！支持 OpenELM！ ▲图1.由Stable D...

micro1年前

2225

北大团队搞定ChatGPT都头痛的算法优化，普通笔电就能跑

连ChatGPT看了都直摇头的算法优化，被北大团队给搞定了。测试表明，新研究能解验证集中90%的题目，包括NOIP、Codeforce、Leetcode等比赛中的分治和动态规划题目——这些题目，很多大模型也难...

micro2年前

807

Yann Lecun ：开源，LLM的局限性、AGI 和人工智能的未来

本文为1194字，建议阅读3分钟图灵奖获得者，Meta 首席科学家 Yann LeCun 最新接受 Lex Fridman 播客采访，整个采访2小时38分，探讨了一大堆内容，讨论了：开源的重要性、LLM 的局限性、为什...

micro1年前

807

英伟达，突然开源！

当地时间6月14日，英伟达开源Nemotron-4 340B（3400亿参数）系列模型。打开网易新闻查看更多图片据英伟达介绍，开发人员可使用该系列模型生成合成数据，用于训练大型语言模型(LLM)，用于医疗...

micro11个月前

29914

LLM生成延迟降低50%！DeepSpeed团队发布FastGen

DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型（LLMs）已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要，从...

micro2年前

12713

天工大模型3.0将于4月17日发布，并将同步开源

日前昆仑万维方面宣布，天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测，并将同步开源。据了解，天工3.0采用4千亿级参数MoE混合专家模型，号称是全球模型参数最大、性能最强...

micro1年前

25613

加载更多

开源五连招，其中三个是MoE

UC伯克利等开源全新SOTA推理模型

百舸争流的AI市场，训练数据才是关键变数？

快手Agents系统、模型、数据全部开源！

苹果一次性开源了8个大模型！

北大团队搞定ChatGPT都头痛的算法优化，普通笔电就能跑

Yann Lecun ：开源，LLM的局限性、AGI 和人工智能的未来

英伟达，突然开源！

LLM生成延迟降低50%！DeepSpeed团队发布FastGen

天工大模型3.0将于4月17日发布，并将同步开源

近期文章

近期评论