开源 第3页
开源五连招,其中三个是MoE-开放智能

开源五连招,其中三个是MoE

 大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。 InfoQ研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面的行业回顾和要点分析。现在,让我...
micro的头像-开放智能micro1年前
2116
UC伯克利等开源全新SOTA推理模型-开放智能

UC伯克利等开源全新SOTA推理模型

近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。32B推理模型,仅用1/8数据,与同尺寸...
micro的头像-开放智能micro2个月前
16211
百舸争流的AI市场,训练数据才是关键变数?-开放智能

百舸争流的AI市场,训练数据才是关键变数?

智源大模型技术版图再填一员——BAAI General Embedding,中英文测评全面超过OpenAI、Meta等。语义向量模型(Embedding Model)已经被广泛应用于搜索、推荐、数据挖掘等重要领域。在大模型时代...
innov的头像-开放智能innov2年前
10811
快手Agents系统、模型、数据全部开源!-开放智能

快手Agents系统、模型、数据全部开源!

7B 大小的模型也能玩转 AI Agents 了?近期,快手开源了「KwaiAgents」,问它周末滑雪问题,它不但帮你找到场地,连当天的天气都帮你考虑周到了。  打开网易新闻 查看更多图片 大家都知道大语...
micro的头像-开放智能micro2年前
17811
苹果一次性开源了8个大模型!-开放智能

苹果一次性开源了8个大模型!

 不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级计算机视觉工具包 CVNets 为 CoreNet!支持 OpenELM! ▲图1.由Stable D...
micro的头像-开放智能micro1年前
2225
北大团队搞定ChatGPT都头痛的算法优化,普通笔电就能跑-开放智能

北大团队搞定ChatGPT都头痛的算法优化,普通笔电就能跑

 连ChatGPT看了都直摇头的算法优化,被北大团队给搞定了。测试表明,新研究能解验证集中90%的题目,包括NOIP、Codeforce、Leetcode等比赛中的分治和动态规划题目——这些题目,很多大模型也难...
micro的头像-开放智能micro2年前
807
Yann Lecun :开源,LLM的局限性、AGI 和人工智能的未来-开放智能

Yann Lecun :开源,LLM的局限性、AGI 和人工智能的未来

  本文为1194字,建议阅读3分钟图灵奖获得者,Meta 首席科学家 Yann LeCun 最新接受 Lex Fridman 播客采访,整个采访2小时38分,探讨了一大堆内容,讨论了:开源的重要性、LLM 的局限性、为什...
micro的头像-开放智能micro1年前
807
英伟达,突然开源!-开放智能

英伟达,突然开源!

当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。打开网易新闻 查看更多图片 据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗...
micro的头像-开放智能micro11个月前
29914
LLM生成延迟降低50%!DeepSpeed团队发布FastGen-开放智能

LLM生成延迟降低50%!DeepSpeed团队发布FastGen

DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
micro的头像-开放智能micro2年前
12713
天工大模型3.0将于4月17日发布,并将同步开源-开放智能

天工大模型3.0将于4月17日发布,并将同步开源

 日前昆仑万维方面宣布,天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测,并将同步开源。据了解,天工3.0采用4千亿级参数MoE混合专家模型,号称是全球模型参数最大、性能最强...
micro的头像-开放智能micro1年前
25613