排序
马斯克版ChatGPT背后开发工具上线!xAI产品两连发
马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了!就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。 一个用于提示工程和可解释性研究的集成开发环境。 打开网易新闻 查看更...
秒杀700亿Llama 2!最新国产大模型亮相
国产大模型刚刚出了一位全新选手:参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的Llama 2。并尤其以推理、数学和编码能力为突出。打开网易新闻 查看更多图...
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」
生成式AI正重塑众多行业格局!传统搜索、网站与自由开发者、教育科技等行业受到冲击。AI对行业变革又有哪些推动作用?答案就在报告中。近日,SimilarWeb发布了最新的「全球生成式AI行业趋势」...
小扎砸数百亿美元猛攻开源AGI!
今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。自Llama2、Co...
不到1000行代码,PyTorch团队让Llama 7B提速10倍
PyTorch 团队亲自教你如何加速大模型推理。 在过去的一年里,生成式 AI 发展迅猛,在这当中,文本生成一直是一个特别受欢迎的领域,很多开源项目如 llama.cpp、vLLM 、 MLC-LLM 等,为了取...
智谱大模型,有了首个免费的API
最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推...
Meta无限长文本大模型来了:参数仅7B,已开源
Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不...
英伟达推出AI编程开放大模型StarCoder2系列
日前,英伟达方面联合Hugging Face、ServiceNow发布了AI编程开放大模型StarCoder2系列,其采用了BigCode Open RAIL-M许可证,可允许免版税访问和使用。据了解,该系列模型包括一个由ServiceNo...
承诺十年不套现, 62岁的李开复要陪AI大模型“长跑”
“我个人之所以做这个事情(创办零一万物),是因为这是我40多年的梦想,我在写博士申请信时就提到,AGI是我的梦想,今天,我有了实现这个梦想的机会,而这也是推动我努力的主要动力”。 5月13...
3140亿参数Grok-1推理加速3.8倍
马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...