开源 第3页
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费-开放智能

GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费

刚刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。打开网易新闻 查看更多图片 不同于一般的数据集测评,大模型竞技场是用户自己...
micro的头像-开放智能micro10个月前
2316
5款大模型中,马斯克的grok1竟是一个复读机?-开放智能

5款大模型中,马斯克的grok1竟是一个复读机?

 就在最近,国产大模型Kimi再次引爆了舆论。3月18日,月之暗面宣布其对话式AI助手产品Kimi智能助手现已支持200万字的无损上下文输入。这个差异化的“长文本处理”的免费大模型,一下子就火出了...
micro的头像-开放智能micro1年前
22911
当前大模型技术超全总结!-开放智能

当前大模型技术超全总结!

本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
micro的头像-开放智能micro11个月前
22912
智谱大模型,有了首个免费的API-开放智能

智谱大模型,有了首个免费的API

最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推...
micro的头像-开放智能micro9个月前
22810
OpenAI Lilian Weng撰文教你从头设计视频生成扩散模型-开放智能

OpenAI Lilian Weng撰文教你从头设计视频生成扩散模型

过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety Systems)负责人 Lilian Weng 写了一篇关于视频生...
micro的头像-开放智能micro1年前
22611
腾讯混元开放代码和算法,可免费商用-开放智能

腾讯混元开放代码和算法,可免费商用

 随着AIGC的逐渐普及,你有没有发现越来越多的人开始用大模型自制微信头像?不过,许多文生图大模型仍然存在诸多不足,例如质感不强、图像畸变等。而今,秉持着实用研发思路的腾讯混元文生图大...
micro的头像-开放智能micro12个月前
2239
苹果一次性开源了8个大模型!-开放智能

苹果一次性开源了8个大模型!

 不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级计算机视觉工具包 CVNets 为 CoreNet!支持 OpenELM! ▲图1.由Stable D...
micro的头像-开放智能micro1年前
2225
LLM上下文窗口突破200万!无需架构变化+复杂微调-开放智能

LLM上下文窗口突破200万!无需架构变化+复杂微调

 LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文...
micro的头像-开放智能micro1年前
2206
3140亿参数Grok-1推理加速3.8倍-开放智能

3140亿参数Grok-1推理加速3.8倍

马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...
micro的头像-开放智能micro1年前
21710
Meta无限长文本大模型来了:参数仅7B,已开源-开放智能

Meta无限长文本大模型来了:参数仅7B,已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不...
micro的头像-开放智能micro1年前
21110