排序
美国朝DeepSeek打了一记重拳,斯坦福团队花146元复现AI模型
围绕中国开源 AI 公司深度求索(DeepSeek)热潮不断加剧,已成为全民热议的话题,同时也掀起一股新的AI热潮。而当前,美国企业界、学术界、政府机构纷纷开启“反击”热潮。首先是美国企业层面,...
英伟达推出AI编程开放大模型StarCoder2系列
日前,英伟达方面联合Hugging Face、ServiceNow发布了AI编程开放大模型StarCoder2系列,其采用了BigCode Open RAIL-M许可证,可允许免版税访问和使用。据了解,该系列模型包括一个由ServiceNo...
Meta 发布全球最大开源模型Llama 3.1 405B
要点总结: 最大的模型 Llama 3.1 405B 也会开源。马克·扎克伯格发布公开信,详细了解开源为何对开发者、对 Meta 和对世界都有好处。 最新模型将上下文长度扩展到 128K、增加了对八种...
苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型
苹果M系列芯片专属的机器学习框架,开源即爆火!现在,用上这个框架,你就能直接在苹果GPU上跑70亿参数大模型、训练Transformer模型或是搞LoRA微调。它由苹果官方发布,风格与PyTorch相似,不...
新越狱方法让Stable Diffusion和DALL·E 2忽略安全规则
Stable Diffusion 是 公司的一款文生图大模型,DALL·E 2 则是 公司的一款文生图大模型。近日,一组研究人员让这两款大模型能够做到无视已被设定好的安全规则,创建出包含裸体、肢解尸体、暴力...
虚拟和现实世界已分不清!OpenAI首个AI视频模型
OpenAI Sora宣传视频(00:59)“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且...
北大发起 Open-Sora计划:旨在复现Sora模型
北京大学Yuangroup团队发起了一个 Open-Sora开源计划,旨在复制OpenAI(close AI)的视频生成模型sora 本项目希望通过开源社区的力量复现Sora,由北大-兔展AIGC联合实验室共同发起,当前...
中文LLaMA-2刷榜,千元预算,效果媲美主流大模型
最强中文版LLaMA-2来了!15小时训练,仅需数千元算力,性能碾压同级中文汉化模型,开源可商用。LLaMA-2相较于LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步...
GPT-4自我迭代,过程可控可解释
微软斯坦福研究人员发表新论文,提出STOP系统,通过迭代优化算法,让GPT-4能够针对任务,自我改进输出代码。这种不用改变模型权重和结构的自我优化方法,可以避免出现「自我进化的AI系统」的...
ChatGPT参数规模被扒:只有7B
ChatGPT惨遭攻击,参数规模终于被扒出来了——很可能只有7B(70亿)。消息来自南加州大学最新研究,他们使用一种攻击方法,花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。打开...