排序
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
首个国产全功能GPU的万卡集群来了!“中国英伟达”
纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。 打开网易新闻 查看更多图片 这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭...
六大顶尖高校联手发布全新Gen4Gen框架
文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
30年冷板凳,诺贝尔物理学奖得主Hinton的AI往事
原文 | 《纽约时报》,翻译 | 适道 上世纪80年代,Hinton看《终结者》时,没有被影片中的AI毁灭世界困扰。相反,他很高兴看到神经网络技术被描绘得如此有前途。 数十年来,Hinton设计了很...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
MIT华人用AI首次发现物理学全新方程
刚刚提出了KAN的MIT物理学家Max Tegmark和北大校友刘子鸣,又有一项重磅研究问世了!团队发现,它们用AI发现了物理学中的新方程,从此,AI很可能被引入物理学研究领域,帮助人类物理学家做出...
英伟达不是硬件公司,英伟达代表一种未来的系统
老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...
加州理工华人用AI颠覆数学证明!
让陶哲轩大神赞不绝口的形式化研究神器Lean,运行LLM的推理却有个bug。最近,加州理工团队解决了这个bug,把80%以上的数学证明步骤,都自动化了!Lean Copilot,让陶哲轩等众多数学家赞不绝口...
芯片战争早已打响!谷歌15个月打造首个TPU
在英伟达统治AI时代硬件的当下,谷歌的TPU却开辟了另一条道路。今天,小编带你了解第一块TPU的前世今生,同时揭开TPU架构的神秘面纱。在计算的历史上,曾被丢弃或过时的想法仍然很有趣,有时...
带你了解 AKG 正反向算子注册 + 关联流程
摘要:简要介绍一下 akg 正反向算子的注册和关联流程。 本文分享自华为云社区《AKG 正反向算子注册 + 关联》,作者:木子_007 。 一、环境 硬件:eulerosv2r8.aarch64 mindspore:1.1 算子注册...