算法/神经网络 第2页
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!-开放智能

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

 极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
micro的头像-开放智能micro11个月前
19313
首个国产全功能GPU的万卡集群来了!“中国英伟达”-开放智能

首个国产全功能GPU的万卡集群来了!“中国英伟达”

 纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。  打开网易新闻 查看更多图片 这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭...
micro的头像-开放智能micro10个月前
18911
六大顶尖高校联手发布全新Gen4Gen框架-开放智能

六大顶尖高校联手发布全新Gen4Gen框架

 文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
micro的头像-开放智能micro1年前
18712
30年冷板凳,诺贝尔物理学奖得主Hinton的AI往事-开放智能

30年冷板凳,诺贝尔物理学奖得主Hinton的AI往事

 原文 | 《纽约时报》,翻译 | 适道 上世纪80年代,Hinton看《终结者》时,没有被影片中的AI毁灭世界困扰。相反,他很高兴看到神经网络技术被描绘得如此有前途。  数十年来,Hinton设计了很...
micro的头像-开放智能micro7个月前
18656
Mamba架构第一次做大!混合Transformer,打败Transformer-开放智能

Mamba架构第一次做大!混合Transformer,打败Transformer

 精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
micro的头像-开放智能micro1年前
1859
MIT华人用AI首次发现物理学全新方程-开放智能

MIT华人用AI首次发现物理学全新方程

 刚刚提出了KAN的MIT物理学家Max Tegmark和北大校友刘子鸣,又有一项重磅研究问世了!团队发现,它们用AI发现了物理学中的新方程,从此,AI很可能被引入物理学研究领域,帮助人类物理学家做出...
micro的头像-开放智能micro12个月前
1835
英伟达不是硬件公司,英伟达代表一种未来的系统-开放智能

英伟达不是硬件公司,英伟达代表一种未来的系统

老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...
micro的头像-开放智能micro1年前
1817
加州理工华人用AI颠覆数学证明!-开放智能

加州理工华人用AI颠覆数学证明!

 让陶哲轩大神赞不绝口的形式化研究神器Lean,运行LLM的推理却有个bug。最近,加州理工团队解决了这个bug,把80%以上的数学证明步骤,都自动化了!Lean Copilot,让陶哲轩等众多数学家赞不绝口...
micro的头像-开放智能micro1年前
17715
芯片战争早已打响!谷歌15个月打造首个TPU-开放智能

芯片战争早已打响!谷歌15个月打造首个TPU

 在英伟达统治AI时代硬件的当下,谷歌的TPU却开辟了另一条道路。今天,小编带你了解第一块TPU的前世今生,同时揭开TPU架构的神秘面纱。在计算的历史上,曾被丢弃或过时的想法仍然很有趣,有时...
micro的头像-开放智能micro1年前
1718
带你了解 AKG 正反向算子注册 + 关联流程-开放智能

带你了解 AKG 正反向算子注册 + 关联流程

摘要:简要介绍一下 akg 正反向算子的注册和关联流程。 本文分享自华为云社区《AKG 正反向算子注册 + 关联》,作者:木子_007 。 一、环境 硬件:eulerosv2r8.aarch64 mindspore:1.1 算子注册...
管理员的头像-开放智能钻石会员管理员2年前
1708