英伟达推出AI编程开放大模型StarCoder2系列
日前,英伟达方面联合Hugging Face、ServiceNow发布了AI编程开放大模型StarCoder2系列,其采用了BigCode Open RAIL-M许可证,可允许免版税访问和使用。据了解,该系列模型包括一个由ServiceNo...
清华微软开源全新提示词压缩工具,长度骤降80%!
最近,清华和微软的研究人员提出了一种全新的方法,能在保证输出质量不变的前提下,将提示词压缩到原始长度的20%!在自然语言处理中,有很多信息其实是重复的。如果能将提示词进行有效地压缩...
Llama3,凭什么价值百亿美金?
4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
腾讯混元开放代码和算法,可免费商用
随着AIGC的逐渐普及,你有没有发现越来越多的人开始用大模型自制微信头像?不过,许多文生图大模型仍然存在诸多不足,例如质感不强、图像畸变等。而今,秉持着实用研发思路的腾讯混元文生图大...
AI时代发电厂在京浮出水面
人工智能毫无疑问是当今一项重要议题,通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而,服务AI的基础设施——算力和数据,是限制人工智能发展的瓶颈,也成了进一步讨论的...
马斯克版ChatGPT背后开发工具上线!xAI产品两连发
马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了!就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。 一个用于提示工程和可解释性研究的集成开发环境。 打开网易新闻 查看更...
GPT-4V学会用键鼠上网,人类眼睁睁看着它发帖玩游戏
GPT-4V学会自动操纵电脑,这一天终于还是到来了。只需要给GPT-4V接入鼠标和键盘,它就能根据浏览器界面上网: 打开网易新闻 查看更多图片 甚至还能快速摸清楚“播放音乐”的播放器网站和按钮...
苹果版CUDA来了!专为自家芯片打造,M3 Max可跑每秒迭代2.8次
苹果新发布适用于苹果芯片的机器学习框架MLX,MLX是一个类似于NumPy的阵列框架,旨在为使用苹果硬件的研究人员简化 ML 模型的训练和部署。一直以来,英伟达CUDA称霸天下,使得它在AI领域的势...
媲美GPT-4的开源模型泄露!Mistral老板刚刚证实
Mistral-Medium竟然意外泄露?此前仅能通过API获得,性能直逼GPT-4。CEO最新发声:确有其事,系早期客户员工泄露。但仍表示敬请期待。打开网易新闻 查看更多图片 换句话说,这个版本尚且还是旧...
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!
前谷歌大脑科学家Yi Tay去年3月离职后,创办了一家初创公司。创业一年,他发文表示「痛并快乐着」。 在这篇博文中,我讨论了: 1. 在不同计算提供商中采购计算和差异的经验。我们最大的发现/惊...