搜索[2024],共找到162个文章
OpenAI官方透露GPT-5发布时间,模型能力从高中飞跃到博士!-开放智能

OpenAI官方透露GPT-5发布时间,模型能力从高中飞跃到博士!

  OpenAI首席技术官Mira Murati在专访中透露,备受期待的GPT-5预计将在2025年底或2026年初发布,其智能水平将实现质的飞跃,达到特定任务的“博士级”。人工智能领域即将迎来一次重大突破。Op...
micro的头像-开放智能micro前天
014810
英伟达,突然开源!-开放智能

英伟达,突然开源!

当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。打开网易新闻 查看更多图片 据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗...
揭秘HuggingFace规模最大、质量最高预训练数据集-开放智能

揭秘HuggingFace规模最大、质量最高预训练数据集

 从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
micro的头像-开放智能micro14天前
01325
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!-开放智能

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

 极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
micro的头像-开放智能micro15天前
015513
AI公司HeyGen正逼走中国风投,强制要求红杉中国、真格等-开放智能

AI公司HeyGen正逼走中国风投,强制要求红杉中国、真格等

  钛媒体App 6月8日消息,据报道,成立于深圳、后来把总部迁到美国洛杉矶的生成式 AI 初创公司HeyGen,要求其中国投资者IDG资本、百度风投、红杉中国、真格基金(ZhenFund)把股权卖给美国投资...
micro的头像-开放智能micro15天前
01527
国产文生视频大模型Vidu将迎更新:支持生成32秒内容-开放智能

国产文生视频大模型Vidu将迎更新:支持生成32秒内容

据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。打开网易新闻 查看更多图片 主要...
当前大模型技术超全总结!-开放智能

当前大模型技术超全总结!

本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
全球140+大模型全方位评测结果出炉,智源评测体系发布-开放智能

全球140+大模型全方位评测结果出炉,智源评测体系发布

2024 年 5 月 17 日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外 140 余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本...
micro的头像-开放智能micro31天前
01766
百川新模型冲顶中文测试基准!首款AI助手百小应-开放智能

百川新模型冲顶中文测试基准!首款AI助手百小应

王小川在搜索时期种下的种子,在大模型时代又开花了。他创业的百川智能,刚刚发布了自家首款AI应用,to C的“百小应”。乍一看,这就是个当下大热门的AI助手,但官方强调,这个AI助手啊,它懂搜...
250行代码从头搭建Llama 3,GitHub一天4.6k星!-开放智能

250行代码从头搭建Llama 3,GitHub一天4.6k星!

Llama 3发布一个月后,一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目,引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构,甚至让Andrej Karpathy...