Codex 正在推动开源 AI 模型的训练与发布

2025-12-22
阅读 9 分钟
3k
继我们使用 Claude Code 训练开源模型的项目之后,现在我们更进一步,将 Codex 引入这一流程。这里的重点不是“Codex 自己开源模型”,而是让 Codex 作为编码代理,参与并自动化开源模型的训练、评估与发布全流程。为此,我们为 Codex 接入了 Hugging Face Skills 仓库,该仓库包含了许多与机器学习和 AI 相关的“技能”,比...
封面图

经同意的语音克隆

2025-12-22
阅读 3 分钟
2.2k
在这篇博客文章中,我们介绍了“语音同意验证机制 (voice consent gate)”的概念,支持通过明确同意来进行语音克隆。我们还提供了一个 示例 Space 应用 和 相关代码,帮助大家快速上手这一想法。
封面图

流式数据集:效率提升 100 倍!

2025-12-22
阅读 4 分钟
2.3k
现在只需一行代码,就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集,无需下载!无需复杂配置、不占磁盘空间、不再担心 “磁盘已满” 或 429 请求过多错误,立即开始训练 TB 级数据集!性能非常强劲:在 64×H100、256 个并发 worker 环境下,流式加载速度甚至超过本地 SSD!我们优化后的流式系统...
封面图

huggingface_hub 1.0 正式版现已发布:开源机器学习基础五周年回顾

2025-12-13
阅读 6 分钟
3k
简要总结: 经过五年的持续开发,huggingface_hub 发布 v1.0 正式版!这一里程碑标志着这个库的成熟与稳定。它已成为 Python 生态中支撑 20 万个依赖库 的核心组件,并提供访问超过 200 万公开模型、50 万公开数据集 和 100 万 Space 应用 的基础能力。本次更新包含为支持未来十年开源机器学习生态而做出的重大变更,由...
封面图

Hugging Face 论文页面功能指南

2025-12-07
阅读 3 分钟
3.1k
在飞速变化的研究世界中,紧跟最新进展至关重要。为帮助开发者与研究人员把握 人工智能 前沿动态,我们推出了 Daily Papers 页面。自上线以来,Daily Papers 已收录超过 1 万 篇由 AK 与社区研究者精选的高质量论文。
封面图

用开源模型强化你的 OCR 工作流

2025-12-03
阅读 11 分钟
4k
摘要: 强大的视觉语言模型 (Vision-Language Models, VLMs) 的崛起,正在彻底改变文档智能 (Document AI) 的格局。每种模型都有其独特的优势,因此选择合适的模型变得棘手。相比闭源模型,开源权重的模型在成本效率和隐私保护上更具优势。为了帮助你快速上手,我们整理了这份指南。
封面图

用 AI Sheets 解锁图像的力量

2025-11-24
阅读 5 分钟
3.1k
🧭简要概览:Hugging Face AI Sheets 是一款开源工具,能够用 AI 模型增强数据集的处理能力,无需编写任何代码。现在新增视觉功能:可以从图像 (如收据、文档) 中提取数据、根据文本生成图像、甚至编辑图片——一切都能在电子表格中完成。依托 Inference Providers,可调用数千个开放模型。
封面图

LeRobot v0.4.0 正式发布:全面提升开源机器人的学习能力

2025-11-03
阅读 5 分钟
2.5k
我们非常高兴地宣布,LeRobot 迎来一系列重大升级,让开源的机器人学习比以往更强大、更可扩展、也更易用!从重构的数据集到灵活的编辑工具、新的仿真环境,以及面向硬件的全新插件系统,LeRobot 正在持续演进,以满足前沿具身智能 (Embodied AI) 不断发展的需求。
封面图

Gaia2 与 ARE:赋能社区的智能体评测

2025-10-04
阅读 5 分钟
2.5k
在理想情况下,AI 智能体应当是可靠的助手。当接收到任务时,它们能够轻松处理指令中的歧义,构建逐步执行的计划,正确识别所需资源,按计划执行而不被干扰,并在突发事件中灵活适应,同时保持准确性,避免幻觉。
封面图

ZeroGPU Spaces 加速实践:PyTorch 提前编译全解析

2025-09-09
阅读 8 分钟
2.9k
ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件,而不需要因为空闲流量而长期占用 GPU。 它高效、灵活,非常适合演示,不过需要注意的是,ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能,比如生成图像或视频可能需要相当多的时间。在这种情况下,充分利用 H200 硬件,使其...
封面图

HF Papers 直播| 多模态专场

2025-08-21
阅读 3 分钟
1.9k
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场就在明天!
封面图

开源开发者须知:欧盟《人工智能法案》对通用人工智能模型的最新要求

2025-08-20
阅读 13 分钟
2.1k
快速摘要 (TL;DR): 自 2025 年 8 月 2 日起,欧盟《人工智能法》将对通用人工智能(GPAI)模型的提供者模型提供者提出新的合规要求。但是对于用于科研目的,或者是以自由和开源许可证方式发布的模型,则可以获得全部或部分豁免。本指南旨在帮助 AI 开发者判断这些合规要求是否与自己在通用人工智能(GPAI)模型相关的工...
封面图

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族!

2025-08-11
阅读 14 分钟
3.7k
GPT OSS 是 OpenAI 推出的 重量级开放模型,面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型:拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 Mixture‑of‑Experts(MoE)架构,并在 MoE 权重上使用 4‑bit 量化方案 MXFP4。由于 active 参数更少,它们在保持资源占用低的同时...
封面图

Hugging Face 开源 HopeJR 机器臂!今天晚上直播带你深入技术核心

2025-07-17
阅读 1 分钟
1.7k
HopeJR 是一款拥有 23 自由度的开源仿生机械臂系统🦾,支持遥操作控制,具备完成复杂任务的能力,适用于科研与开发场景。整个机械臂用 3D 打印即可完成构建,硬件成本仅约 500 欧元!

HF Papers 直播| AI for Science 专场

2025-07-17
阅读 2 分钟
1.3k
AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平?我们又该如何准确评估它们的科学认知能力和数据分析表现?
封面图

Hugging Face 开源机器人 Reachy Mini 开启预定

2025-07-09
阅读 3 分钟
2k
Reachy Mini 是一款富有表现力的开源机器人,专为人机交互、创意编程和 AI 实验而设计。它价格亲民,体积小巧,却蕴藏着无限可能。无论年龄大小,全球的 AI 开发者都可以通过它共同编程、学习与分享。Reachy Mini 完全支持 Python 编程(并即将支持 JavaScript 和 Scratch),起售价仅为 299 美元,是进入机器人 AI 世界...
封面图

开源人工智能:数字主权的基石

2025-07-01
阅读 3 分钟
1.7k
随着人工智能正在重塑从教育到国防的方方面面,数字主权已不再是一个长期的愿景,而是一个迫在眉睫的现实需求。 为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设,开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。什么是数字主权?数字主权是指一个国家或地区具备能力,依据自...
封面图

nanoVLM: 简洁、轻量的纯 PyTorch 视觉-语言模型训练代码库

2025-06-18
阅读 5 分钟
2.1k
nanoVLM 是使用纯 PyTorch 训练 你自己的视觉语言模型 (VLM) 的 最简单 方式。它是一个轻量级 工具包 ,让你可以在 免费的 Colab Notebook 上启动 VLM 训练。
封面图

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

2025-06-05
阅读 8 分钟
2k
今天,我们介绍了 SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。
封面图

参加 Hugging Face 组织的 Gradio & MCP 智能体主题黑客松

2025-05-28
阅读 2 分钟
2.1k
准备好了吗?一场以智能体(Agent)和模型上下文协议(Model Context Protocol,简称 MCP)为核心的全球在线黑客松即将来袭!本次活动由 Hugging Face 举办,我们将共同探索基于 Anthropic MCP 和 AI Agentic 系统的最新可能性。
封面图

大模型评估排障指南 | 关于可复现性

2025-05-13
阅读 3 分钟
1.4k
这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章:关于推理关于\( \LaTeX \)公式解析关于可复现性假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什么?让我们来探讨一下原因。代码库不同要想复现论文或报告的评估得分并精确到小数点,首先要确保使...
封面图

大模型评估排障指南 | 关于 LaTeX 公式解析

2025-05-08
阅读 3 分钟
1.6k
这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章:关于推理关于 \( \LaTeX \) 公式解析关于可复现性解析 LaTeX 很难。这个问题在评估输出为\( \LaTeX \) 的模型时经常会遇到,例如 Hugging Face 的 数学评估基准。这个基准使用 \( \LaTeX \) 来表示数学领域的计算和符号。评估难点在于对模型输出与标准答案...
封面图

设计即合规: 开放AI生态中的用户数据治理实践

2025-05-01
阅读 6 分钟
2.1k
Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Space)。 在开放生态系统中,用户知情同意的管理方式与那些更 "数据饥渴" 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台,探讨由官方主导项目与社区自主贡献中的用户同意实践模式。与传统的科技平台不...
封面图

大模型评估排障指南 | 关于推理

2025-04-25
阅读 2 分钟
1.6k
这是 大模型评估排障指南 系列文章的第一篇,敬请关注系列文章:关于推理关于 $\LaTeX$ 公式解析关于可复现性模型运行非常慢怎么办?调整 batch size如果你想要评估结果完全可复现 (在特定的输入 prompt 和硬件条件下),你可以把 batch size 可以设为 1。但如果增大 batch size (硬件条件允许的话) 将会加快推理速度。数...
封面图

让 LLM 来评判 | 技巧与提示

2025-04-09
阅读 1 分钟
1.6k
缺乏内部一致性:同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果温度参数不设为 0)。缓解措施:遵循 “自我一致性 (self-consistency)” 设置 prompt,输入模型执行多次并保留多数结果
封面图

Open R1 项目进展第三期

2025-04-07
阅读 7 分钟
1.6k
CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
封面图

Open R1 项目进展第二期

2025-04-01
阅读 5 分钟
1.7k
除此之外,我们还聊聊社区里一些让人兴奋的进展,比如怎么整理出小而精的高质量数据集来微调模型,以及如何在训练和推理时控制推理模型的“思考步数”。
封面图

Open R1 项目进展第一期

2025-03-29
阅读 6 分钟
1.6k
DeepSeek R1 发布已经两周了,而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊:Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展我们对 DeepSeek-R1 的认识和相关讨论DeepSeek-R1 发布后社区搞出来的有趣项目这既是项目的最新动态,也是一些关于 DeepSeek-R1 的有趣资料...
封面图

为什么 AI 模型离科学革命还差得很远?

2025-03-27
阅读 3 分钟
1.3k
这个“压缩的 21 世纪”概念来自 Dario 的文章《Machine of Loving Grace》,强烈推荐大家读一读。这是一篇值得深思的好文章。文章的核心观点是,在未来一两年内,我们将拥有一个“装在数据中心里的爱因斯坦之国”,所有 21 世纪的科学发现将在短短 5 到 10 年内被一股脑地完成,从而压缩了整个世纪的科技进程。
封面图

常见的 AI 模型格式

2025-03-27
阅读 5 分钟
2.7k
过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布,并被用于实际应用中。然而,开发者在使用这些模型时面临的一个挑战是模型格式的多样性。
封面图