Hugging Face - SegmentFault 思否

Codex 正在推动开源 AI 模型的训练与发布

2025-12-22

阅读 9 分钟

3k

继我们使用 Claude Code 训练开源模型的项目之后，现在我们更进一步，将 Codex 引入这一流程。这里的重点不是“Codex 自己开源模型”，而是让 Codex 作为编码代理，参与并自动化开源模型的训练、评估与发布全流程。为此，我们为 Codex 接入了 Hugging Face Skills 仓库，该仓库包含了许多与机器学习和 AI 相关的“技能”，比...

封面图

经同意的语音克隆

2025-12-22

阅读 3 分钟

2.2k

在这篇博客文章中，我们介绍了“语音同意验证机制 (voice consent gate)”的概念，支持通过明确同意来进行语音克隆。我们还提供了一个示例 Space 应用和相关代码，帮助大家快速上手这一想法。

封面图

流式数据集：效率提升 100 倍！

2025-12-22

阅读 4 分钟

2.3k

现在只需一行代码，就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集，无需下载！无需复杂配置、不占磁盘空间、不再担心 “磁盘已满” 或 429 请求过多错误，立即开始训练 TB 级数据集！性能非常强劲：在 64×H100、256 个并发 worker 环境下，流式加载速度甚至超过本地 SSD！我们优化后的流式系统...

封面图

huggingface_hub 1.0 正式版现已发布：开源机器学习基础五周年回顾

2025-12-13

阅读 6 分钟

3k

简要总结：经过五年的持续开发，huggingface_hub 发布 v1.0 正式版！这一里程碑标志着这个库的成熟与稳定。它已成为 Python 生态中支撑 20 万个依赖库的核心组件，并提供访问超过 200 万公开模型、50 万公开数据集和 100 万 Space 应用的基础能力。本次更新包含为支持未来十年开源机器学习生态而做出的重大变更，由...

封面图

Hugging Face 论文页面功能指南

2025-12-07

阅读 3 分钟

3.1k

在飞速变化的研究世界中，紧跟最新进展至关重要。为帮助开发者与研究人员把握人工智能前沿动态，我们推出了 Daily Papers 页面。自上线以来，Daily Papers 已收录超过 1 万篇由 AK 与社区研究者精选的高质量论文。

封面图

用开源模型强化你的 OCR 工作流

2025-12-03

阅读 11 分钟

4k

摘要: 强大的视觉语言模型 (Vision-Language Models, VLMs) 的崛起，正在彻底改变文档智能 (Document AI) 的格局。每种模型都有其独特的优势，因此选择合适的模型变得棘手。相比闭源模型，开源权重的模型在成本效率和隐私保护上更具优势。为了帮助你快速上手，我们整理了这份指南。

封面图

用 AI Sheets 解锁图像的力量

2025-11-24

阅读 5 分钟

3.1k

🧭简要概览：Hugging Face AI Sheets 是一款开源工具，能够用 AI 模型增强数据集的处理能力，无需编写任何代码。现在新增视觉功能：可以从图像 (如收据、文档) 中提取数据、根据文本生成图像、甚至编辑图片——一切都能在电子表格中完成。依托 Inference Providers，可调用数千个开放模型。

封面图

LeRobot v0.4.0 正式发布：全面提升开源机器人的学习能力

2025-11-03

阅读 5 分钟

2.5k

我们非常高兴地宣布，LeRobot 迎来一系列重大升级，让开源的机器人学习比以往更强大、更可扩展、也更易用！从重构的数据集到灵活的编辑工具、新的仿真环境，以及面向硬件的全新插件系统，LeRobot 正在持续演进，以满足前沿具身智能 (Embodied AI) 不断发展的需求。

封面图

Gaia2 与 ARE：赋能社区的智能体评测

2025-10-04

阅读 5 分钟

2.5k

在理想情况下，AI 智能体应当是可靠的助手。当接收到任务时，它们能够轻松处理指令中的歧义，构建逐步执行的计划，正确识别所需资源，按计划执行而不被干扰，并在突发事件中灵活适应，同时保持准确性，避免幻觉。

封面图

ZeroGPU Spaces 加速实践：PyTorch 提前编译全解析

2025-09-09

阅读 8 分钟

2.9k

ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件，而不需要因为空闲流量而长期占用 GPU。它高效、灵活，非常适合演示，不过需要注意的是，ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能，比如生成图像或视频可能需要相当多的时间。在这种情况下，充分利用 H200 硬件，使其...

封面图

HF Papers 直播｜多模态专场

2025-08-21

阅读 3 分钟

1.9k

由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场就在明天！

封面图

开源开发者须知：欧盟《人工智能法案》对通用人工智能模型的最新要求

2025-08-20

阅读 13 分钟

2.1k

快速摘要 (TL;DR): 自 2025 年 8 月 2 日起，欧盟《人工智能法》将对通用人工智能（GPAI）模型的提供者模型提供者提出新的合规要求。但是对于用于科研目的，或者是以自由和开源许可证方式发布的模型，则可以获得全部或部分豁免。本指南旨在帮助 AI 开发者判断这些合规要求是否与自己在通用人工智能（GPAI）模型相关的工...

封面图

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族！

2025-08-11

阅读 14 分钟

3.7k

GPT OSS 是 OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型：拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 Mixture‑of‑Experts（MoE）架构，并在 MoE 权重上使用 4‑bit 量化方案 MXFP4。由于 active 参数更少，它们在保持资源占用低的同时...

封面图

Hugging Face 开源 HopeJR 机器臂！今天晚上直播带你深入技术核心

2025-07-17

阅读 1 分钟

1.7k

HopeJR 是一款拥有 23 自由度的开源仿生机械臂系统🦾，支持遥操作控制，具备完成复杂任务的能力，适用于科研与开发场景。整个机械臂用 3D 打印即可完成构建，硬件成本仅约 500 欧元！

HF Papers 直播｜ AI for Science 专场

2025-07-17

阅读 2 分钟

1.3k

AI 科学家时代正加速到来，但科研智能体真的做好准备了吗？真实科研场景中，多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平？我们又该如何准确评估它们的科学认知能力和数据分析表现？

封面图

Hugging Face 开源机器人 Reachy Mini 开启预定

2025-07-09

阅读 3 分钟

2k

Reachy Mini 是一款富有表现力的开源机器人，专为人机交互、创意编程和 AI 实验而设计。它价格亲民，体积小巧，却蕴藏着无限可能。无论年龄大小，全球的 AI 开发者都可以通过它共同编程、学习与分享。Reachy Mini 完全支持 Python 编程（并即将支持 JavaScript 和 Scratch），起售价仅为 299 美元，是进入机器人 AI 世界...

封面图

开源人工智能：数字主权的基石

2025-07-01

阅读 3 分钟

1.7k

随着人工智能正在重塑从教育到国防的方方面面，数字主权已不再是一个长期的愿景，而是一个迫在眉睫的现实需求。为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设，开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。什么是数字主权？数字主权是指一个国家或地区具备能力，依据自...

封面图

nanoVLM: 简洁、轻量的纯 PyTorch 视觉-语言模型训练代码库

2025-06-18

阅读 5 分钟

2.1k

nanoVLM 是使用纯 PyTorch 训练你自己的视觉语言模型 (VLM) 的最简单方式。它是一个轻量级工具包，让你可以在免费的 Colab Notebook 上启动 VLM 训练。

封面图

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

2025-06-05

阅读 8 分钟

2k

今天，我们介绍了 SmolVLA，这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型，专为机器人领域设计，并且可以在消费级硬件上运行。

封面图

参加 Hugging Face 组织的 Gradio & MCP 智能体主题黑客松

2025-05-28

阅读 2 分钟

2.1k

准备好了吗？一场以智能体（Agent）和模型上下文协议（Model Context Protocol，简称 MCP）为核心的全球在线黑客松即将来袭！本次活动由 Hugging Face 举办，我们将共同探索基于 Anthropic MCP 和 AI Agentic 系统的最新可能性。

封面图

大模型评估排障指南 | 关于可复现性

2025-05-13

阅读 3 分钟

1.4k

这是大模型评估排障指南系列文章的第三篇，敬请关注系列文章:关于推理关于\( \LaTeX \)公式解析关于可复现性假设你读了一篇最近的新模型技术报告，然后心血来潮想要在本机复现他们的结果，却发现根本没法复现，这是为什么？让我们来探讨一下原因。代码库不同要想复现论文或报告的评估得分并精确到小数点，首先要确保使...

封面图

大模型评估排障指南 | 关于 LaTeX 公式解析

2025-05-08

阅读 3 分钟

1.6k

这是大模型评估排障指南系列文章的第二篇，敬请关注系列文章:关于推理关于 \( \LaTeX \) 公式解析关于可复现性解析 LaTeX 很难。这个问题在评估输出为\( \LaTeX \) 的模型时经常会遇到，例如 Hugging Face 的数学评估基准。这个基准使用 \( \LaTeX \) 来表示数学领域的计算和符号。评估难点在于对模型输出与标准答案...

封面图

设计即合规: 开放AI生态中的用户数据治理实践

2025-05-01

阅读 6 分钟

2.1k

Hugging Face Hub 已成为 AI 协作的核心平台，托管了数万个模型、数据集以及交互式应用程序 (Space)。在开放生态系统中，用户知情同意的管理方式与那些更 "数据饥渴" 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台，探讨由官方主导项目与社区自主贡献中的用户同意实践模式。与传统的科技平台不...

封面图

大模型评估排障指南 | 关于推理

2025-04-25

阅读 2 分钟

1.6k

这是大模型评估排障指南系列文章的第一篇，敬请关注系列文章:关于推理关于 $\LaTeX$ 公式解析关于可复现性模型运行非常慢怎么办？调整 batch size如果你想要评估结果完全可复现 (在特定的输入 prompt 和硬件条件下)，你可以把 batch size 可以设为 1。但如果增大 batch size (硬件条件允许的话) 将会加快推理速度。数...

封面图

让 LLM 来评判 | 技巧与提示

2025-04-09

阅读 1 分钟

1.6k

缺乏内部一致性：同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果温度参数不设为 0)。缓解措施：遵循 “自我一致性 (self-consistency)” 设置 prompt，输入模型执行多次并保留多数结果

封面图

Open R1 项目进展第三期

2025-04-07

阅读 7 分钟

1.6k

CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本，同时包含 C++ 和 Python 双语言解题方案

封面图

Open R1 项目进展第二期

2025-04-01

阅读 5 分钟

1.7k

除此之外，我们还聊聊社区里一些让人兴奋的进展，比如怎么整理出小而精的高质量数据集来微调模型，以及如何在训练和推理时控制推理模型的“思考步数”。

封面图

Open R1 项目进展第一期

2025-03-29

阅读 6 分钟

1.6k

DeepSeek R1 发布已经两周了，而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊:Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展我们对 DeepSeek-R1 的认识和相关讨论DeepSeek-R1 发布后社区搞出来的有趣项目这既是项目的最新动态，也是一些关于 DeepSeek-R1 的有趣资料...

封面图

为什么 AI 模型离科学革命还差得很远？

2025-03-27

阅读 3 分钟

1.3k

这个“压缩的 21 世纪”概念来自 Dario 的文章《Machine of Loving Grace》，强烈推荐大家读一读。这是一篇值得深思的好文章。文章的核心观点是，在未来一两年内，我们将拥有一个“装在数据中心里的爱因斯坦之国”，所有 21 世纪的科学发现将在短短 5 到 10 年内被一股脑地完成，从而压缩了整个世纪的科技进程。

封面图

常见的 AI 模型格式

2025-03-27

阅读 5 分钟

2.7k

过去两年，开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布，并被用于实际应用中。然而，开发者在使用这些模型时面临的一个挑战是模型格式的多样性。

封面图

1

1