L - SegmentFault 思否

L

2

获赞数

14

关注数

0

粉丝数

IP 属地广东

2026-04-05 加入

浏览 367

主页回答提问文章6

╭╮╱╭┳━━━┳╮╱╭╮
┃┃╱┃┃╭━╮┃┃╱┃┃
┃╰━╯┃┃┃┃┃╰━╯┃
╰━━╮┃┃┃┃┣━━╮┃
╱╱╱┃┃╰━╯┃╱╱┃┃

个人简介什么都没有

1 声望

openai

0

sse

0

后端

0

go

0

nginx

0

黄金勋章

暂未获得该勋章

白银勋章

暂未获得该勋章

1 青铜勋章

个人动态

发布了文章4 月 29 日
AI 面试 Copilot 多模态融合（语音+文本）流式权重决策：6 段流水线 + 反压调度 + 错峰实测
 L
多模态融合不是简单加权 —— 语音（partial ASR + 韵律 + 静默）和文本（候选人简历 + JD + 知识库）必须按段动态调权，单一固定权重在面试场景 Recall 掉 18-23%。
发布了文章4 月 28 日
实时 AI Copilot 端到端延迟预算分配：从 SLO 反推 5 段链路边界（含并行优化路径 + 实测数据）
L
5 段链路各自必须有独立预算：VAD(80ms) + ASR 流式首包(280ms) + Prompt 装配(40ms) + LLM 首 Token(600ms) + TTS 首包(200ms)
发布了文章4 月 27 日
Whisper STT 在面试场景的部署优化：从端到端 1.2s 到 350ms
L
模型选型：默认 large-v3 → 换成 distil-whisper-large-v3 (蒸馏版)，精度损失 < 1.5% WER，推理速度 5.4×
发布了文章4 月 25 日
700ms 内推送面试回答？AI 面试 copilot 延迟优化全链路拆解
 L
系统音频采集走 OS 层（macOS Core Audio Tap / Windows WASAPI Loopback），绕开浏览器，600ms → 200ms
发布了文章4 月 24 日
实时面试辅助系统的延迟优化：从3秒到700ms的工程实践
 L
实时语音问答场景对延迟极度敏感。面试官问完问题到候选人开口回答，通常只有2-3秒的思考缓冲。本文从ASR、LLM推理、网络传输三个层面，拆解实时面试辅助系统（面试copilot）把端到端延迟从常见的2-3秒压缩到1秒以内的工程实现。