English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
ibm.com
Faster LLMs: Accelerate Inference with Speculative Decoding
Isaac Ke explains speculative decoding, a technique that accelerates LLM inference speeds by 2-4x without compromising output quality. Learn how "draft and verify" pairs smaller and larger models to optimize token generation, GPU usage, and resource efficiency.
9 个月之前
Fast Inference from Transformers via Speculative Decoding Transformer Models
25:23
【2026已完结】Transformer模型从零详解,90分钟入门到精通,全程干货讲解!人工智能/深度学习/机器学习/目标检测/图像分割/神经网络/自然语言处理
bilibili
迪哥人工智能课堂
已浏览 1123 次
1 个月前
2:12
【2025已完结】Transformer模型从零详解,入门到进阶,全程干货讲解!-人工智能/深度学习/机器学习/目标检测/图像分割/神经网络/自然语言处理
bilibili
迪哥人工智能课堂
已浏览 2.3万 次
2025年2月10日
8:26
Beyond Speculative Decoding: Jacobi Forcing in LLMs
YouTube
Tales Of Tensors
已浏览 4 次
1 周前
热门视频
How to Quadruple LLM Decoding Performance with Speculative Decoding (SpD) and Microscaling (MX) Formats on Qualcomm® Cloud AI 100
qualcomm.com
2024年8月1日
Speculative Decoding — Think Fast⚡, Then Think Right✅
substack.com
10 个月之前
6:18
What is Speculative Sampling? | Boosting LLM inference speed
YouTube
AssemblyAI
已浏览 3808 次
2024年11月20日
Fast Inference from Transformers via Speculative Decoding NLP Inference Speedup
Natural Language Processing: NLP With Transformers in Python
git.ir
已浏览 2.9万 次
2022年10月19日
Master Natural Language Processing with Transformers
git.ir
已浏览 43 次
2025年2月1日
1:05
杀疯了!Transformer重塑NLP,处理速度快12倍!!
bilibili
AI因斯坦学AI
已浏览 324 次
1 个月前
How to Quadruple LLM Decoding Performance with Speculative Dec
…
2024年8月1日
qualcomm.com
Speculative Decoding — Think Fast⚡, Then Think Right✅
10 个月之前
substack.com
6:18
What is Speculative Sampling? | Boosting LLM inference speed
已浏览 3808 次
2024年11月20日
YouTube
AssemblyAI
14:37
Understanding Speculative Decoding: Boosting LLM Efficienc
…
已浏览 374 次
11 个月之前
YouTube
MLWorks
0:18
Speculative Decoding for Faster LLMs
已浏览 129 次
2 个月之前
YouTube
Zaharah
8:44
How to PROPERLY Use Speculative Decoding in LM Studio to DOUBL
…
已浏览 2 次
3 周前
YouTube
AsapGuide
11:34
Generate 10 Tokens At Once - Faster LLM INFERENCE - AdaSPE
…
已浏览 464 次
4 个月之前
YouTube
Vuk Rosić
29:48
Lossless LLM inference acceleration with Speculators
已浏览 478 次
3 个月之前
YouTube
Red Hat
7:39
[LLM 原理] 高效推理 Speculative Decoding 投机探测采样
已浏览 4025 次
8 个月之前
bilibili
五道口纳什
7:40
Speculative Decoding: 3× Faster LLM Inference with Zero Quality L
…
已浏览 271 次
2 个月之前
YouTube
Tales Of Tensors
0:46
Speculative Decoding Turbocharge Your LLM Inference! #ai, #llm, #de
…
已浏览 66 次
1 个月前
YouTube
The Code Architect
22:36
MASSIVELY speed up local AI models with Speculative Decodin
…
已浏览 2万 次
1 年前
YouTube
GosuCoder
7:06
The Secret to Faster LLMs: How Speculative Decoding Works
已浏览 7 次
2 个月之前
YouTube
Zaharah
1:08:32
LLM推理加速新范式!推测解码(Speculative Decoding)最新综述
已浏览 3172 次
2024年3月2日
bilibili
NICE学术
7:00
Speculative Decoding with OpenVINO | Intel Software
已浏览 19.7万 次
7 个月之前
YouTube
Intel Software
9:39
Faster LLMs: Accelerate Inference with Speculative Decoding
已浏览 1.9万 次
9 个月之前
YouTube
IBM Technology
24:17
Fast Inference from Transformers via Speculative Decoding
已浏览 1248 次
2023年9月12日
YouTube
Arxiv Papers
37:34
Speculative Decoding Explained
已浏览 7669 次
2023年12月21日
YouTube
Trelis Research
17:56
Behind the Stack, Ep 11 - Speculative Decoding
已浏览 63 次
3 个月之前
YouTube
Doubleword
12:46
Speculative Decoding: When Two LLMs are Faster than One
已浏览 2.6万 次
2023年10月12日
YouTube
Efficient NLP
12:42
Fast Inference from Transformers via Speculative Decoding
已浏览 134 次
2024年11月5日
YouTube
AI Papers Podcast Daily
0:36
How AI Replies So Fast! ⚡ Speculative Decoding
已浏览 130 次
2 个月之前
YouTube
Mr. Doubty – Short. Smart. Techy
6:53
How Speculative Decoding Makes LLMs 2.5x Faster (The Secret to F
…
已浏览 121 次
5 个月之前
YouTube
FranksWorld of AI
13:55
3배 빨라진 LLM 추론, Speculative Decoding 완전 해부!
已浏览 291 次
4 个月之前
YouTube
딥러닝논문읽기모임
9:39
IBM 如何通过推测解码(Speculative Decoding)技术加速大型语言模型
…
已浏览 355 次
9 个月之前
bilibili
深学纪元
57:03
AI INFRA 学习 04 - Speculative Decoding 实现方案
已浏览 4023 次
8 个月之前
bilibili
Se7en的架构笔记
DFlash Boosts Speculative Decoding with Lightweight Block
…
已浏览 2 次
1 个月前
linkedin.com
19:54
Behind the Stack, Ep. 13 - Faster Inference: Speculative Decoding f
…
已浏览 78 次
3 个月之前
YouTube
Doubleword
36:12
Deep Dive: Optimizing LLM inference
已浏览 4.3万 次
2024年3月11日
YouTube
Julien Simon
观看更多视频
更多类似内容
反馈