Search

Showing top 35 results for "NVFP4"

Related topics: NVFP4

Tracked topic

NVFP4

2 articles indexed Last updated 2d ago See topic hub
developer.nvidia.com › ja-jp › blog

Nemotron 3 Super の紹介: エージェント型推論向けのオープン ハイブリッド Mamba-Transformer MoE

…これにより、パラメーターのオーバーヘッドを最小限に抑えながら、トレーニングの安定性を向上させます。ヘッドは、オフセット固有のショートカットに分裂するのではなく、一貫した継続に合意できるようになります。 同様の重み共有により、独立してトレーニングされたヘッドが通常劣化するような長いドラフト長においても、投機的ドラフトの一貫性が向上します。 ネイティブ NVFP4 事前トレーニング ほとんどの量子化モデルは、全精度で計算を開始し、トレーニング後に圧縮されるため、精度の低下は避けられないものです。 Super では別のアプローチを採用しています。事前トレーニング中の浮動小数点乗算/累積演算の大部分は NVFP4 、すなわち NVIDIA 4 ビット浮動小数点形式で実行されています。 Blackwell 向けに最適化されたこの手法は、精度を維持しながら、FP8 と比較してメモリ要件を大幅に削減しながらも、推論を高速化します。 低精度でネイティブにトレーニングを行うことは…

Mar 11, 2026 · Chris Alexiuk
developer.nvidia.com › ko-kr › blog

NVIDIA Technical Blog

NVFP4 양자화와 함께 최대 9.2배 실효 시스템 용량을 제공해요. 8 MIN READ 2026년 4월 11일 Gemma 4로 에지·온디바이스 AI 실현 — NVIDIA 전 플랫폼 완전 지원 Google Gemma 4 멀티모달·다국어 모델 패밀리가 출시됐습니다. 데이터센터의 NVIDIA Blackwell부터 에지의 Jetson까지 전 플랫폼을 지원하며, NVFP4 양자화·NIM 마이크로서비스·NeMo 파인튜닝으로 지금 바로 시작해 보세요. …