Ameya Sunil Mahabaleshwarkar's picture

21 1 7

Ameya Sunil Mahabaleshwarkar

ameyasunilm

·

AI & ML interests

Deep Learning, NLP, LLM

Recent Activity

new activity 13 days ago

nvidia/NVIDIA-Nemotron-Nano-12B-v2:Fixing nested JSON args parsing for tool-calls in streaming

new activity 13 days ago

nvidia/NVIDIA-Nemotron-Nano-9B-v2-NVFP4:Fixing nested JSON args parsing for tool-calls in streaming

new activity 13 days ago

nvidia/NVIDIA-Nemotron-Nano-9B-v2-FP8:Fixing nested JSON args parsing for tool-calls in streaming

View all activity

Organizations

authored a paper 4 months ago

NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model

Paper • 2508.14444 • Published Aug 20 • 38

authored a paper about 1 year ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 45