Technologies
Habi
Дослідницький фреймворк на основі PyTorch для прискорення diffusion planning у задачах прийняття рішень: він “habitizes” повільні дифузійні планувальники, переносячи їх у швидку політику звичної поведінки для інференсу в реальному часі. Автори демонструють частоту ухвалення дій 800+ Гц навіть на CPU ноутбука та оцінюють підхід на офлайн‑RL бенчмарках (D4RL: Mujoco, Kitchen, AntMaze тощо).