|
字节跳动提出Mogao模型:开启 AIGC 从“能写会画”到“边写边画” 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
Aero-1-Audio: LMMs-Lab发布1.5B音频语言模型,长音频转录直出,性能优异! 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
UniToken:为统一多模态理解与生成打造信息完备的视觉表征 我爱计算机视觉 · 公众号 · · 3 月前 · |