|
|
Llama 3.2全文翻译:通过开放、可定制的模型彻底改变边缘 AI 和视觉 FightingCV · 公众号 · · 1 年前 · |
|
|
如何提升多模态大模型视觉推理能力?浙大杰青团队的新型自指导方案给出答案 FightingCV · 公众号 · AI 科技媒体 · 1 年前 · |
|
|
THU鲁继文&NTU刘子纬团队联手发布 Oryx MLLM:实时应对任意分辨率的时空理解 FightingCV · 公众号 · · 1 年前 · |
|
|
SlowFast-LLaVA | Apple团队提出视频大语言模型的强大免训练基线 FightingCV · 公众号 · · 1 年前 · |
|
|
AAA24 |震撼发布!95.3% 像素级 AUC:最强异常检测模型 SOTA 现已开源! FightingCV · 公众号 · · 1 年前 · |
|
|
Google推出MaskGIT:革新图像生成的掩码式Transformer FightingCV · 公众号 · · 1 年前 · |
|
|
英伟达发布NVLM:超越GPT4o,开源先锋塑造多模态AI新时代 FightingCV · 公众号 · · 1 年前 · |
|
|
TG-LLaVA|沈春华团队提出通过可学习的潜在嵌入进行文本引导的 LLaVA FightingCV · 公众号 · · 1 年前 · |
|
|
CVPR2025投稿规定再次更新 FightingCV · 公众号 · · 1 年前 · |
|
|
ECCV2024 | 一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP FightingCV · 公众号 · · 1 年前 · |
|
|
召唤100多位学者打分,斯坦福新研究:「AI科学家」创新确实强 FightingCV · 公众号 · · 1 年前 · |
|
|
SpaceX再创历史,人类首次商业太空行走成就达成! FightingCV · 公众号 · · 1 年前 · |
|
|
AI 之王 GPT-6 猎户座 来了!大模型杀疯了 FightingCV · 公众号 · · 1 年前 · |
|
|
mPLUG-DocOwl2: OCR-free多页文档理解新SOTA,单页视觉token仅324! FightingCV · 公众号 · · 1 年前 · |
|
|
MIT提出了全新AI架构,霸榜各大检测、分割、跟踪、大模型榜单! FightingCV · 公众号 · · 1 年前 · |
|
|
离谱,深圳某公司重新定义8小时工作制! FightingCV · 公众号 · · 1 年前 · |
|
|
RepControlNet:一种新的扩散模型推理加速技术 ! FightingCV · 公众号 · · 1 年前 · |
|
|
斯坦福利用视觉表示法则优化多模态语言模型,计算成本降低 99.7% ! FightingCV · 公众号 · · 1 年前 · |
|
|
高校大厂首次用LLM解决时序传统问题 FightingCV · 公众号 · · 1 年前 · |
|
|
MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路 FightingCV · 公众号 · 科技创业 科技自媒体 · 1 年前 · |