目录 前言一、多模态模型进展与探索1、GPT-4V (多模态 测试2、LLM时代文档图像处理技术趋势3、LLM时代文档图像技术机会4、MLLM时代文档图像处理技术趋势5、知名文档图像大模型OCR性能分析 二、图像安全1...
网站首页 > 多模态模型
-
人工智能 文档图像处理 中国模式识别与计算机视觉大会|多模态模型及图像安全的探索及成果
-
人工智能 计算机视觉 AIGC 多模态模型 GLEE:一个模型搞定目标检测/实例分割/定位/跟踪/交互式分割等任务!性能SOTA!
GLEE,这是一个面向目标级别的基础模型,用于定位和识别图像和视频中的目标。通过一个统一的框架,GLEE实现了对开放世界场景中任意目标的检测、分割、跟踪、定位和识别,适用于各种目标感知任务。采用了一种协同学习策略,GLEE从...
-
chatGLM 自然语言处理 多模态模型 和ChatGPT对比,文心一言的表现已经是中国之光了
网络上各种测评满天飞,这里就不展开说了,针对“chatgpt”这项技术的难点,是十分巨大的。当你对文心一言以及其他国产AI软件存在不满的时候,你可以简单对着chatgpt或者文心一言搜索! ChatGPT技术难点 通...
没有更多内容