阿里雲推出兩款大規模視覺語言模型 具中英圖文識別能力

阿里雲推出兩款大規模視覺語言模型 具中英圖文識別能力

Qwen-VL和Qwen-VL-Chat是支持中英文語言的視覺語言模型,以阿里雲之前開源的通義千問70億參數模型Qwen-7B爲基礎語言模型研發,除具備中英文圖文識別、描述和問答對話能力,更新增視覺定位和圖像文字理解能力。

在日本當老師的日子 黑暗騎士殿

通缉男躲妻子娘家3个月 外出购物刚好碰到警察

Qwen-VL及基於這一模型微調的對話模型Qwen-VL-Chat可用於知識問答、圖像標題生成、圖像問答、文件問答、細粒度視覺定位等多種場景。例如用戶可拍下醫院樓層導覽圖,問Qwen-VL Chat「外科在哪層?」、「耳鼻喉科去哪層?」,Qwen-VL會根據圖片訊息給出文字回覆。

爲進一步助力AI技術普惠,全球學術、研究及商業機構均可免費獲取上述模型的代碼、模型權重和文件。對於商業應用需求,月活躍用戶少於1億的公司可免費使用模型,用戶數超過該量級的企業可向阿里雲申請許可證。

妹妹学测满级分!拒读医学系想当「这一师」 医生世家阿公开骂

王金平辅选鱼虾论 柯志恩:努力变大虾

万界次元商店 小叮裆

柯文哲预言全台6万人居隔 本周会大乱 陈时中反讥